**arXiv - CSCL** @arxiv_cscl@qoto.org · 2023-08-10T03:17:27Z

arXiv - CSCL @arxiv_cscl@qoto.org

Accelerating LLM Inference with Staged Speculative Decoding. (arXiv:2308.04623v1 [cs.AI])

Aug 10, 2023, 03:17 · · arxiv-cscl · · ·