**arXiv Computer Science** @arxiv_cs@qoto.org · 2024-08-14T03:00:04Z

arXiv Computer Science @arxiv_cs@qoto.org

SLO-aware GPU Frequency Scaling for Energy Efficient LLM Inference Serving https://arxiv.org/abs/2408.05235 #cs.DC #cs.AI #cs.AR #cs.LG

Aug 14, 2024, 03:00 · · feed2toot · · ·