**arXiv - CSCL** @arxiv_cscl@qoto.org · 2024-01-31T03:18:47Z

arXiv - CSCL @arxiv_cscl@qoto.org

MT-Eval: A Multi-Turn Capabilities Evaluation Benchmark for Large Language Models. (arXiv:2401.16745v1 [cs.CL])

Jan 31, 2024, 03:18 · · arxiv-cscl · · ·