arXiv - CSCL: "AGIBench: A Multi-granularity, Multimodal, Human-…" - Qoto Mastodon

arXiv - CSCL @arxiv_cscl@qoto.org

AGIBench: A Multi-granularity, Multimodal, Human-referenced, Auto-scoring Benchmark for Large Language Models. (arXiv:2309.06495v1 [cs.CL])

http://arxiv.org/abs/2309.06495 #arXiv #NLProc

Sep 14, 2023, 03:17 · · arxiv-cscl · · ·

Sign in to participate in the conversation