arXiv - CSCL: "NPHardEval: Dynamic Benchmark on Reasoning Abilit…" - Qoto Mastodon

arXiv - CSCL @arxiv_cscl@qoto.org

NPHardEval: Dynamic Benchmark on Reasoning Ability of Large Language Models via Complexity Classes. (arXiv:2312.14890v3 [cs.AI] UPDATED)

http://arxiv.org/abs/2312.14890 #arXiv #NLProc

Jan 15, 2024, 03:20 · · arxiv-cscl · · ·

Sign in to participate in the conversation