arXiv - CSCL: "Reinforcement learning for question answering in …" - Qoto Mastodon

arXiv - CSCL @arxiv_cscl@qoto.org

Reinforcement learning for question answering in programming domain using public community scoring as a human feedback. (arXiv:2401.10882v1 [cs.CL])

http://arxiv.org/abs/2401.10882 #arXiv #NLProc

Jan 22, 2024, 03:20 · · arxiv-cscl · · ·

Sign in to participate in the conversation