arXiv - CSCL: "Improving Large Language Models via Fine-grained …" - Qoto Mastodon

arXiv - CSCL @arxiv_cscl@qoto.org

Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint. (arXiv:2401.06081v1 [cs.CL])

http://arxiv.org/abs/2401.06081 #arXiv #NLProc

Jan 13, 2024, 03:19 · · arxiv-cscl · · ·

Sign in to participate in the conversation