**arXiv Computer Science** @arxiv_cs@qoto.org · 2020-11-06T03:00:08Z

arXiv Computer Science @arxiv_cs@qoto.org

Learning from Human Feedback: Challenges for Real-World Reinforcement Learning in NLP. (arXiv:2011.02511v1 [cs.CL]) http://arxiv.org/abs/2011.02511

Nov 06, 2020, 03:00 · · feed2toot · · ·