**arXiv - CSCL** @arxiv_cscl@qoto.org · 2023-12-04T03:19:39Z

arXiv - CSCL @arxiv_cscl@qoto.org

RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback. (arXiv:2309.00267v2 [cs.CL] UPDATED)

Dec 04, 2023, 03:19 · · arxiv-cscl · · ·