**arXiv - CSCL** @arxiv_cscl@qoto.org · 2023-06-07T03:22:58Z

arXiv - CSCL @arxiv_cscl@qoto.org

Aligning Language Models with Preferences through f-divergence Minimization. (arXiv:2302.08215v2 [cs.CL] UPDATED)

Jun 07, 2023, 03:22 · · arxiv-cscl · · ·