**arXiv Computer Science** @arxiv_cs@qoto.org · 2026-01-28T03:00:05Z

arXiv Computer Science @arxiv_cs@qoto.org

Evaluating Reward Model Generalization via Pairwise Maximum Discrepancy Competitions https://arxiv.org/abs/2601.16987 #cs.CL #cs.AI

Jan 28, 2026, 03:00 · · feed2toot · · ·