Manuel Rioux


Scaling laws for reward model overoptimization

19 octobre 2022

Intelligence artificielle, Open AI

Post Content

PrécédentPrécédentStopping malaria in its tracks
SuivantThe pursuit of AI education—past, present, and futureSuivant

Manuel Rioux est fièrement propulsé par WordPress