Manuel Rioux
FACTS Benchmark Suite: Systematically evaluating the factuality of large language models
9 décembre 2025
DeepMind
,
Intelligence artificielle
Systematically evaluating the factuality of large language models with the FACTS Benchmark Suite.
Précédent
Précédent
MIT affiliates named 2025 Schmidt Sciences AI2050 Fellows
Suivant
2025 at Google
Suivant