Une startup israélienne permet aux modèles d’IA de se classer mutuellement de manière autonome
Une startup israélienne d'IA lance PeerRank pour classer les modèles d'IA
Israël : une IA évalue ses pairs sans supervision humaine
Jérusalem, 5 février 2026 (TPS-IL) — La startup israélienne d’IA Caura.ai a dévoilé PeerRank, un nouveau cadre autonome dans lequel des modèles d’IA s’évaluent mutuellement sans supervision humaine. Le système génère des tâches, y répond grâce à un accès web en direct et produit des classements conscients des biais.
PeerRank a été testé sur 12 modèles d’IA commerciaux, dont GPT-5.2 et Claude Opus 4.5, générant plus de 253 000 jugements entre pairs. Les recherches montrent que l’évaluation par les pairs surpasse l’auto-évaluation, identifiant de manière fiable la précision tout en exposant les biais systématiques dans le jugement de l’IA. Claude Opus 4.5 a devancé de peu les classements lors d’une évaluation à l’aveugle.
Caura.ai a co-développé ce cadre avec l’Université Ben-Gourion du Néguev, dans le but d’améliorer la transparence et l’évaluation en conditions réelles des performances de l’IA.