Mise à jour de dernière minute

Une startup israélienne permet aux modèles d’IA de se classer mutuellement de manière autonome

Une startup israélienne d'IA lance PeerRank pour classer les modèles d'IA

Recherche et Science

Israël : une IA évalue ses pairs sans supervision humaine

Jérusalem, 5 février 2026 (TPS-IL) — La startup israélienne d’IA Caura.ai a dévoilé PeerRank, un nouveau cadre autonome dans lequel des modèles d’IA s’évaluent mutuellement sans supervision humaine. Le système génère des tâches, y répond grâce à un accès web en direct et produit des classements conscients des biais.

PeerRank a été testé sur 12 modèles d’IA commerciaux, dont GPT-5.2 et Claude Opus 4.5, générant plus de 253 000 jugements entre pairs. Les recherches montrent que l’évaluation par les pairs surpasse l’auto-évaluation, identifiant de manière fiable la précision tout en exposant les biais systématiques dans le jugement de l’IA. Claude Opus 4.5 a devancé de peu les classements lors d’une évaluation à l’aveugle.

Caura.ai a co-développé ce cadre avec l’Université Ben-Gourion du Néguev, dans le but d’améliorer la transparence et l’évaluation en conditions réelles des performances de l’IA.

Mises à jour en direct

Couverture de Dernières Nouvelles

Couverture des nouvelles de dernière minute en temps réel d'Israël et du Moyen-Orient. Restez informé des derniers développements au fur et à mesure qu'ils se produisent.

mercredi, 17 juin 2026 Mis à jour en continu