Qu’est-ce que « le dernier examen de l’humanité » ?
Listen now
Description
Les intelligences artificielles (IA) repoussent de plus en plus les limites en surpassant les humains lors de divers tests, qu'il s'agisse d'examens académiques ou d'évaluations spécifiques à la performance des machines. Avec l’arrivée du modèle de langage o1 d’OpenAI, capable de raisonnements complexes, cette tendance s'accélère. Pour relever ce défi, la start-up Scale AI s'est associée au Center for AI Safety afin de concevoir un test inédit, baptisé « Humanity's Last Exam » – le dernier examen de l’humanité. Ce projet ambitieux vise à évaluer si l'IA peut rivaliser avec des experts humains. Il se compose de 1 000 questions pointues dans des domaines variés, difficiles pour des non-spécialistes, et dont les réponses ne sont pas facilement accessibles en ligne. Le but ? Tester la véritable capacité de raisonnement de l’IA, au-delà de simples recherches d’informations. Pour créer ces questions, l'initiative fait appel au public. Toute personne ayant au moins cinq ans d’expérience dans un domaine technique ou possédant un doctorat est invitée à soumettre des questions. Celles-ci doivent être acceptées par les experts du domaine concerné, être factuelles et ne comporter ni piège ni ambiguïté. Afin d’éviter que l'IA ne mémorise simplement les réponses, une partie des questions restera confidentielle. Les contributions peuvent être soumises via un formulaire en ligne jusqu’au 1er novembre. Les auteurs des 50 meilleures questions recevront une récompense de 5 000 dollars, tandis que ceux des 500 questions suivantes seront gratifiés de 500 dollars. Ce test ultime pourrait bien être un indicateur décisif du moment où l’IA égalera – voire surpassera – les capacités humaines. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
More Episodes
C’est une simple rumeur lancée sur Reddit qui s’est avérée être bien réelle. En janvier, un internaute anonyme révélait, documents judiciaires à l'appui, que plusieurs pays, dont l'Allemagne, les États-Unis, le Brésil et la Grande-Bretagne, avaient coordonné une opération de surveillance sur le...
Published 09/26/24
Le patron de Telegram, Pavel Durov, semble avoir opéré un tournant radical depuis qu'il est sous la supervision de la justice française et interdit de quitter le territoire. Connu pour sa résistance aux autorités, il coopère désormais pleinement avec les demandes légales. Ce changement de cap a...
Published 09/25/24
Published 09/25/24