Message de Gate News, 29 avril — Les chercheurs d’OpenAI Sébastien Bubeck et Ernest Ryu affirment que les systèmes d’IA pourraient accomplir la plupart des travaux de recherche réalisés par des humains dans les deux prochaines années, en présentant les mathématiques comme une mesure claire des progrès de l’IA. Contrairement aux tests de performance vagues, les problèmes mathématiques offrent une vérification précise : les réponses sont soit correctes, soit incorrectes, sans place pour l’ambiguïté.

Bubeck a noté que la vraie « pensée » de l’IA exige de survivre à de longues chaînes de raisonnement. Une seule erreur dans un argument en plusieurs étapes fait s’effondrer toute la démonstration, ce qui rend la détection et la correction des erreurs au cours du processus l’objectif ultime pour les modèles avancés. Les laboratoires internes d’OpenAI ont déjà généré plus de dix tout nouveaux théorèmes, publiables dans des revues de pointe de combinatoire, démontrant que l’IA produit désormais un travail réellement original et novateur, au-delà du simple fait de recombiner des articles existants.

Cependant, des percées scientifiques durables exigent une attention constante sur des semaines de tests. Les systèmes actuels nécessitent encore une supervision humaine stricte pour guider et vérifier chaque changement de direction. Bubeck utilise le « temps d’AGI » pour mesurer la durée pendant laquelle un modèle peut imiter de manière autonome la pensée humaine ; les systèmes actuels fonctionnent à peu près de quelques jours à une semaine, l’objectif de l’industrie étant des semaines ou des mois pour permettre un travail autonome dans des domaines comme la biologie.

La mémoire à long terme est essentielle pour ce futur. Les fenêtres de discussion standard limitent la profondeur — des preuves mathématiques complexes dépassent souvent 50 pages — tandis que les dépôts de code montrent comment des sessions de travail prolongées permettent un traitement de problèmes plus approfondi. À mesure que l’IA gagne en indépendance et en mémoire, l’expertise humaine devient plus précieuse, pas moins. Les travailleurs doivent conserver les connaissances fondamentales approfondies pour contester et vérifier les réponses de la machine, et les organisations devront mettre en place de nouveaux filtres automatisés et systèmes de réputation pour maintenir la confiance face à un flot de recherches assistées par l’IA.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Claude／GPT trop complaisant ? Une invite Claude.md incite l’IA à donner des réponses fermes et précises

Actualités de l’industrie de l’IA

Cet article présente une suite de consignes pouvant être intégrée à Claude.md / Agents.md, afin de transformer l’IA, de simple assistante courtoise en conseillère directe, au moyen de quatre niveaux d’ajustement : définition du rôle, vérification des faits, libération du ton, et dispense de la correction politique. Il exige une réponse complète, une validation progressive et la certitude de ne jamais inventer. Le texte indique aussi, si nécessaire, de provoquer ou de défier. Il décrit en outre le moment de chargement, les risques et les cas d’usage (recherche, rédaction, décisions techniques, discussion académique), ainsi que le fait que ce format ne convient pas au service client, à l’éducation et aux conseils médicaux. La source originale du texte est ABMedia.

ChainNewsAbmediaIl y a 12m

OpenAI présente ChatGPT Futures : 26 étudiants de la première promotion reçoivent une subvention de 10 000 dollars, dans plus de 20 universités

Actualités de l’industrie de l’IA

OpenAI publie la première cohorte de ChatGPT Futures Class of 2026 : 26 étudiants en cursus, issus de plus de 20 universités de premier plan, recevront chacun une subvention de 10 000 dollars et un accès aux modèles les plus avancés. Ces étudiants ont commencé leurs études à l’automne 2022 et ont grandi avec ChatGPT. Leurs axes de recherche couvrent la cartographie d’objets spatiaux, la détection de survivants de catastrophes, la préservation de langues en danger, la santé et les soins, entre autres. L’objectif est de répondre à des besoins humains concrets grâce à l’IA, tout en s’appuyant sur des bases d’infrastructures pour les créateurs de la nouvelle génération.

ChainNewsAbmediaIl y a 13m

FLock.io Facilite la collaboration de recherche entre le Sarawak AI Center et l’Université de Cambridge cette semaine

Actualités de l’industrie de l’IA

D’après Foresight News, FLock.io a facilité cette semaine une nouvelle collaboration de recherche entre le Sarawak Artificial Intelligence Research Centre (SAIC) de Malaisie et l’Université de Cambridge. Ce partenariat étendra la coopération des infrastructures techniques à la recherche économique, à la conception de politiques et

GateNewsIl y a 25m

Apple règle un recours collectif de consommateurs de 250 millions de dollars, avec une indemnisation maximale de 95 dollars par personne

Actualités de l’industrie de l’IA

Apple accepte de transiger avec les accusations d’annonces publicitaires trompeuses liées à l’IA pour un montant de 250 millions de dollars. Si le tribunal approuve l’accord, les consommateurs américains ayant acheté un iPhone iPhone donné aux États-Unis au cours de la période concernée pourront recevoir jusqu’à 95 dollars de dédommagement par appareil, couvrant les iPhone 16, 16 Plus, 16 Pro, 16 Pro Max ainsi que les iPhone 15 Pro/Pro Max. Les demandeurs affirment que la publicité a présenté Siri comme une percée en matière d’IA, alors que les fonctionnalités réelles n’ont pas répondu aux promesses ; Apple affirme que les fonctions sont déployées par étapes, qu’elle a déjà livré plusieurs fonctionnalités, et que ce n’est pas une déclaration inexacte.

ChainNewsAbmediaIl y a 33m

Le vice-président de la recherche d’OpenAI critique la position perçue d’Anthropic selon laquelle seuls eux peuvent construire l’IA

Actualités de l’industrie de l’IA

Selon Aidan Clark, vice-président de la recherche d’OpenAI pour l’entraînement, sur la plateforme X récemment, il a exprimé des critiques de ce qu’il a entendu auprès de collègues d’Anthropic : une conviction selon laquelle seul Anthropic serait en droit d’être digne de confiance pour construire de l’IA. Clark a fait valoir que le fait d’avoir plusieurs organisations

GateNewsIl y a 33m

FIS et Anthropic développent des agents d’IA pour lutter contre le blanchiment d’argent, avec un déploiement prévu pour BMO et Amalgamated Bank au second semestre 2026

Agent IA Actualités de l’industrie de l’IA

FIS et Anthropic développent des agents d’IA conçus pour automatiser les enquêtes sur la criminalité financière, en commençant par les opérations de lutte contre le blanchiment d’argent. L’agent d’IA pour les crimes financiers extraira des données des systèmes bancaires, évaluera les transactions par rapport à des typologies connues et aidera les enquêteurs à examiner al

GateNewsIl y a 54m

Commentaire

0/400

Aucun commentaire