Message de Gate News, 20 avril — Les principaux modèles d’IA excellent à résoudre des problèmes complexes comme les mathématiques de type Olympiade, mais peinent avec le travail d’entreprise de routine, selon David Meyer de Databricks. Certains modèles peuvent corriger un numéro de facture incorrect au lieu de le signaler comme une erreur, tandis que des outils de programmation comme Claude peuvent aussi être en dessous des attentes sur des tâches de data engineering.
L’écart s’explique par des différences fondamentales entre les données d’entreprise et le texte du web public utilisé pour entraîner les grands modèles. Les données d’entreprise présentent souvent des libellés de colonnes vagues, de nombreux champs vides et des codes stockés sous forme de texte brut. Dans une étude universitaire, le score F1 d’un modèle d’IA, qui équilibre précision et rappel, est passé de 0.94 sur des données publiques à 0.07 sur des données d’entreprise pour une tâche de data engineering. En outre, les grands modèles ont tendance à revenir par défaut à des schémas familiers issus de l’entraînement ; certains ont conservé (Structured Query Language )SQL par défaut même après avoir reçu des instructions et une documentation pour le langage de requêtes propriétaire d’une entreprise.
Des modèles open source plus petits, ajustés avec l’apprentissage par renforcement, peuvent traiter des tâches spécifiques de manière plus efficace à des coûts d’entraînement nettement inférieurs à ceux des grands modèles généralistes. Databricks construit des agents d’IA plus petits pour des flux de travail spécifiques, comme KARL, qui utilise l’apprentissage par renforcement pour un raisonnement en plusieurs étapes à partir de documents de l’entreprise. L’industrie s’oriente du recours à des modèles géants vers des architectures hybrides où des modèles petits et efficaces gèrent le volume de routine, puis n’escaladent que les cas ambigus ou complexes vers des systèmes plus grands et plus coûteux.
Databricks a récemment acquis Quotient AI pour aider les grandes entreprises à exécuter des agents d’IA de manière plus fiable. La concurrence dans le secteur de l’IA se concentre désormais sur l’exécution de l’ensemble du cycle de vie de l’IA, y compris des systèmes de feedback pour le suivi des erreurs et l’amélioration continue des modèles au fil du temps, ce qui rend les outils d’évaluation et de réglage de plus en plus précieux après le déploiement.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
FIS et Anthropic développent des agents d’IA pour lutter contre le blanchiment d’argent, avec un déploiement prévu pour BMO et Amalgamated Bank au second semestre 2026
FIS et Anthropic développent des agents d’IA conçus pour automatiser les enquêtes sur la criminalité financière, en commençant par les opérations de lutte contre le blanchiment d’argent. L’agent d’IA pour les crimes financiers extraira des données des systèmes bancaires, évaluera les transactions par rapport à des typologies connues et aidera les enquêteurs à examiner al
GateNewsIl y a 12m
Prime Intellect Lab lance la disponibilité générale le 7 mai et termine plus de 10 000 sessions d’entraînement en version bêta
Selon Prime Intellect, la plateforme Lab de l’entreprise est sortie de la version bêta le 7 mai 2026, passant à la disponibilité générale en tant qu’environnement de formation de bout en bout pour des agents d’IA capables de s’améliorer. Le pipeline unifié consolide les flux de travail d’amélioration des modèles, permettant aux utilisateurs de définir des tâches, de configurer
GateNewsIl y a 43m
Cloudflare déclenche 1 milliard de réponses HTTP 402 par jour à Consensus 2026, et lance le cadre de confiance des agents avec Visa et Experian
Selon Foresight News, la directrice de la technologie chez Cloudflare, Stephanie Cohen, a annoncé lors de Consensus 2026 que la plateforme déclenche environ 1 milliard de réponses HTTP 402 par jour, reflétant la demande des agents IA pour un accès payant au contenu web. La société, aux côtés de Visa et d’Experian, a dévoilé la technologie Agent Trust
GateNewsIl y a 3h
Reid Hoffman : les agents d’IA auront besoin de systèmes de confiance crypto
Reid Hoffman, associé chez Greylock et cofondateur de LinkedIn, a déclaré que les agents autonomes auront besoin de systèmes de confiance basés sur la crypto pour effectuer des transactions à travers le réseau ouvert, suggérant que ce développement pourrait permettre un retour en force des NFT.
La déclaration de Hoffman relie l’émergence des agents autonomes à la
CryptoFrontierIl y a 4h
B.AI dépasse 1,7 million d’utilisateurs le 7 mai et lance un programme de récompenses
D'après B.AI, la plateforme d'infrastructure d'IA a dépassé 1,7 million d'utilisateurs le 7 mai. La plateforme, qui se concentre sur la protection de la vie privée et l'infrastructure de l'économie des agents, offre aux nouveaux utilisateurs 500 000 crédits gratuits lors de l'inscription, une tarification sans majoration sur tous les modèles, et une offre limitée dans le temps de 1:1
GateNewsIl y a 5h
a16z lance un fonds crypto de 2,2 milliards de dollars (cinquième édition), en tant que principal investisseur dans trois nouvelles startups d’IA
Selon l’annonce d’a16z (Andreessen Horowitz) du 5 mai, la société de capital-risque a officiellement lancé le cinquième fonds dédié aux crypto-monnaies « Crypto Fund 5 », avec une levée de fonds de 2,2 milliards de dollars. Dans le même temps, a16z a annoncé avoir mené le financement des entreprises d’intégration d’IA Tessera Labs, de la plateforme de recrutement en IA Ethos et de la plateforme de création d’IA Glif.
MarketWhisperIl y a 5h