Anthropic lance la stratégie Advisor : Opus en tant que conseiller, associé à Sonnet pour exécuter, avec une amélioration des performances et une réduction des coûts de 12 %

Anthropic a annoncé le 9 avril l’introduction officielle de la « stratégie Advisor » dans la plateforme Claude. Les développeurs peuvent désormais, via l’API Messages, faire jouer à Opus le rôle de conseiller, avec Sonnet ou Haiku comme exécutants, afin d’obtenir, dans une seule requête API, des performances cognitives proches de celles d’Opus tout en réduisant fortement les coûts. Cette fonctionnalité est actuellement disponible sous forme de version d’essai publique.

Mécanisme : l’exécutant consulte automatiquement Opus lorsqu’il fait face à un problème difficile

Le concept central de la stratégie Advisor consiste à séparer le raisonnement de l’exécution. Après avoir ajouté l’outil advisor dans l’appel de l’API Messages, lorsque l’agent Sonnet ou Haiku rencontre une décision difficile au cours de l’exécution d’une tâche, il consulte automatiquement Opus. Une fois les recommandations de planification obtenues, l’exécution se poursuit. L’ensemble du processus est réalisé dans une seule requête API, sans nécessiter d’orchestration supplémentaire par le développeur.

Cette architecture ressemble à la répartition des rôles entre un conseiller senior et des personnes chargées de l’exécution au sein d’une équipe : Opus se charge des décisions stratégiques de haut niveau, Sonnet ou Haiku de la mise en œuvre concrète, et les deux collaborent dans le même flux de travail.

Tests en conditions réelles : amélioration des performances et coûts plus bas

D’après les données d’évaluation publiées par Anthropic, lors du test de référence SWE-bench Multilingual, la performance de Sonnet combiné à l’advisor Opus est supérieure de 2,7 points de pourcentage à celle de l’utilisation seule de Sonnet, tandis que le coût par tâche baisse en revanche de 11,9 %.

La baisse des coûts s’explique par le fait que, dans la majorité des tâches, elles sont encore traitées par Sonnet ou Haiku, plus abordables. Opus n’est appelé qu’aux points de décision critiques, évitant ainsi les frais élevés d’un usage d’Opus sur toute la durée.

Ce que cela signifie pour les développeurs

La stratégie Advisor offre aux développeurs d’agents IA une nouvelle option dans l’arbitrage coût-efficacité. Auparavant, les développeurs devaient choisir entre « utiliser Opus sur toute la durée mais à coût élevé » ou « utiliser Sonnet sur toute la durée, mais risquer des erreurs sur des problèmes complexes ». Désormais, il est possible d’obtenir les avantages des deux approches grâce à une architecture hybride.

La communauté a réagi avec enthousiasme : certains développeurs l’ont comparée à une bouée de sauvetage « appeler pour demander de l’aide » dans une émission pour millionnaires — l’exécutant travaille de manière autonome la plupart du temps, puis ne demande l’aide d’un expert que lorsqu’il se trouve face à de vrais problèmes difficiles.

Cet article, intitulé « Anthropic lance la stratégie Advisor : Opus en tant que conseiller, associé à Sonnet pour l’exécution — amélioration des performances et baisse des coûts de 12 % », apparaît pour la première fois sur Chaîne News ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire