Claude 3.7 Sonnet d'Anthropic vise OpenAI et DeepSeek dans la prochaine grande bataille de l'IA

Inscrivez-vous à nos newsletters quotidiennes et hebdomadaires pour recevoir les dernières mises à jour et du contenu exclusif sur la couverture de l'IA de pointe. En savoir plus
Anthropic vient de lancer un avertissement à OpenAI , DeepSeek et à l'ensemble du secteur de l'IA avec le lancement de Claude 3.7 Sonnet , un modèle qui donne aux utilisateurs un contrôle sans précédent sur le temps qu'une IA passe à « réfléchir » avant de générer une réponse. Cette sortie, ainsi que le lancement de Claude Code , un agent de codage d'IA en ligne de commande, signalent l'avancée agressive d'Anthropic sur le marché de l'IA d'entreprise, un marché qui pourrait remodeler la façon dont les entreprises créent des logiciels et automatisent le travail.
Les enjeux ne pourraient pas être plus élevés. Le mois dernier, DeepSeek a stupéfié le monde de la technologie avec un modèle d'IA qui correspondait aux systèmes américains pour une fraction du coût , faisant chuter l'action de Nvidia de 17 % et suscitant des inquiétudes quant au leadership américain en matière d'IA. Anthropic parie désormais que le contrôle précis du raisonnement de l'IA - et pas seulement la vitesse brute ou les économies de coûts - lui donnera un avantage.

« Nous pensons simplement que le raisonnement est un élément essentiel et un composant essentiel d’une IA, plutôt qu’un élément distinct auquel il faut payer séparément pour accéder », a déclaré Dianne Penn, qui dirige la gestion des produits pour la recherche chez Anthropic, dans une interview avec VentureBeat. « Tout comme les humains, l’IA doit gérer à la fois des réponses rapides et une réflexion complexe. Pour une question simple comme « quelle heure est-il ? », elle doit répondre instantanément. Mais pour des tâches complexes – comme planifier un voyage de deux semaines en Italie tout en tenant compte des besoins alimentaires sans gluten – elle a besoin d’un temps de traitement plus long. »
« Nous ne considérons pas le raisonnement, la planification et l’autocorrection comme des capacités distinctes », a-t-elle ajouté. « C’est donc essentiellement notre façon d’exprimer cette différence philosophique… Idéalement, le modèle lui-même devrait reconnaître lorsqu’un problème nécessite une réflexion plus intensive et s’adapter, plutôt que de demander aux utilisateurs de sélectionner explicitement différents modes de raisonnement. »

Les données de référence confirment la vision ambitieuse d'Anthropic. En mode de réflexion étendue, Claude 3.7 Sonnet atteint une précision de 78,2 % sur les tâches de raisonnement de niveau universitaire, défiant ainsi les derniers modèles d'OpenAI et surpassant DeepSeek R1.
Mais les mesures les plus révélatrices proviennent d'applications concrètes : le modèle obtient un score de 81,2 % sur l'utilisation des outils axés sur la vente au détail et montre des améliorations marquées dans le suivi des instructions (93,2 %) - des domaines dans lesquels les concurrents ont eu des difficultés ou n'ont pas publié de résultats.
Alors que DeepSeek et OpenAI sont leaders dans les tests de performances mathématiques traditionnels , l'approche unifiée de Claude 3.7 démontre qu'un modèle unique peut basculer efficacement entre des réponses rapides et une analyse approfondie, éliminant potentiellement le besoin pour les entreprises de maintenir des systèmes d'IA distincts pour différents types de tâches.
Le timing de la publication est crucial. L’émergence de DeepSeek le mois dernier a provoqué une onde de choc dans la Silicon Valley, prouvant qu’il était possible de réaliser un raisonnement d’IA sophistiqué avec bien moins de puissance de calcul qu’on ne le pensait auparavant. Cela a remis en cause les hypothèses fondamentales sur les coûts de développement de l’IA et les besoins en infrastructures. Lorsque DeepSeek a publié ses résultats, l’action de Nvidia a chuté de 17 % en une seule journée, les investisseurs se demandant soudain si des puces coûteuses étaient vraiment essentielles pour une IA avancée.
Pour les entreprises, les enjeux ne pourraient pas être plus élevés. Les entreprises dépensent des millions pour intégrer l'IA dans leurs opérations, en pariant sur l'approche qui dominera. Le modèle hybride d'Anthropic offre une voie intermédiaire convaincante : la possibilité d'affiner les performances de l'IA en fonction de la tâche à accomplir, des réponses instantanées du service client à l'analyse financière complexe. Le système conserve les prix précédents d'Anthropic de 3 $ par million de jetons d'entrée et de 15 $ par million de jetons de sortie, même avec des fonctionnalités de raisonnement supplémentaires.

« Nos clients cherchent à obtenir des résultats pour leurs clients », explique Michael Gerstenhaber, responsable de la plateforme Anthropic. « Utiliser le même modèle et l’appliquer de différentes manières permet à des sociétés comme Thompson Reuters de faire des recherches juridiques, et à nos partenaires de codage comme Cursor ou GitHub de développer des applications et d’atteindre ces objectifs. »
L'approche hybride d'Anthropic représente à la fois une évolution technique et un pari stratégique. Alors qu'OpenAI maintient des modèles distincts pour différentes capacités et que DeepSeek se concentre sur la rentabilité , Anthropic recherche des systèmes unifiés capables de gérer à la fois les tâches de routine et le raisonnement complexe. C'est une philosophie qui pourrait remodeler la façon dont les entreprises déploient l'IA, en éliminant la nécessité de jongler avec plusieurs modèles spécialisés.
Anthropic a également dévoilé aujourd'hui Claude Code , un outil en ligne de commande qui permet aux développeurs de déléguer des tâches d'ingénierie complexes directement à l'IA. Le système nécessite l'approbation humaine avant de valider les modifications de code, ce qui reflète l'intérêt croissant du secteur pour un développement responsable de l'IA.

« En fait, vous devez toujours accepter les changements apportés par Claude. Vous êtes un examinateur qui a les mains sur le volant », a noté Penn. « Il existe en fait une sorte de liste de contrôle que vous devez accepter pour que le modèle prenne certaines mesures. »
Ces annonces interviennent dans un contexte de concurrence intense dans le développement de l'IA. Des chercheurs de Stanford ont récemment créé un modèle de raisonnement open source pour moins de 50 dollars, tandis que Microsoft vient d'intégrer le modèle o3-mini d'OpenAI dans Azure. Le succès de DeepSeek a également stimulé de nouvelles approches du développement de l'IA, certaines entreprises explorant des techniques de distillation de modèles qui pourraient encore réduire les coûts.

Penn a illustré les progrès spectaculaires réalisés dans le domaine de l'IA avec un exemple inattendu : « Nous avons demandé à différentes versions de Claude de jouer à Pokémon… Cette version a réussi à atteindre Vermilion City , a capturé plusieurs Pokémon et a même progressé pour monter de niveau. Elle possède les Pokémon adéquats pour affronter ses rivaux. »
« Je pense que nous continuerons à innover et à faire progresser la qualité du raisonnement, à nous orienter vers des choses comme le raisonnement dynamique », a expliqué Penn. « Nous l’avons toujours considéré comme un élément essentiel de l’intelligence, plutôt que comme quelque chose de distinct. »
Le véritable test de l’approche d’Anthropic viendra de l’adoption par les entreprises. Si jouer à Pokémon peut sembler trivial, cela démontre le type d’intelligence adaptative dont les entreprises ont besoin : une IA capable de gérer à la fois les opérations de routine et les décisions stratégiques complexes sans passer d’un modèle spécialisé à un autre. Les versions précédentes de Claude ne pouvaient pas naviguer au-delà de la ville de départ d’un jeu. La dernière version élabore des stratégies, gère les ressources et prend des décisions tactiques – des capacités qui reflètent la complexité des défis commerciaux du monde réel.
Pour les entreprises clientes, cela pourrait faire la différence entre la maintenance de plusieurs systèmes d'IA pour différentes tâches et le déploiement d'une solution unique et plus performante. Les prochains mois révéleront si le pari d'Anthropic sur le raisonnement unifié de l'IA va remodeler le marché des entreprises ou devenir une nouvelle expérience dans l'évolution rapide du secteur.
Si vous souhaitez impressionner votre patron, VB Daily a tout ce qu'il vous faut. Nous vous donnons un aperçu de ce que font les entreprises avec l'IA générative, des changements réglementaires aux déploiements pratiques, afin que vous puissiez partager vos idées pour un retour sur investissement maximal.
Lisez notre politique de confidentialité
Merci de vous être abonné. Découvrez d'autres newsletters VB ici .
Une erreur s'est produite.

venturebeat