Anthropics Claude 3.7 Sonnet nimmt OpenAI und DeepSeek ins Visier im nächsten großen Kampf der KI

Abonnieren Sie unsere täglichen und wöchentlichen Newsletter, um die neuesten Updates und exklusiven Inhalte zur branchenführenden KI-Berichterstattung zu erhalten. Mehr erfahren
Anthropic hat gerade mit der Einführung von Claude 3.7 Sonnet einen Warnschuss an OpenAI , DeepSeek und die gesamte KI-Branche abgefeuert. Dabei handelt es sich um ein Modell, das den Benutzern beispiellose Kontrolle darüber gibt, wie viel Zeit eine KI mit „ Denken “ verbringt, bevor sie eine Antwort generiert. Die Veröffentlichung, zusammen mit dem Debüt von Claude Code , einem Befehlszeilen-KI-Codierungsagenten, signalisiert Anthropics aggressiven Vorstoß in den Markt für Unternehmens-KI – ein Markt, der die Art und Weise, wie Unternehmen Software entwickeln und Arbeit automatisieren, verändern könnte.
Der Einsatz könnte nicht höher sein. Letzten Monat überraschte DeepSeek die Tech-Welt mit einem KI-Modell, das zu einem Bruchteil der Kosten mit US-Systemen mithalten konnte. Nvidias Aktienkurs fiel daraufhin um 17 % und löste Alarm aus, was die Führungsrolle Amerikas im KI-Bereich angeht. Jetzt setzt Anthropic darauf, dass ihm die präzise Kontrolle über das KI-Denken – und nicht nur die reine Geschwindigkeit oder Kosteneinsparungen – einen Vorteil verschaffen wird.

„Wir glauben einfach, dass das logische Denken ein zentraler Bestandteil und eine Kernkomponente einer KI ist und nicht etwas, für das man separat bezahlen muss, um darauf zugreifen zu können“, sagte Dianne Penn, die das Produktmanagement für Forschung bei Anthropic leitet, in einem Interview mit VentureBeat. „Genau wie Menschen sollte die KI sowohl schnelle Antworten als auch komplexes Denken beherrschen. Auf eine einfache Frage wie ‚Wie spät ist es?‘ sollte sie sofort antworten. Aber für komplexe Aufgaben – wie die Planung einer zweiwöchigen Italienreise unter Berücksichtigung glutenfreier Ernährungsbedürfnisse – braucht sie mehr Verarbeitungszeit.“
„Wir betrachten Argumentation, Planung und Selbstkorrektur nicht als getrennte Fähigkeiten“, fügte sie hinzu. „Das ist also im Wesentlichen unsere Art, diesen philosophischen Unterschied auszudrücken … Im Idealfall sollte das Modell selbst erkennen, wann ein Problem intensiveres Denken erfordert, und sich anpassen, anstatt von den Benutzern zu verlangen, explizit verschiedene Argumentationsmodi auszuwählen.“

Die Benchmark-Daten untermauern die ehrgeizige Vision von Anthropic. Im erweiterten Denkmodus erreicht Claude 3.7 Sonnet eine Genauigkeit von 78,2 % bei Denkaufgaben auf Hochschulniveau, fordert damit die neuesten Modelle von OpenAI heraus und übertrifft DeepSeek R1.
Die aufschlussreicheren Messwerte stammen jedoch aus Anwendungen in der Praxis: Das Modell erreicht 81,2 % bei der einzelhandelsorientierten Werkzeugnutzung und zeigt deutliche Verbesserungen bei der Befolgung von Anweisungen (93,2 %) – Bereiche, in denen die Konkurrenz entweder Schwierigkeiten hatte oder keine Ergebnisse veröffentlicht hat.
Während DeepSeek und OpenAI bei traditionellen mathematischen Benchmarks führend sind, zeigt der einheitliche Ansatz von Claude 3.7, dass ein einzelnes Modell effektiv zwischen schnellen Reaktionen und gründlicher Analyse wechseln kann, wodurch Unternehmen möglicherweise nicht mehr für unterschiedliche Aufgabentypen separate KI-Systeme unterhalten müssen.
Der Zeitpunkt der Veröffentlichung ist entscheidend. Das Auftauchen von DeepSeek im letzten Monat löste im Silicon Valley Schockwellen aus und zeigte, dass hoch entwickelte KI-Logik mit weitaus weniger Rechenleistung erreicht werden kann als bisher angenommen. Dies stellte grundlegende Annahmen über KI-Entwicklungskosten und Infrastrukturanforderungen in Frage. Als DeepSeek seine Ergebnisse veröffentlichte, fiel die Nvidia-Aktie an einem einzigen Tag um 17 % – Investoren stellten plötzlich in Frage, ob teure Chips für fortgeschrittene KI wirklich notwendig sind.
Für Unternehmen könnte der Einsatz nicht höher sein. Unternehmen geben Millionen aus, um KI in ihre Betriebsabläufe zu integrieren, und wetten darauf, welcher Ansatz sich durchsetzen wird. Das Hybridmodell von Anthropic bietet einen überzeugenden Mittelweg: die Fähigkeit, die KI-Leistung je nach anstehender Aufgabe zu optimieren, von sofortigen Antworten des Kundendienstes bis hin zu komplexen Finanzanalysen. Das System behält Anthropics bisherige Preisgestaltung von 3 USD pro Million Eingabetoken und 15 USD pro Million Ausgabetoken bei, selbst mit zusätzlichen Argumentationsfunktionen.

„Unsere Kunden versuchen, Ergebnisse für ihre Kunden zu erzielen“, erklärte Michael Gerstenhaber, Leiter der Plattform bei Anthropic. „Die Verwendung desselben Modells und die Verwendung desselben Modells auf unterschiedliche Weise ermöglicht es jemandem wie Thompson Reuters , Rechtsrecherchen durchzuführen, und ermöglicht es unseren Programmierpartnern wie Cursor oder GitHub, Anwendungen zu entwickeln und diese Ziele zu erreichen.“
Der hybride Ansatz von Anthropic stellt sowohl eine technische Weiterentwicklung als auch einen strategischen Schachzug dar. Während OpenAI separate Modelle für verschiedene Funktionen pflegt und DeepSeek sich auf Kosteneffizienz konzentriert, strebt Anthropic einheitliche Systeme an, die sowohl Routineaufgaben als auch komplexe Schlussfolgerungen verarbeiten können. Diese Philosophie könnte die Art und Weise, wie Unternehmen KI einsetzen, grundlegend verändern und die Notwendigkeit beseitigen, mit mehreren spezialisierten Modellen zu jonglieren.
Anthropic hat heute außerdem Claude Code vorgestellt, ein Befehlszeilentool, mit dem Entwickler komplexe Engineering-Aufgaben direkt an die KI delegieren können. Das System erfordert vor der Übernahme von Codeänderungen die menschliche Zustimmung, was den wachsenden Fokus der Branche auf eine verantwortungsvolle KI-Entwicklung widerspiegelt.

„Sie müssen die Änderungen, die Claude vornimmt, tatsächlich noch akzeptieren. Sie sind ein Prüfer mit Hand am Steuer“, bemerkte Penn. „Es gibt im Wesentlichen eine Art Checkliste, die Sie grundsätzlich akzeptieren müssen, damit das Modell bestimmte Aktionen ausführt.“
Die Ankündigungen erfolgen inmitten eines intensiven Wettbewerbs in der KI-Entwicklung. Forscher der Stanford University haben kürzlich ein Open-Source-Argumentationsmodell für unter 50 US-Dollar entwickelt, während Microsoft gerade das o3-mini-Modell von OpenAI in Azure integriert hat. Der Erfolg von DeepSeek hat auch neue Ansätze in der KI-Entwicklung angeregt, wobei einige Unternehmen Modelldestillationstechniken erforschen, die die Kosten weiter senken könnten.

Penn veranschaulichte den dramatischen Fortschritt der KI-Fähigkeiten anhand eines unerwarteten Beispiels: „Wir haben verschiedene Versionen von Claude gebeten, Pokémon zu spielen … Diese Version hat es bis nach Vermilion City geschafft, mehrere Pokémon gefangen und muss sogar hart arbeiten, um ein Level aufzusteigen. Sie hat die richtigen Pokémon, um gegen Rivalen anzutreten.“
„Ich denke, wir werden weiterhin Innovationen hervorbringen und die Qualität des Denkens verbessern, in Richtung dynamischer Argumentation gehen“, erklärte Penn. „Wir haben es immer als Kernbestandteil der Intelligenz betrachtet und nicht als etwas Eigenständiges.“
Der wahre Test für den Ansatz von Anthropic wird die Einführung in Unternehmen sein. Pokémon zu spielen mag zwar trivial erscheinen, zeigt aber die Art von adaptiver Intelligenz, die Unternehmen brauchen: KI, die sowohl Routinevorgänge als auch komplexe strategische Entscheidungen bewältigen kann, ohne zwischen spezialisierten Modellen wechseln zu müssen. Frühere Versionen von Claude konnten nicht über die Startstadt eines Spiels hinaus navigieren. Die neueste Version entwickelt Strategien, verwaltet Ressourcen und trifft taktische Entscheidungen – Fähigkeiten, die die Komplexität realer geschäftlicher Herausforderungen widerspiegeln.
Für Unternehmenskunden könnte dies den Unterschied zwischen der Wartung mehrerer KI-Systeme für unterschiedliche Aufgaben und der Bereitstellung einer einzigen, leistungsfähigeren Lösung bedeuten. Die nächsten Monate werden zeigen, ob Anthropics Wette auf einheitliches KI-Argumentationsverfahren den Unternehmensmarkt umgestalten oder zu einem weiteren Experiment in der rasanten Entwicklung der Branche werden wird.
Wenn Sie Ihren Chef beeindrucken möchten, ist VB Daily die richtige Adresse für Sie. Wir geben Ihnen Insiderinformationen darüber, was Unternehmen mit generativer KI machen, von regulatorischen Änderungen bis hin zu praktischen Implementierungen, damit Sie Ihre Erkenntnisse weitergeben können, um den ROI zu maximieren.
Lesen Sie unsere Datenschutzrichtlinie
Vielen Dank für Ihr Abonnement. Weitere VB-Newsletter finden Sie hier .
Ein Fehler ist aufgetreten.

venturebeat