o3 vs Claude 3.7 Sonnet - LLMs vergleichen

o3

OpenAI o3 ist das fortschrittlichste Denkmodell von OpenAI, speziell für komplexe, hochkognitive Aufgaben entwickelt. Im April 2025 eingeführt, bietet es herausragende Leistung in Softwareentwicklung, Mathematik und wissenschaftlicher Problemlösung. Das Modell führt drei Stufen von Denkanstrengung ein – niedrig, mittel und hoch –, sodass Benutzer je nach Aufgabenkomplexität zwischen Latenz und Denktiefe abwägen können. o3 unterstützt wesentliche Entwicklertools, einschließlich Funktionsaufrufe, strukturierte Ausgaben und Systemnachrichten. Mit integrierten Bildfähigkeiten kann o3 Bilder interpretieren und analysieren, was es für multimodale Anwendungen geeignet macht. Es ist über Chat Completions API, Assistants API und Batch API für flexible Integration in Unternehmens- und Forschungsworkflows verfügbar.

Claude 3.7 Sonnet

Claude 3.7 Sonnet ist das bisher fortschrittlichste Modell von Anthropic und die erste hybride Denk-KI auf dem Markt. Es bietet sowohl Standard- als auch erweiterte Denkmodi, wobei letzterer transparente, schrittweise Argumentation ermöglicht. Das Modell glänzt in der Programmierung und Front-End-Webentwicklung und erzielt Spitzenergebnisse bei SWE-bench Verified und TAU-bench. Verfügbar über Claude.ai, die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI, setzt es neue Maßstäbe für intelligente, KI-gestützte Problemlösungen.

	o3	Claude 3.7 Sonnet
Webseite ?	Open	Open
Anbieter ?	OpenAI	Anthropic
Chat ?
Veröffentlichungsdatum ?
Modalitäten ?	Text ? Bilder ?	Text ? Bilder ?
API-Anbieter ?	OpenAI API	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum des Wissensstandes ?	-	-
Open Source ?	Nein	Nein
Preisgestaltung Eingabe ?	$10.00 pro Million Token	$3.00 pro Million Token
Preisgestaltung Ausgabe ?	$40.00 pro Million Token	$15.00 pro Million Token
MMLU ?	82.9% Quelle	Nicht verfügbar
MMLU-Pro ?	-	Nicht verfügbar
MMMU ?	-	71.8% Quelle
HellaSwag ?	-	Nicht verfügbar
HumanEval ?	-	Nicht verfügbar
MATH ?	-	82.2% Quelle
GPQA ?	83.3% Diamond, no tools Quelle	68% Diamond Quelle
IFEval ?	-	90.8% Quelle
SimpleQA ?	-	-
AIME 2024	91.6% Quelle	-
AIME 2025	88.9% Quelle	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobile Anwendung	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Gesamtpunktzahl	-	0%
Doom II	-	0%
Dream DX	-	0%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Claude 3.7 Sonnet

Webseite ?

Open

Anbieter ?

OpenAI

Anthropic

Chat ?

Veröffentlichungsdatum ?

Modalitäten ?

Text ?
Bilder ?

API-Anbieter ?

OpenAI API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Datum des Wissensstandes ?

Open Source ?

Nein

Preisgestaltung Eingabe ?

$10.00 pro Million Token

$3.00 pro Million Token

Preisgestaltung Ausgabe ?

$40.00 pro Million Token

$15.00 pro Million Token

MMLU ?

82.9%
Quelle

Nicht verfügbar

MMLU-Pro ?

Nicht verfügbar

MMMU ?

71.8%
Quelle

HellaSwag ?

Nicht verfügbar

HumanEval ?

Nicht verfügbar

MATH ?

82.2%
Quelle

GPQA ?

83.3%
Diamond, no tools
Quelle

68%
Diamond
Quelle

IFEval ?

90.8%
Quelle

SimpleQA ?

AIME 2024

91.6%
Quelle

AIME 2025

88.9%
Quelle

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobile Anwendung

Google Play
Apple Apps

VideoGameBench ?

Gesamtpunktzahl

Doom II

Dream DX

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

LLMs vergleichen
o3 vs Claude 3.7 Sonnet

o3

Claude 3.7 Sonnet

VideoGameBench ?

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleicheno3 vs Claude 3.7 Sonnet

o3

Claude 3.7 Sonnet

VideoGameBench ?

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleichen
o3 vs Claude 3.7 Sonnet