o3 vs GPT-4.1 - LLMs vergleichen

o3

OpenAI o3 ist das fortschrittlichste Denkmodell von OpenAI, speziell für komplexe, hochkognitive Aufgaben entwickelt. Im April 2025 eingeführt, bietet es herausragende Leistung in Softwareentwicklung, Mathematik und wissenschaftlicher Problemlösung. Das Modell führt drei Stufen von Denkanstrengung ein – niedrig, mittel und hoch –, sodass Benutzer je nach Aufgabenkomplexität zwischen Latenz und Denktiefe abwägen können. o3 unterstützt wesentliche Entwicklertools, einschließlich Funktionsaufrufe, strukturierte Ausgaben und Systemnachrichten. Mit integrierten Bildfähigkeiten kann o3 Bilder interpretieren und analysieren, was es für multimodale Anwendungen geeignet macht. Es ist über Chat Completions API, Assistants API und Batch API für flexible Integration in Unternehmens- und Forschungsworkflows verfügbar.

GPT-4.1

GPT-4.1, von OpenAI am 14. April 2025 eingeführt, bietet ein Kontextfenster von 1 Million Token und unterstützt Ausgaben von bis zu 32.768 Token pro Anfrage. Es liefert herausragende Leistung bei Codierungsaufgaben, erreicht 54,6 % im SWE-Bench Verified-Benchmark und zeigt eine 10,5 %ige Verbesserung gegenüber GPT-4o im MultiChallenge für die Befolgung von Anweisungen. Der Wissensstand des Modells ist auf Juni 2024 festgelegt. Die Preisgestaltung beträgt 2,00 $ pro Million Token für Eingaben und 8,00 $ pro Million Token für Ausgaben, mit einem 75 %igen Rabatt für zwischengespeicherte Eingaben, was es für wiederholte Abfragen äußerst kosteneffizient macht.

	o3	GPT-4.1
Webseite ?	Open	Open
Anbieter ?	OpenAI	OpenAI
Chat ?
Veröffentlichungsdatum ?
Modalitäten ?	Text ? Bilder ?	Text ? Bilder ?
API-Anbieter ?	OpenAI API	OpenAI API
Datum des Wissensstandes ?	-	-
Open Source ?	Nein	Nein
Preisgestaltung Eingabe ?	$10.00 pro Million Token	$2.00 pro Million Token
Preisgestaltung Ausgabe ?	$40.00 pro Million Token	$8.00 pro Million Token
MMLU ?	82.9% Quelle	90.2% pass@1 Quelle
MMLU-Pro ?	-	-
MMMU ?	-	74.8% Quelle
HellaSwag ?	-	-
HumanEval ?	-	-
MATH ?	-	-
GPQA ?	83.3% Diamond, no tools Quelle	66.3% Diamond Quelle
IFEval ?	-	-
SimpleQA ?	-	-
AIME 2024	91.6% Quelle	48.1% Quelle
AIME 2025	88.9% Quelle	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	87.3% pass@1 Quelle
MathVista ?	-	-
Mobile Anwendung	Google Play Apple Apps	Google Play Apple Apps

GPT-4.1

Webseite ?

Open

Anbieter ?

OpenAI

Chat ?

Veröffentlichungsdatum ?

Modalitäten ?

Text ?
Bilder ?

API-Anbieter ?

OpenAI API

Datum des Wissensstandes ?

Open Source ?

Nein

Preisgestaltung Eingabe ?

$10.00 pro Million Token

$2.00 pro Million Token

Preisgestaltung Ausgabe ?

$40.00 pro Million Token

$8.00 pro Million Token

MMLU ?

82.9%
Quelle

90.2%
pass@1
Quelle

MMLU-Pro ?

MMMU ?

74.8%
Quelle

HellaSwag ?

HumanEval ?

MATH ?

GPQA ?

83.3%
Diamond, no tools
Quelle

66.3%
Diamond
Quelle

IFEval ?

SimpleQA ?

AIME 2024

91.6%
Quelle

48.1%
Quelle

AIME 2025

88.9%
Quelle

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

87.3%
pass@1
Quelle

MathVista ?

Mobile Anwendung

Google Play
Apple Apps

LLMs vergleichen
o3 vs GPT-4.1

o3

GPT-4.1

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleicheno3 vs GPT-4.1

o3

GPT-4.1

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleichen
o3 vs GPT-4.1