o4-mini vs Claude 3.7 Sonnet

o4-mini

OpenAI o4-mini je nejnovější odlehčený model v řadě o-series, navržený pro efektivní a schopné uvažování napříč textovými a vizuálními úlohami. Optimalizovaný pro rychlost a výkon vyniká v generování kódu a porozumění založeném na obrazech, při zachování rovnováhy mezi latencí a hloubkou uvažování. Model podporuje kontextové okno o velikosti 200 000 tokenů s až 100 000 výstupními tokeny, což jej činí vhodným pro rozsáhlé interakce. Zvládá jak textové, tak obrazové vstupy a produkuje textové výstupy s pokročilými schopnostmi uvažování. Díky své kompaktní architektuře a všestrannému výkonu je o4-mini ideální pro širokou škálu reálných aplikací vyžadujících rychlou a nákladově efektivní inteligenci.

Claude 3.7 Sonnet

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

	o4-mini	Claude 3.7 Sonnet
Webová stránka ?	Open	Open
Poskytovatel ?	OpenAI	Anthropic
Chat ?
Datum vydání ?
Modality ?	text ? obrázky ?	text ? obrázky ?
Poskytovatelé API ?	OpenAI API	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí ?	-	-
Open Source ?	Ne	Ne
Cena za vstup ?	$1.10 na milion tokenů	$3.00 na milion tokenů
Cena za výstup ?	$4.40 na milion tokenů	$15.00 na milion tokenů
MMLU ?	fort	Není k dispozici
MMLU-Pro ?	-	Není k dispozici
MMMU ?	81.6% Zdroj	71.8% Zdroj
HellaSwag ?	-	Není k dispozici
HumanEval ?	14.28% Zdroj	Není k dispozici
MATH ?	-	82.2% Zdroj
GPQA ?	81.4% Zdroj	68% Diamond Zdroj
IFEval ?	-	90.8% Zdroj
SimpleQA ?	-	-
AIME 2024	93.4% Zdroj	-
AIME 2025	92.7% Zdroj	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilní aplikace	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Celkové skóre	-	0%
Doom II	-	0%
Dream DX	-	0%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

o4-mini

Claude 3.7 Sonnet

Webová stránka ?

Open

Poskytovatel ?

OpenAI

Anthropic

Chat ?

Datum vydání ?

Modality ?

text ?
obrázky ?

Poskytovatelé API ?

OpenAI API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Datum uzávěrky znalostí ?

Open Source ?

Cena za vstup ?

$1.10 na milion tokenů

$3.00 na milion tokenů

Cena za výstup ?

$4.40 na milion tokenů

$15.00 na milion tokenů

MMLU ?

fort

Není k dispozici

MMLU-Pro ?

Není k dispozici

MMMU ?

81.6%
Zdroj

71.8%
Zdroj

HellaSwag ?

Není k dispozici

HumanEval ?

14.28%
Zdroj

Není k dispozici

MATH ?

82.2%
Zdroj

GPQA ?

81.4%
Zdroj

68%
Diamond
Zdroj

IFEval ?

90.8%
Zdroj

SimpleQA ?

AIME 2024

93.4%
Zdroj

AIME 2025

92.7%
Zdroj

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilní aplikace

Google Play
Apple Apps

VideoGameBench ?

Celkové skóre

Doom II

Dream DX

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

Porovnat LLM
o4-mini vs Claude 3.7 Sonnet

o4-mini

Claude 3.7 Sonnet

VideoGameBench ?

Porovnat LLM

Přidat komentář

Porovnat LLMo4-mini vs Claude 3.7 Sonnet

o4-mini

Claude 3.7 Sonnet

VideoGameBench ?

Porovnat LLM

Přidat komentář

Porovnat LLM
o4-mini vs Claude 3.7 Sonnet