o3-mini vs Claude 3.7 Sonnet - Extended Thinking

o3-mini

OpenAI o3-mini je vysokorychlostní a cenově efektivní model určený pro STEM aplikace, který vyniká ve vědě, matematice a programování. Uvedený na trh v lednu 2025, obsahuje klíčové funkce pro vývojáře, jako je volání funkcí, strukturované výstupy a zprávy pro vývojáře. Model nabízí tři úrovně hloubky úvah—nízkou, střední a vysokou—umožňující uživatelům optimalizovat rovnováhu mezi hlubší analýzou a rychlejší odezvou. Na rozdíl od modelu o3 neobsahuje schopnosti zpracování obrazu. Zpočátku je dostupný vybraným vývojářům v úrovních API 3-5 a lze jej využívat prostřednictvím API pro doplňování chatů, API asistentů a Batch API.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet je dosud nejpokročilejší model AI od Anthropic a první hybridní systém pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vykazuje významná vylepšení v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů poháněné AI.

	o3-mini	Claude 3.7 Sonnet - Extended Thinking
Webová stránka ?	Open	Open
Poskytovatel ?	OpenAI	Anthropic
Chat ?
Datum vydání ?
Modality ?	text ?	text ? obrázky ?
Poskytovatelé API ?	OpenAI API	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí ?	Neznámý	-
Open Source ?	Ne	Ne
Cena za vstup ?	$1.10 na milion tokenů	$3.00 na milion tokenů
Cena za výstup ?	$4.40 na milion tokenů	$15.00 na milion tokenů
MMLU ?	86.9% pass@1, high effort Zdroj	Není k dispozici
MMLU-Pro ?	Není k dispozici	Není k dispozici
MMMU ?	Není k dispozici	75% Zdroj
HellaSwag ?	Není k dispozici	Není k dispozici
HumanEval ?	Není k dispozici	Není k dispozici
MATH ?	97.9% pass@1, high effort Zdroj	96.2% Zdroj
GPQA ?	79.7% 0-shot, high effort Zdroj	84.8% Diamond Zdroj
IFEval ?	Není k dispozici	93.2% Zdroj
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilní aplikace	Google Play Apple Apps	Google Play Apple Apps

o3-mini

Claude 3.7 Sonnet - Extended Thinking

Webová stránka ?

Open

Poskytovatel ?

OpenAI

Anthropic

Chat ?

Datum vydání ?

Modality ?

text ?

text ?
obrázky ?

Poskytovatelé API ?

OpenAI API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Datum uzávěrky znalostí ?

Neznámý

Open Source ?

Cena za vstup ?

$1.10 na milion tokenů

$3.00 na milion tokenů

Cena za výstup ?

$4.40 na milion tokenů

$15.00 na milion tokenů

MMLU ?

86.9%
pass@1, high effort
Zdroj

Není k dispozici

MMLU-Pro ?

Není k dispozici

MMMU ?

Není k dispozici

75%
Zdroj

HellaSwag ?

Není k dispozici

HumanEval ?

Není k dispozici

MATH ?

97.9%
pass@1, high effort
Zdroj

96.2%
Zdroj

GPQA ?

79.7%
0-shot, high effort
Zdroj

84.8%
Diamond
Zdroj

IFEval ?

Není k dispozici

93.2%
Zdroj

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilní aplikace

Google Play
Apple Apps

Porovnat LLM
o3-mini vs Claude 3.7 Sonnet - Extended Thinking

o3-mini

Claude 3.7 Sonnet - Extended Thinking

Porovnat LLM

Přidat komentář

Porovnat LLMo3-mini vs Claude 3.7 Sonnet - Extended Thinking

o3-mini

Claude 3.7 Sonnet - Extended Thinking

Porovnat LLM

Přidat komentář

Porovnat LLM
o3-mini vs Claude 3.7 Sonnet - Extended Thinking