o4-mini

OpenAI o4-mini je nejnovější odlehčený model v řadě o-series, navržený pro efektivní a schopné uvažování napříč textovými a vizuálními úlohami. Optimalizovaný pro rychlost a výkon vyniká v generování kódu a porozumění založeném na obrazech, při zachování rovnováhy mezi latencí a hloubkou uvažování. Model podporuje kontextové okno o velikosti 200 000 tokenů s až 100 000 výstupními tokeny, což jej činí vhodným pro rozsáhlé interakce. Zvládá jak textové, tak obrazové vstupy a produkuje textové výstupy s pokročilými schopnostmi uvažování. Díky své kompaktní architektuře a všestrannému výkonu je o4-mini ideální pro širokou škálu reálných aplikací vyžadujících rychlou a nákladově efektivní inteligenci.

Claude 3.7 Sonnet

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

o4-miniClaude 3.7 Sonnet
Webová stránka ?
Poskytovatel ?
Chat ?
Datum vydání ?
Modality ?
text ?
obrázky ?
text ?
obrázky ?
Poskytovatelé API ?
OpenAI API
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí ?
-
-
Open Source ?
Ne
Ne
Cena za vstup ?
$1.10 na milion tokenů
$3.00 na milion tokenů
Cena za výstup ?
$4.40 na milion tokenů
$15.00 na milion tokenů
MMLU ?
fort
Není k dispozici
MMLU-Pro ?
-
Není k dispozici
MMMU ?
81.6%
Zdroj
71.8%
Zdroj
HellaSwag ?
-
Není k dispozici
HumanEval ?
14.28%
Zdroj
Není k dispozici
MATH ?
-
82.2%
Zdroj
GPQA ?
81.4%
Zdroj
68%
Diamond
Zdroj
IFEval ?
-
90.8%
Zdroj
SimpleQA ?
-
-
AIME 2024
93.4%
Zdroj
-
AIME 2025
92.7%
Zdroj
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilní aplikace

VideoGameBench ?

Celkové skóre
-
0%
Doom II
-
0%
Dream DX
-
0%
Awakening DX
-
0%
Civilization I
-
0%
Pokemon Crystal
-
0%
The Need for Speed
-
0%
The Incredible Machine
-
0%
Secret Game 1
-
0%
Secret Game 2
-
0%
Secret Game 3
-
0%

Porovnat LLM

Přidat komentář


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.