o3

OpenAI o3 je najpokročilejší model na uvažovanie od OpenAI, špeciálne vytvorený pre zvládanie zložitých úloh s vysokými kognitívnymi nárokmi. Spustený v apríli 2025 poskytuje výnimočný výkon v softvérovom inžinierstve, matematike a vedeckom riešení problémov. Model zavádza tri úrovne úsilia uvažovania – nízke, stredné a vysoké – čo umožňuje používateľom vyvážiť latenciu a hĺbku uvažovania podľa zložitosti úlohy. o3 podporuje základné nástroje pre vývojárov, vrátane volania funkcií, štruktúrovaných výstupov a systémových správ. S vstavanými vizuálnymi schopnosťami dokáže o3 interpretovať a analyzovať obrázky, čo ho robí vhodným pre multimodálne aplikácie. Je dostupný cez Chat Completions API, Assistants API a Batch API pre flexibilnú integráciu do podnikových a výskumných pracovných postupov.

Claude 3.5 Haiku

Claude 3.5 Haiku, vyvinutý spoločnosťou Anthropic, ponúka kontextové okno o veľkosti 200 000 tokenov. Ceny sú stanovené na 1 $ za milión vstupných tokenov a 5 $ za milión výstupných tokenov, pričom je možné dosiahnuť úspory až do 90 % prostredníctvom cacheovania promptov a až 50 % prostredníctvom API Message Batches. Tento model, ktorý bol vydaný 4. novembra 2024, vyniká v dopĺňaní kódu, interaktívnych chatbotoch, extrakcii a označovaní dát, ako aj v moderovaní obsahu v reálnom čase.

o3Claude 3.5 Haiku
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
text ?
Poskytovatelia API ?
OpenAI API
Anthropic, AWS Bedrock, Vertex AI
Dátum zastarania vedomostí ?
-
01.04.2024
Open Source ?
Nie
Nie
Cena za vstup ?
$10.00 za milión tokenov
$0.80 za milión tokenov
Cena za výstup ?
$40.00 za milión tokenov
$4.00
MMLU ?
82.9%
Zdroj
Nie je k dispozícii
MMLU-Pro ?
-
65%
0-shot CoT
Zdroj
MMMU ?
-
Nie je k dispozícii
HellaSwag ?
-
Nie je k dispozícii
HumanEval ?
-
88.1%
0-shot
Zdroj
MATH ?
-
69.4%
0-shot CoT
Zdroj
GPQA ?
83.3%
Diamond, no tools
Zdroj
Nie je k dispozícii
IFEval ?
-
Nie je k dispozícii
SimpleQA ?
-
-
AIME 2024
91.6%
Zdroj
-
AIME 2025
88.9%
Zdroj
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.