Gemini 2.5 Pro

Gemini 2.5 Pro je nejpokročilejší AI model od Googlu, navržený pro hluboké uvažování a promyšlené generování odpovědí. Předčí ostatní v klíčových benchmarkech s výjimečnou logikou a znalostí kódování. Optimalizovaný pro tvorbu dynamických webových aplikací, autonomních kódových systémů a adaptaci kódu dosahuje vysokého výkonu. S vestavěnými multimodálními schopnostmi a rozšířeným kontextovým oknem efektivně zpracovává velké datové sady a integruje různé informační zdroje pro řešení komplexních výzev.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvořený společností Meta, je vícejazyčný velký jazykový model speciálně vyladěný pro úlohy založené na instrukcích a optimalizovaný pro konverzační aplikace. Je schopen zpracovávat a generovat text v několika jazycích s kontextovým oknem podporujícím až 128 000 tokenů. Uvedený na trh 6. prosince 2024, model překonává řadu open-source i proprietárních chatbotů v různých průmyslových srovnávacích testech. Využívá Grouped-Query Attention (GQA) ke zlepšení škálovatelnosti a byl natrénován na různorodé množině dat obsahující více než 15 bilionů tokenů z veřejně dostupných zdrojů. Znalosti modelu jsou aktuální k prosinci 2023.

Gemini 2.5 ProLlama 3.3 70B Instruct
Webová stránka ?
Poskytovatel ?
Chat ?
Datum vydání ?
Modality ?
text ?
obrázky ?
hlas ?
video ?
text ?
Poskytovatelé API ?
Google AI Studio, Vertex AI, Gemini app
Fireworks, Together, DeepInfra, Hyperbolic
Datum uzávěrky znalostí ?
-
12.2024
Open Source ?
Ne
Ano
Cena za vstup ?
Není k dispozici
$0.23 na milion tokenů
Cena za výstup ?
Není k dispozici
$0.40 na milion tokenů
MMLU ?
Není k dispozici
86%
0-shot, CoT
Zdroj
MMLU-Pro ?
Není k dispozici
68.9%
5-shot, CoT
Zdroj
MMMU ?
81.7%
Zdroj
Není k dispozici
HellaSwag ?
Není k dispozici
Není k dispozici
HumanEval ?
Není k dispozici
88.4%
pass@1
Zdroj
MATH ?
Není k dispozici
77%
0-shot, CoT
Zdroj
GPQA ?
84.0%
Diamond Science
Zdroj
50.5%
0-shot, CoT
Zdroj
IFEval ?
Není k dispozici
92.1%
Zdroj
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Mobilní aplikace
-

VideoGameBench ?

Celkové skóre
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Porovnat LLM

Přidat komentář


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.