Gemini 2.5 Pro

Gemini 2.5 Pro je najpokročilejší AI model od Googlu, navrhnutý pre hlboké uvažovanie a premyslené generovanie odpovedí. Predčí ostatné v kľúčových benchmarkoch s výnimočnou logikou a znalosťou kódovania. Optimalizovaný pre tvorbu dynamických webových aplikácií, autonómnych kódových systémov a adaptáciu kódu poskytuje vysoký výkon. S vstavanými multimodálnymi schopnosťami a rozšíreným kontextovým oknom efektívne spracováva veľké súbory dát a integruje rôzne informačné zdroje na riešenie komplexných výziev.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.

Gemini 2.5 ProLlama 3.3 70B Instruct
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
hlas ?
video ?
text ?
Poskytovatelia API ?
Google AI Studio, Vertex AI, Gemini app
Fireworks, Together, DeepInfra, Hyperbolic
Dátum zastarania vedomostí ?
-
12.2024
Open Source ?
Nie
Áno
Cena za vstup ?
Nie je k dispozícii
$0.23 za milión tokenov
Cena za výstup ?
Nie je k dispozícii
$0.40 za milión tokenov
MMLU ?
Nie je k dispozícii
86%
0-shot, CoT
Zdroj
MMLU-Pro ?
Nie je k dispozícii
68.9%
5-shot, CoT
Zdroj
MMMU ?
81.7%
Zdroj
Nie je k dispozícii
HellaSwag ?
Nie je k dispozícii
Nie je k dispozícii
HumanEval ?
Nie je k dispozícii
88.4%
pass@1
Zdroj
MATH ?
Nie je k dispozícii
77%
0-shot, CoT
Zdroj
GPQA ?
84.0%
Diamond Science
Zdroj
50.5%
0-shot, CoT
Zdroj
IFEval ?
Nie je k dispozícii
92.1%
Zdroj
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Mobilná aplikácia
-

VideoGameBench ?

Celkové hodnotenie
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.