Gemini 2.5 Pro yra „Google“ pažangiausias AI modelis, sukurtas gilaus samprotavimo ir apgalvoto atsakymų generavimo. Jis pranoksta pagrindinius benchmarkus, demonstruodamas išskirtinę logiką ir programavimo įgūdžius. Optimizuotas dinamiškoms žiniatinklio programoms, autonominėms kodo sistemoms ir kodo pritaikymui, jis pasiekia aukštą našumą. Turėdamas integruotas daugialypes galimybes ir išplėstą konteksto langą, efektyviai apdoroja didelius duomenų rinkinius ir integruoja įvairius informacijos šaltinius sudėtingiems iššūkiams spręsti.
Claude 3.5 Haiku, sukurtas „Anthropic“, siūlo 200 000 žetonų kontekstinį langą. Kaina nustatyta – 1 $ už milijoną įvesties žetonų ir 5 $ už milijoną išvesties žetonų, o naudojant užklausų kaupimą talpykloje galima sutaupyti iki 90 %, o per „Message Batches API“ – iki 50 %. Šis modelis, išleistas 2024 m. lapkričio 4 d., išsiskiria kodo užbaigimu, interaktyviais pokalbių robotais, duomenų išgavimu ir žymėjimu bei realaus laiko turinio moderavimu.
Gemini 2.5 Pro | Claude 3.5 Haiku | |
---|---|---|
Internetinė svetainė
| ||
Tiekėjas
| ||
Pokalbiai
| ||
Išleidimo data
| ||
Modalumai
| tekstas vaizdai balso vaizdo | tekstas |
API tiekėjai
| Google AI Studio, Vertex AI, Gemini app | Anthropic, AWS Bedrock, Vertex AI |
Žinių nutraukimo data
| - | 01.04.2024 |
Atvirojo kodo
| Ne | Ne |
Įvesties kaina
| Nėra prieinama | $0.80 už milijoną žodžių |
Išvesties kaina
| Nėra prieinama | $4.00 |
MMLU
| Nėra prieinama | Nėra prieinama |
MMLU-Pro
| Nėra prieinama | 65% 0-shot CoT Šaltinis |
MMMU
| 81.7% Šaltinis | Nėra prieinama |
HellaSwag
| Nėra prieinama | Nėra prieinama |
HumanEval
| Nėra prieinama | 88.1% 0-shot Šaltinis |
MATH
| Nėra prieinama | 69.4% 0-shot CoT Šaltinis |
GPQA
| 84.0% Diamond Science Šaltinis | Nėra prieinama |
IFEval
| Nėra prieinama | Nėra prieinama |
SimpleQA
| 52.9% | - |
AIME 2024 | 92.0% | - |
AIME 2025 | 86.7% | - |
Aider Polyglot
| 74.0% / 68.6% | - |
LiveCodeBench v5
| 70.4% | - |
Global MMLU (Lite)
| 89.8% | - |
MathVista
| - | - |
Mobilioji programa | ||
VideoGameBench | ||
Bendras balas | 0.48% | - |
Doom II | 0% | - |
Dream DX | 4.8% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.