Gemini 2.5 Pro — це найдосконаліша модель ШІ від Google, розроблена для глибоких міркувань і продуманого створення відповідей. Вона перевершує ключові тести, демонструючи виняткову логіку та навички програмування. Оптимізована для створення динамічних веб-додатків, автономних систем коду та адаптації коду, забезпечуючи високу продуктивність. З вбудованими мультимодальними можливостями та розширеним контекстним вікном вона ефективно обробляє великі набори даних і інтегрує різні джерела інформації для вирішення складних завдань.
„Llama 3.3 70B Instruct“, створена Meta, — це багатомовна велика мовна модель, спеціально налаштована для завдань на основі інструкцій і оптимізована для розмовних додатків. Вона може обробляти та генерувати текст кількома мовами, підтримуючи контекстне вікно до 128 000 токенів. Запущена 6 грудня 2024 року, модель перевершує багато відкритих і комерційних чат-ботів у різних галузевих тестах. Використовує Grouped-Query Attention (GQA) для покращення масштабованості та навчена на різноманітному наборі даних, що містить понад 15 трильйонів токенів із публічних джерел. Знання моделі актуальні до грудня 2023 року.
Gemini 2.5 Pro | Llama 3.3 70B Instruct | |
---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення голос відео | текст |
Постачальники API
| Google AI Studio, Vertex AI, Gemini app | Fireworks, Together, DeepInfra, Hyperbolic |
Дата оновлення знань
| - | 12.2024 |
Відкритий код
| Ні | Так |
Вартість введення
| Недоступно | $0.23 за мільйон токенів |
Вартість виведення
| Недоступно | $0.40 за мільйон токенів |
MMLU
| Недоступно | 86% 0-shot, CoT Джерело |
MMLU-Pro
| Недоступно | 68.9% 5-shot, CoT Джерело |
MMMU
| 81.7% Джерело | Недоступно |
HellaSwag
| Недоступно | Недоступно |
HumanEval
| Недоступно | 88.4% pass@1 Джерело |
MATH
| Недоступно | 77% 0-shot, CoT Джерело |
GPQA
| 84.0% Diamond Science Джерело | 50.5% 0-shot, CoT Джерело |
IFEval
| Недоступно | 92.1% Джерело |
SimpleQA
| 52.9% | - |
AIME 2024 | 92.0% | - |
AIME 2025 | 86.7% | - |
Aider Polyglot
| 74.0% / 68.6% | - |
LiveCodeBench v5
| 70.4% | - |
Global MMLU (Lite)
| 89.8% | - |
MathVista
| - | - |
Мобільний додаток | - | |
VideoGameBench | ||
Загальний бал | 0.48% | - |
Doom II | 0% | - |
Dream DX | 4.8% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.