
Gemini 2.5 Pro — это самая передовая модель ИИ от Google, разработанная для глубоких рассуждений и вдумчивого создания ответов. Она превосходит ключевые тесты, демонстрируя исключительную логику и навыки программирования. Оптимизирована для создания динамических веб-приложений, автономных систем кода и адаптации кода, обеспечивая высокую производительность. Со встроенными мультимодальными возможностями и расширенным контекстным окном она эффективно обрабатывает большие наборы данных и интегрирует различные источники информации для решения сложных задач.
Grok 3 — это самый продвинутый модельный продукт xAI, обученный на суперкомпьютерном кластере Colossus с вычислительной мощностью, превышающей предыдущие передовые модели в 10 раз. Обладает контекстным окном в 1 миллион токенов и расширенными возможностями рассуждения, улучшенными благодаря крупномасштабному обучению с подкреплением, что позволяет осуществлять глубокие мыслительные процессы от секунд до минут для решения сложных задач. Модель демонстрирует выдающиеся результаты в академических тестах и реальных пользовательских оценках, набрав рейтинг Elo 1402 в Chatbot Arena. Выпущена вместе с Grok 3 Mini — экономичной версией, оптимизированной для упрощенного рассуждения.
| Gemini 2.5 Pro | Grok 3 Beta | |
|---|---|---|
Веб-сайт
| ||
Провайдер
| ||
Чат
| ||
Дата выпуска
| ||
Модальности
| текст изображения голос видео | текст изображения видео |
Поставщики API
| Google AI Studio, Vertex AI, Gemini app | xAI |
Дата актуальности знаний
| - | 2025-01 |
Открытый исходный код
| Нет | Нет |
Стоимость ввода
| Недоступно | Недоступно |
Стоимость вывода
| Недоступно | Недоступно |
MMLU
| Недоступно | Недоступно |
MMLU-Pro
| Недоступно | 79.9% Base model Источник |
MMMU
| 81.7% Источник | 78% With Think mode Источник |
HellaSwag
| Недоступно | Недоступно |
HumanEval
| Недоступно | Недоступно |
MATH
| Недоступно | Недоступно |
GPQA
| 84.0% Diamond Science Источник | 84.6% With Think mode, Diamond Источник |
IFEval
| Недоступно | Недоступно |
SimpleQA
| 52.9% | - |
AIME 2024 | 92.0% | - |
AIME 2025 | 86.7% | - |
Aider Polyglot
| 74.0% / 68.6% | - |
LiveCodeBench v5
| 70.4% | - |
Global MMLU (Lite)
| 89.8% | - |
MathVista
| - | - |
Мобильное приложение | ||
VideoGameBench | ||
Общий балл | 0.48% | - |
Doom II | 0% | - |
Dream DX | 4.8% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
MathArena | ||
| Средний балл | 81% | - |
AIME 2025 Тест, основанный на задачах из конкурса по математике (American Invitational Mathematics Examination),предназначен для проверки математических навыков моделей. | 87% | - |
HMMT February 2025 Тест, основанный на задачах из Harvard-MIT Mathematics Tournament, февраль 2025 года, предназначен для проверки математических навыков моделей. | 82% | - |
BRUMO 2025 | 90% | - |
SMT 2025 Тест, основанный на задачах из Stanford Math Tournament, 2025 года, предназначен для проверки математических навыков моделей. | 85% | - |
CMIMC 2025 Тест, основанный на задачах из Canadian Mathematical Olympiad, 2025 года, предназначен для проверки математических навыков моделей. | 58% | - |
Compare AI. Test. Benchmarks. Чат-боты для мобильных приложений, Sketch
Copyright © 2026 All Right Reserved.
Комментарии (1)
Mazen
11 Август 2025Good program