Gemini 2.5 Pro

Gemini 2.5 Pro to najbardziej zaawansowany model AI Google, zaprojektowany do głębokiego rozumowania i przemyślanego generowania odpowiedzi. Przewyższa kluczowe benchmarki, wykazując wyjątkową logikę i biegłość w kodowaniu. Zoptymalizowany do budowania dynamicznych aplikacji internetowych, autonomicznych systemów kodu i adaptacji kodu, zapewnia wysoką wydajność. Dzięki wbudowanym możliwościom multimodalnym i rozszerzonemu oknu kontekstu efektywnie przetwarza duże zbiory danych i integruje różne źródła informacji do rozwiązywania złożonych wyzwań.

o3-mini

OpenAI o3-mini to szybki i ekonomiczny model rozumowania zaprojektowany do zastosowań STEM, zapewniający wysoką wydajność w nauce, matematyce i programowaniu. Wprowadzony na rynek w styczniu 2025 roku, zawiera kluczowe funkcje dla programistów, takie jak wywoływanie funkcji, strukturalne wyjścia i wiadomości dla deweloperów. Model oferuje trzy poziomy intensywności rozumowania—niski, średni i wysoki—umożliwiając użytkownikom optymalizację między głębszą analizą a szybszym czasem odpowiedzi. W przeciwieństwie do modelu o3, nie posiada zdolności wizualnych. Początkowo dostępny dla wybranych programistów na poziomach API 3-5, można go używać poprzez Chat Completions API, Assistants API i Batch API.

Gemini 2.5 Proo3-mini
Strona internetowa ?
Dostawca ?
Czat ?
Data wydania ?
Modalności ?
tekst ?
obrazy ?
głos ?
wideo ?
tekst ?
Dostawcy API ?
Google AI Studio, Vertex AI, Gemini app
OpenAI API
Data ostatniej aktualizacji wiedzy ?
-
Nieznane
Open Source ?
Nie
Nie
Cena za wejście ?
Niedostępne
$1.10 za milion tokenów
Cena za wyjście ?
Niedostępne
$4.40 za milion tokenów
MMLU ?
Niedostępne
86.9%
pass@1, high effort
Źródło
MMLU-Pro ?
Niedostępne
Niedostępne
MMMU ?
81.7%
Źródło
Niedostępne
HellaSwag ?
Niedostępne
Niedostępne
HumanEval ?
Niedostępne
Niedostępne
MATH ?
Niedostępne
97.9%
pass@1, high effort
Źródło
GPQA ?
84.0%
Diamond Science
Źródło
79.7%
0-shot, high effort
Źródło
IFEval ?
Niedostępne
Niedostępne
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Aplikacja mobilna

VideoGameBench ?

Łączny wynik
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Porównaj LLM

Dodaj komentarz


10%
Polityka prywatności i ciasteczka

Używamy plików cookies, by ułatwić korzystanie z naszych serwisów. Jeśli nie chcesz, by pliki cookies były zapisywane na Twoim dysku, zmień ustawienia swojej przeglądarki.