„Grok 3“ to najnowocześniejszy model xAI, wytrenowany na superklastrze Colossus, który ma dziesięciokrotnie większą moc obliczeniową niż wcześniejsze modele najwyższej klasy. Posiada okno kontekstowe o pojemności 1 miliona tokenów i zaawansowane zdolności rozumowania, ulepszone dzięki uczeniu ze wzmocnieniem na dużą skalę, umożliwiając głębokie procesy myślowe trwające od sekund do minut w celu rozwiązywania złożonych problemów. Model osiąga najwyższą wydajność w testach akademickich i rzeczywistych ocenach użytkowników, zdobywając wynik Elo 1402 w Chatbot Arena. Został wydany wraz z Grok 3 Mini, ekonomiczną wersją zoptymalizowaną pod kątem uproszczonego rozumowania.
Gemini 2.5 Pro to najbardziej zaawansowany model AI Google, zaprojektowany do głębokiego rozumowania i przemyślanego generowania odpowiedzi. Przewyższa kluczowe benchmarki, wykazując wyjątkową logikę i biegłość w kodowaniu. Zoptymalizowany do budowania dynamicznych aplikacji internetowych, autonomicznych systemów kodu i adaptacji kodu, zapewnia wysoką wydajność. Dzięki wbudowanym możliwościom multimodalnym i rozszerzonemu oknu kontekstu efektywnie przetwarza duże zbiory danych i integruje różne źródła informacji do rozwiązywania złożonych wyzwań.
Grok 3 Beta | Gemini 2.5 Pro | |
---|---|---|
Dostawca | ||
Strona internetowa | ||
Data wydania | Jan 19, 2025 4 miesiące ago | Mar 25, 2025 2 miesiące ago |
Modalności | tekst obrazy wideo | tekst obrazy głos wideo |
Dostawcy API | xAI | Google AI Studio, Vertex AI, Gemini app |
Data ostatniej aktualizacji wiedzy | 2025-01 | - |
Open Source | Nie | Nie |
Cena za wejście | Niedostępne | Niedostępne |
Cena za wyjście | Niedostępne | Niedostępne |
MMLU | Niedostępne | Niedostępne |
MMLU Pro | 79.9% Base model Źródło | Niedostępne |
MMMU | 78% With Think mode Źródło | 81.7% Źródło |
HellaSwag | Niedostępne | Niedostępne |
HumanEval | Niedostępne | Niedostępne |
MATH | Niedostępne | Niedostępne |
GPQA | 84.6% With Think mode, Diamond Źródło | 84.0% Diamond Science Źródło |
IFEval | Niedostępne | Niedostępne |
Array | - | 52.9% |
AIME 2024 | - | 92.0% |
AIME 2025 | - | 86.7% |
Array | - | 74.0% / 68.6% |
Array | - | 70.4% |
Array | - | 89.8% |
Array | - | - |
Aplikacja mobilna |
Compare AI. Test. Benchmarks. Chatboty mobilne, Sketch
Copyright © 2025 All Right Reserved.