Grok 3 Beta

„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.

o3

Az OpenAI o3 az OpenAI legfejlettebb gondolkodási modellje, amelyet kifejezetten összetett, magas kognitív igényű feladatok kezelésére terveztek. 2025 áprilisában jelent meg, kiváló teljesítményt nyújtva a szoftverfejlesztésben, matematikában és tudományos problémamegoldásban. A modell három szintű gondolkodási erőfeszítést vezet be – alacsony, közepes és magas –, lehetővé téve a felhasználók számára, hogy a feladat összetettsége alapján mérlegeljenek a késleltetés és a gondolkodás mélysége között. Az o3 támogatja a fejlesztők számára nélkülözhetetlen eszközöket, beleértve a függvényhívásokat, strukturált kimeneteket és rendszerszintű üzeneteket. Beépített látási képességekkel az o3 képes képeket értelmezni és elemezni, ami multimodális alkalmazásokhoz teszi alkalmassá. Elérhető a Chat Completions API, az Assistants API és a Batch API segítségével, rugalmas integrációt biztosítva vállalati és kutatási munkafolyamatokba.

Grok 3 Betao3
Weboldal ?
Szolgáltató ?
Csevegés ?
Kiadási Dátum ?
Modalitások ?
szöveg ?
képek ?
videó ?
szöveg ?
képek ?
API Szolgáltatók ?
xAI
OpenAI API
Tudás Befejezési Dátuma ?
2025-01
-
Nyílt Forráskódú ?
Nem
Nem
Bemeneti Árazás ?
Nem elérhető
$10.00 millió tokenenként
Kimeneti Árazás ?
Nem elérhető
$40.00 millió tokenenként
MMLU ?
Nem elérhető
82.9%
Forrás
MMLU-Pro ?
79.9%
Base model
Forrás
-
MMMU ?
78%
With Think mode
Forrás
-
HellaSwag ?
Nem elérhető
-
HumanEval ?
Nem elérhető
-
MATH ?
Nem elérhető
-
GPQA ?
84.6%
With Think mode, Diamond
Forrás
83.3%
Diamond, no tools
Forrás
IFEval ?
Nem elérhető
-
SimpleQA ?
-
-
AIME 2024
-
91.6%
Forrás
AIME 2025
-
88.9%
Forrás
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilalkalmazás

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.