Grok 3 Beta vs o4-mini - Vergelijk LLMs

Grok 3 Beta

Grok 3 is het meest geavanceerde model van xAI, getraind op het Colossus-supercluster met 10 keer de rekenkracht van eerdere state-of-the-art modellen. Het beschikt over een contextvenster van 1M tokens en geavanceerde redeneervaardigheden, verbeterd door grootschalige reinforcement learning, waardoor diepe denkprocessen mogelijk zijn die variëren van seconden tot minuten voor het oplossen van complexe problemen. Het model behaalt top prestaties in academische benchmarks en real-world gebruikersevaluaties, met een Elo-score van 1402 in de Chatbot Arena. Het werd uitgebracht naast Grok 3 Mini, een kostenefficiënte variant geoptimaliseerd voor gestroomlijnd redeneren.

o4-mini

OpenAI o4-mini is het nieuwste lichtgewicht model in de o-serie, ontworpen voor efficiënte en capabele redenering over tekst- en visuele taken. Geoptimaliseerd voor snelheid en prestaties, blinkt het uit in codegeneratie en beeldbegrip, terwijl het een balans behoudt tussen latentie en redeneerdiepte. Het model ondersteunt een contextvenster van 200.000 tokens met maximaal 100.000 uitvoertokens, wat het geschikt maakt voor uitgebreide interacties met hoge volumes. Het verwerkt zowel tekst- als beeldinvoer en produceert tekstuele uitvoer met geavanceerde redeneermogelijkheden. Met zijn compacte architectuur en veelzijdige prestaties is o4-mini ideaal voor een breed scala aan real-world toepassingen die snelle en kosteneffectieve intelligentie vereisen.

	Grok 3 Beta	o4-mini
Website ?	Open	Open
Aanbieder ?	xAI	OpenAI
Chat ?
Releasedatum ?
Modaliteiten ?	tekst ? afbeeldingen ? video ?	tekst ? afbeeldingen ?
API-Aanbieders ?	xAI	OpenAI API
Kennisafsluitdatum ?	2025-01	-
Open Source ?	Nee	Nee
Prijzen Invoer ?	Niet beschikbaar	$1.10 per miljoen tokens
Prijzen Uitvoer ?	Niet beschikbaar	$4.40 per miljoen tokens
MMLU ?	Niet beschikbaar	fort
MMLU-Pro ?	79.9% Base model Bron	-
MMMU ?	78% With Think mode Bron	81.6% Bron
HellaSwag ?	Niet beschikbaar	-
HumanEval ?	Niet beschikbaar	14.28% Bron
MATH ?	Niet beschikbaar	-
GPQA ?	84.6% With Think mode, Diamond Bron	81.4% Bron
IFEval ?	Niet beschikbaar	-
SimpleQA ?	-	-
AIME 2024	-	93.4% Bron
AIME 2025	-	92.7% Bron
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobiele applicatie	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o4-mini

Website ?

Open

Aanbieder ?

xAI

OpenAI

Chat ?

Releasedatum ?

Modaliteiten ?

tekst ?
afbeeldingen ?
video ?

tekst ?
afbeeldingen ?

API-Aanbieders ?

xAI

OpenAI API

Kennisafsluitdatum ?

2025-01

Open Source ?

Nee

Prijzen Invoer ?

Niet beschikbaar

$1.10 per miljoen tokens

Prijzen Uitvoer ?

Niet beschikbaar

$4.40 per miljoen tokens

MMLU ?

Niet beschikbaar

fort

MMLU-Pro ?

79.9%
Base model
Bron

MMMU ?

78%
With Think mode
Bron

81.6%
Bron

HellaSwag ?

Niet beschikbaar

HumanEval ?

Niet beschikbaar

14.28%
Bron

MATH ?

Niet beschikbaar

GPQA ?

84.6%
With Think mode, Diamond
Bron

81.4%
Bron

IFEval ?

Niet beschikbaar

SimpleQA ?

AIME 2024

93.4%
Bron

AIME 2025

92.7%
Bron

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobiele applicatie

Google Play
Apple Apps

Vergelijk LLMs
Grok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Vergelijk LLMs

Voeg een reactie toe

Vergelijk LLMsGrok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Vergelijk LLMs

Voeg een reactie toe

Vergelijk LLMs
Grok 3 Beta vs o4-mini