Grok 3 Beta vs o3-mini - Vergelijk LLMs

Grok 3 Beta

Grok 3 is het meest geavanceerde model van xAI, getraind op het Colossus-supercluster met 10 keer de rekenkracht van eerdere state-of-the-art modellen. Het beschikt over een contextvenster van 1M tokens en geavanceerde redeneervaardigheden, verbeterd door grootschalige reinforcement learning, waardoor diepe denkprocessen mogelijk zijn die variëren van seconden tot minuten voor het oplossen van complexe problemen. Het model behaalt top prestaties in academische benchmarks en real-world gebruikersevaluaties, met een Elo-score van 1402 in de Chatbot Arena. Het werd uitgebracht naast Grok 3 Mini, een kostenefficiënte variant geoptimaliseerd voor gestroomlijnd redeneren.

o3-mini

De OpenAI o3-mini is een hoogwaardig, kosteneffectief redeneermodel ontworpen voor STEM-toepassingen, met sterke prestaties in wetenschap, wiskunde en programmeren. Gelanceerd in januari 2025, omvat het essentiële ontwikkelaarsfuncties zoals functie-aanroepen, gestructureerde uitvoer en ontwikkelaarsberichten. Het model biedt drie redeneerinspanningen—laag, medium en hoog—waardoor gebruikers kunnen optimaliseren tussen diepere analyse en snellere reactietijden. In tegenstelling tot het o3-model heeft het geen visuele mogelijkheden. In eerste instantie beschikbaar voor geselecteerde ontwikkelaars in API-gebruiksniveaus 3-5, kan het worden benaderd via de Chat Completions API, Assistants API en Batch API.

	Grok 3 Beta	o3-mini
Website ?	Open	Open
Aanbieder ?	xAI	OpenAI
Chat ?
Releasedatum ?
Modaliteiten ?	tekst ? afbeeldingen ? video ?	tekst ?
API-Aanbieders ?	xAI	OpenAI API
Kennisafsluitdatum ?	2025-01	Onbekend
Open Source ?	Nee	Nee
Prijzen Invoer ?	Niet beschikbaar	$1.10 per miljoen tokens
Prijzen Uitvoer ?	Niet beschikbaar	$4.40 per miljoen tokens
MMLU ?	Niet beschikbaar	86.9% pass@1, high effort Bron
MMLU-Pro ?	79.9% Base model Bron	Niet beschikbaar
MMMU ?	78% With Think mode Bron	Niet beschikbaar
HellaSwag ?	Niet beschikbaar	Niet beschikbaar
HumanEval ?	Niet beschikbaar	Niet beschikbaar
MATH ?	Niet beschikbaar	97.9% pass@1, high effort Bron
GPQA ?	84.6% With Think mode, Diamond Bron	79.7% 0-shot, high effort Bron
IFEval ?	Niet beschikbaar	Niet beschikbaar
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobiele applicatie	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o3-mini

Website ?

Open

Aanbieder ?

xAI

OpenAI

Chat ?

Releasedatum ?

Modaliteiten ?

tekst ?
afbeeldingen ?
video ?

tekst ?

API-Aanbieders ?

xAI

OpenAI API

Kennisafsluitdatum ?

2025-01

Onbekend

Open Source ?

Nee

Prijzen Invoer ?

Niet beschikbaar

$1.10 per miljoen tokens

Prijzen Uitvoer ?

Niet beschikbaar

$4.40 per miljoen tokens

MMLU ?

Niet beschikbaar

86.9%
pass@1, high effort
Bron

MMLU-Pro ?

79.9%
Base model
Bron

Niet beschikbaar

MMMU ?

78%
With Think mode
Bron

Niet beschikbaar

HellaSwag ?

Niet beschikbaar

HumanEval ?

Niet beschikbaar

MATH ?

Niet beschikbaar

97.9%
pass@1, high effort
Bron

GPQA ?

84.6%
With Think mode, Diamond
Bron

79.7%
0-shot, high effort
Bron

IFEval ?

Niet beschikbaar

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobiele applicatie

Google Play
Apple Apps

Vergelijk LLMs
Grok 3 Beta vs o3-mini

Grok 3 Beta

o3-mini

Vergelijk LLMs

Voeg een reactie toe

Vergelijk LLMsGrok 3 Beta vs o3-mini

Grok 3 Beta

o3-mini

Vergelijk LLMs

Voeg een reactie toe

Vergelijk LLMs
Grok 3 Beta vs o3-mini