GPT‑5.1 vs DeepSeek-R1

	GPT‑5.1	DeepSeek-R1
Web Site ?	Open	Open
Provider ?	OpenAI	DeepSeek
Chat ?
Release Date ?
Modalities ?	text ? images ?	text ?
API Providers ?	OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)	DeepSeek, HuggingFace
Knowledge Cut-off Date ?	06.2025	Unknown
Open Source ?	No	Yes
Pricing Input ?	$1.25 per million tokens	$0.55 per million tokens
Pricing Output ?	$10.00 per million tokens	$2.19 per million tokens
MMLU ?	-	90.8% Pass@1 Source
MMLU-Pro ?	78.4% Source	84% EM Source
MMMU ?	85.4% Source	-
HellaSwag ?	-	-
HumanEval ?	-	-
MATH ?	-	-
GPQA ?	88.1% Diamond Source	71.5% Pass@1 Source
IFEval ?	-	83.3% Prompt Strict Source
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	94% Source	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobile Application	Google Play Apple Apps	Google Play Apple Apps
MathArena ?
Avg. Score	-	82%
AIME 2025 A test based on problems from the American Invitational Mathematics Examination, designed to assess the mathematical skills of models.	-	89%
HMMT February 2025 A test based on problems from the Harvard-MIT Mathematics Tournament, February 2025, designed to assess the mathematical skills of models.	-	77%
BRUMO 2025	-	92%
SMT 2025 A test based on problems from the Stanford Math Tournament, 2025, designed to assess the mathematical skills of models.	-	83%
CMIMC 2025 A test based on problems from the Canadian Mathematical Olympiad, 2025, designed to assess the mathematical skills of models.	-	69%

Compare LLMs

Grok 4 vs Claude Opus 4.5
Grok 4 vs Gemini 3 Pro
Grok 4 vs GPT‑5.1
Grok 4 vs DeepSeek-R1
Grok 4 vs Nova Pro
Grok 4 vs Gemini 2.5 Pro
Grok 4 vs Llama 4 Maverick
Grok 4 vs o3
Grok 4 vs Qwen 3
Grok 4 vs Claude 3.5 Haiku
Grok 4 vs o3-mini
Grok 4 vs Grok 3 Beta
Grok 4 vs Claude 3.7 Sonnet - Extended Thinking
Grok 4 vs Llama 4 Scout
Grok 4 vs o4-mini
Grok 4 vs GPT-4.1
Grok 4 vs Claude Opus 4
Grok 4 vs GPT-OSS
Grok 4 vs Claude Opus 4.1
Grok 4 vs Gemini 2.5 Flash Lite
Grok 4 vs Gemini 2.0 Pro
Grok 4 vs Gemini 2.0 Flash
Grok 4 vs Claude 3.7 Sonnet
Grok 4 vs Qwen2.5-VL-32B
Grok 4 vs GPT-4.1 Nano
Grok 4 vs GPT-5
Grok 4 vs Gemini 2.0 Flash Thinking
Grok 4 vs Llama 3.3 70B Instruct
Grok 4 vs Llama 3.1 Nemotron 70B Instruct
Grok 4 vs Command A
Grok 4 vs Claude Sonnet 4
Grok 4 vs Nova Lite
Grok 4 vs Mistral Large 2
Grok 4 vs GLM-4.5
Grok 4 vs Nova Micro
Grok 4 vs GPT-4.5
Claude Opus 4.5 vs Gemini 3 Pro
Claude Opus 4.5 vs GPT‑5.1
Claude Opus 4.5 vs DeepSeek-R1
Claude Opus 4.5 vs Nova Pro
Claude Opus 4.5 vs Gemini 2.5 Pro
Claude Opus 4.5 vs Llama 4 Maverick
Claude Opus 4.5 vs o3
Claude Opus 4.5 vs Qwen 3
Claude Opus 4.5 vs Claude 3.5 Haiku
Claude Opus 4.5 vs o3-mini
Claude Opus 4.5 vs Grok 3 Beta
Claude Opus 4.5 vs Claude 3.7 Sonnet - Extended Thinking
Claude Opus 4.5 vs Llama 4 Scout
Claude Opus 4.5 vs o4-mini
Claude Opus 4.5 vs GPT-4.1
Claude Opus 4.5 vs Claude Opus 4
Claude Opus 4.5 vs GPT-OSS
Claude Opus 4.5 vs Claude Opus 4.1
Claude Opus 4.5 vs Gemini 2.5 Flash Lite
Claude Opus 4.5 vs Gemini 2.0 Pro
Claude Opus 4.5 vs Gemini 2.0 Flash
Claude Opus 4.5 vs Claude 3.7 Sonnet
Claude Opus 4.5 vs Qwen2.5-VL-32B
Claude Opus 4.5 vs GPT-4.1 Nano
Claude Opus 4.5 vs GPT-5
Claude Opus 4.5 vs Gemini 2.0 Flash Thinking
Claude Opus 4.5 vs Llama 3.3 70B Instruct
Claude Opus 4.5 vs Llama 3.1 Nemotron 70B Instruct
Claude Opus 4.5 vs Command A
Claude Opus 4.5 vs Claude Sonnet 4
Claude Opus 4.5 vs Nova Lite
Claude Opus 4.5 vs Mistral Large 2
Claude Opus 4.5 vs GLM-4.5
Claude Opus 4.5 vs Nova Micro
Claude Opus 4.5 vs GPT-4.5
Gemini 3 Pro vs GPT‑5.1
Gemini 3 Pro vs DeepSeek-R1
Gemini 3 Pro vs Nova Pro
Gemini 3 Pro vs Gemini 2.5 Pro
Gemini 3 Pro vs Llama 4 Maverick
Gemini 3 Pro vs o3
Gemini 3 Pro vs Qwen 3
Gemini 3 Pro vs Claude 3.5 Haiku
Gemini 3 Pro vs o3-mini
Gemini 3 Pro vs Grok 3 Beta
Gemini 3 Pro vs Claude 3.7 Sonnet - Extended Thinking
Gemini 3 Pro vs Llama 4 Scout
Gemini 3 Pro vs o4-mini
Gemini 3 Pro vs GPT-4.1
Gemini 3 Pro vs Claude Opus 4
Gemini 3 Pro vs GPT-OSS
Gemini 3 Pro vs Claude Opus 4.1
Gemini 3 Pro vs Gemini 2.5 Flash Lite
Gemini 3 Pro vs Gemini 2.0 Pro
Gemini 3 Pro vs Gemini 2.0 Flash
Gemini 3 Pro vs Claude 3.7 Sonnet
Gemini 3 Pro vs Qwen2.5-VL-32B
Gemini 3 Pro vs GPT-4.1 Nano
Gemini 3 Pro vs GPT-5
Gemini 3 Pro vs Gemini 2.0 Flash Thinking
Gemini 3 Pro vs Llama 3.3 70B Instruct
Gemini 3 Pro vs Llama 3.1 Nemotron 70B Instruct
Gemini 3 Pro vs Command A
Gemini 3 Pro vs Claude Sonnet 4
Gemini 3 Pro vs Nova Lite
Gemini 3 Pro vs Mistral Large 2
Gemini 3 Pro vs GLM-4.5
Gemini 3 Pro vs Nova Micro
Gemini 3 Pro vs GPT-4.5
GPT‑5.1 vs DeepSeek-R1
GPT‑5.1 vs Nova Pro
GPT‑5.1 vs Gemini 2.5 Pro
GPT‑5.1 vs Llama 4 Maverick
GPT‑5.1 vs o3
GPT‑5.1 vs Qwen 3
GPT‑5.1 vs Claude 3.5 Haiku
GPT‑5.1 vs o3-mini
GPT‑5.1 vs Grok 3 Beta
GPT‑5.1 vs Claude 3.7 Sonnet - Extended Thinking
GPT‑5.1 vs Llama 4 Scout
GPT‑5.1 vs o4-mini
GPT‑5.1 vs GPT-4.1
GPT‑5.1 vs Claude Opus 4
GPT‑5.1 vs GPT-OSS
GPT‑5.1 vs Claude Opus 4.1
GPT‑5.1 vs Gemini 2.5 Flash Lite
GPT‑5.1 vs Gemini 2.0 Pro
GPT‑5.1 vs Gemini 2.0 Flash
GPT‑5.1 vs Claude 3.7 Sonnet
GPT‑5.1 vs Qwen2.5-VL-32B
GPT‑5.1 vs GPT-4.1 Nano
GPT‑5.1 vs GPT-5
GPT‑5.1 vs Gemini 2.0 Flash Thinking
GPT‑5.1 vs Llama 3.3 70B Instruct
GPT‑5.1 vs Llama 3.1 Nemotron 70B Instruct
GPT‑5.1 vs Command A
GPT‑5.1 vs Claude Sonnet 4
GPT‑5.1 vs Nova Lite
GPT‑5.1 vs Mistral Large 2
GPT‑5.1 vs GLM-4.5
GPT‑5.1 vs Nova Micro
GPT‑5.1 vs GPT-4.5
DeepSeek-R1 vs Nova Pro
DeepSeek-R1 vs Gemini 2.5 Pro
DeepSeek-R1 vs Llama 4 Maverick
DeepSeek-R1 vs o3
DeepSeek-R1 vs Qwen 3
DeepSeek-R1 vs Claude 3.5 Haiku
DeepSeek-R1 vs o3-mini
DeepSeek-R1 vs Grok 3 Beta
DeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking
DeepSeek-R1 vs Llama 4 Scout
DeepSeek-R1 vs o4-mini
DeepSeek-R1 vs GPT-4.1
DeepSeek-R1 vs Claude Opus 4
DeepSeek-R1 vs GPT-OSS
DeepSeek-R1 vs Claude Opus 4.1
DeepSeek-R1 vs Gemini 2.5 Flash Lite
DeepSeek-R1 vs Gemini 2.0 Pro
DeepSeek-R1 vs Gemini 2.0 Flash
DeepSeek-R1 vs Claude 3.7 Sonnet
DeepSeek-R1 vs Qwen2.5-VL-32B
DeepSeek-R1 vs GPT-4.1 Nano
DeepSeek-R1 vs GPT-5
DeepSeek-R1 vs Gemini 2.0 Flash Thinking
DeepSeek-R1 vs Llama 3.3 70B Instruct
DeepSeek-R1 vs Llama 3.1 Nemotron 70B Instruct
DeepSeek-R1 vs Command A
DeepSeek-R1 vs Claude Sonnet 4
DeepSeek-R1 vs Nova Lite
DeepSeek-R1 vs Mistral Large 2
DeepSeek-R1 vs GLM-4.5
DeepSeek-R1 vs Nova Micro
DeepSeek-R1 vs GPT-4.5
Nova Pro vs Gemini 2.5 Pro
Nova Pro vs Llama 4 Maverick
Nova Pro vs o3
Nova Pro vs Qwen 3
Nova Pro vs Claude 3.5 Haiku
Nova Pro vs o3-mini
Nova Pro vs Grok 3 Beta
Nova Pro vs Claude 3.7 Sonnet - Extended Thinking
Nova Pro vs Llama 4 Scout
Nova Pro vs o4-mini
Nova Pro vs GPT-4.1
Nova Pro vs Claude Opus 4
Nova Pro vs GPT-OSS
Nova Pro vs Claude Opus 4.1
Nova Pro vs Gemini 2.5 Flash Lite
Nova Pro vs Gemini 2.0 Pro
Nova Pro vs Gemini 2.0 Flash
Nova Pro vs Claude 3.7 Sonnet
Nova Pro vs Qwen2.5-VL-32B
Nova Pro vs GPT-4.1 Nano
Nova Pro vs GPT-5
Nova Pro vs Gemini 2.0 Flash Thinking
Nova Pro vs Llama 3.3 70B Instruct
Nova Pro vs Llama 3.1 Nemotron 70B Instruct
Nova Pro vs Command A
Nova Pro vs Claude Sonnet 4
Nova Pro vs Nova Lite
Nova Pro vs Mistral Large 2
Nova Pro vs GLM-4.5
Nova Pro vs Nova Micro
Nova Pro vs GPT-4.5
Gemini 2.5 Pro vs Llama 4 Maverick
Gemini 2.5 Pro vs o3
Gemini 2.5 Pro vs Qwen 3
Gemini 2.5 Pro vs Claude 3.5 Haiku
Gemini 2.5 Pro vs o3-mini
Gemini 2.5 Pro vs Grok 3 Beta
Gemini 2.5 Pro vs Claude 3.7 Sonnet - Extended Thinking
Gemini 2.5 Pro vs Llama 4 Scout
Gemini 2.5 Pro vs o4-mini
Gemini 2.5 Pro vs GPT-4.1
Gemini 2.5 Pro vs Claude Opus 4
Gemini 2.5 Pro vs GPT-OSS
Gemini 2.5 Pro vs Claude Opus 4.1
Gemini 2.5 Pro vs Gemini 2.5 Flash Lite
Gemini 2.5 Pro vs Gemini 2.0 Pro
Gemini 2.5 Pro vs Gemini 2.0 Flash
Gemini 2.5 Pro vs Claude 3.7 Sonnet
Gemini 2.5 Pro vs Qwen2.5-VL-32B
Gemini 2.5 Pro vs GPT-4.1 Nano
Gemini 2.5 Pro vs GPT-5
Gemini 2.5 Pro vs Gemini 2.0 Flash Thinking
Gemini 2.5 Pro vs Llama 3.3 70B Instruct
Gemini 2.5 Pro vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.5 Pro vs Command A
Gemini 2.5 Pro vs Claude Sonnet 4
Gemini 2.5 Pro vs Nova Lite
Gemini 2.5 Pro vs Mistral Large 2
Gemini 2.5 Pro vs GLM-4.5
Gemini 2.5 Pro vs Nova Micro
Gemini 2.5 Pro vs GPT-4.5
Llama 4 Maverick vs o3
Llama 4 Maverick vs Qwen 3
Llama 4 Maverick vs Claude 3.5 Haiku
Llama 4 Maverick vs o3-mini
Llama 4 Maverick vs Grok 3 Beta
Llama 4 Maverick vs Claude 3.7 Sonnet - Extended Thinking
Llama 4 Maverick vs Llama 4 Scout
Llama 4 Maverick vs o4-mini
Llama 4 Maverick vs GPT-4.1
Llama 4 Maverick vs Claude Opus 4
Llama 4 Maverick vs GPT-OSS
Llama 4 Maverick vs Claude Opus 4.1
Llama 4 Maverick vs Gemini 2.5 Flash Lite
Llama 4 Maverick vs Gemini 2.0 Pro
Llama 4 Maverick vs Gemini 2.0 Flash
Llama 4 Maverick vs Claude 3.7 Sonnet
Llama 4 Maverick vs Qwen2.5-VL-32B
Llama 4 Maverick vs GPT-4.1 Nano
Llama 4 Maverick vs GPT-5
Llama 4 Maverick vs Gemini 2.0 Flash Thinking
Llama 4 Maverick vs Llama 3.3 70B Instruct
Llama 4 Maverick vs Llama 3.1 Nemotron 70B Instruct
Llama 4 Maverick vs Command A
Llama 4 Maverick vs Claude Sonnet 4
Llama 4 Maverick vs Nova Lite
Llama 4 Maverick vs Mistral Large 2
Llama 4 Maverick vs GLM-4.5
Llama 4 Maverick vs Nova Micro
Llama 4 Maverick vs GPT-4.5
o3 vs Qwen 3
o3 vs Claude 3.5 Haiku
o3 vs o3-mini
o3 vs Grok 3 Beta
o3 vs Claude 3.7 Sonnet - Extended Thinking
o3 vs Llama 4 Scout
o3 vs o4-mini
o3 vs GPT-4.1
o3 vs Claude Opus 4
o3 vs GPT-OSS
o3 vs Claude Opus 4.1
o3 vs Gemini 2.5 Flash Lite
o3 vs Gemini 2.0 Pro
o3 vs Gemini 2.0 Flash
o3 vs Claude 3.7 Sonnet
o3 vs Qwen2.5-VL-32B
o3 vs GPT-4.1 Nano
o3 vs GPT-5
o3 vs Gemini 2.0 Flash Thinking
o3 vs Llama 3.3 70B Instruct
o3 vs Llama 3.1 Nemotron 70B Instruct
o3 vs Command A
o3 vs Claude Sonnet 4
o3 vs Nova Lite
o3 vs Mistral Large 2
o3 vs GLM-4.5
o3 vs Nova Micro
o3 vs GPT-4.5
Qwen 3 vs Claude 3.5 Haiku
Qwen 3 vs o3-mini
Qwen 3 vs Grok 3 Beta
Qwen 3 vs Claude 3.7 Sonnet - Extended Thinking
Qwen 3 vs Llama 4 Scout
Qwen 3 vs o4-mini
Qwen 3 vs GPT-4.1
Qwen 3 vs Claude Opus 4
Qwen 3 vs GPT-OSS
Qwen 3 vs Claude Opus 4.1
Qwen 3 vs Gemini 2.5 Flash Lite
Qwen 3 vs Gemini 2.0 Pro
Qwen 3 vs Gemini 2.0 Flash
Qwen 3 vs Claude 3.7 Sonnet
Qwen 3 vs Qwen2.5-VL-32B
Qwen 3 vs GPT-4.1 Nano
Qwen 3 vs GPT-5
Qwen 3 vs Gemini 2.0 Flash Thinking
Qwen 3 vs Llama 3.3 70B Instruct
Qwen 3 vs Llama 3.1 Nemotron 70B Instruct
Qwen 3 vs Command A
Qwen 3 vs Claude Sonnet 4
Qwen 3 vs Nova Lite
Qwen 3 vs Mistral Large 2
Qwen 3 vs GLM-4.5
Qwen 3 vs Nova Micro
Qwen 3 vs GPT-4.5
Claude 3.5 Haiku vs o3-mini
Claude 3.5 Haiku vs Grok 3 Beta
Claude 3.5 Haiku vs Claude 3.7 Sonnet - Extended Thinking
Claude 3.5 Haiku vs Llama 4 Scout
Claude 3.5 Haiku vs o4-mini
Claude 3.5 Haiku vs GPT-4.1
Claude 3.5 Haiku vs Claude Opus 4
Claude 3.5 Haiku vs GPT-OSS
Claude 3.5 Haiku vs Claude Opus 4.1
Claude 3.5 Haiku vs Gemini 2.5 Flash Lite
Claude 3.5 Haiku vs Gemini 2.0 Pro
Claude 3.5 Haiku vs Gemini 2.0 Flash
Claude 3.5 Haiku vs Claude 3.7 Sonnet
Claude 3.5 Haiku vs Qwen2.5-VL-32B
Claude 3.5 Haiku vs GPT-4.1 Nano
Claude 3.5 Haiku vs GPT-5
Claude 3.5 Haiku vs Gemini 2.0 Flash Thinking
Claude 3.5 Haiku vs Llama 3.3 70B Instruct
Claude 3.5 Haiku vs Llama 3.1 Nemotron 70B Instruct
Claude 3.5 Haiku vs Command A
Claude 3.5 Haiku vs Claude Sonnet 4
Claude 3.5 Haiku vs Nova Lite
Claude 3.5 Haiku vs Mistral Large 2
Claude 3.5 Haiku vs GLM-4.5
Claude 3.5 Haiku vs Nova Micro
Claude 3.5 Haiku vs GPT-4.5
o3-mini vs Grok 3 Beta
o3-mini vs Claude 3.7 Sonnet - Extended Thinking
o3-mini vs Llama 4 Scout
o3-mini vs o4-mini
o3-mini vs GPT-4.1
o3-mini vs Claude Opus 4
o3-mini vs GPT-OSS
o3-mini vs Claude Opus 4.1
o3-mini vs Gemini 2.5 Flash Lite
o3-mini vs Gemini 2.0 Pro
o3-mini vs Gemini 2.0 Flash
o3-mini vs Claude 3.7 Sonnet
o3-mini vs Qwen2.5-VL-32B
o3-mini vs GPT-4.1 Nano
o3-mini vs GPT-5
o3-mini vs Gemini 2.0 Flash Thinking
o3-mini vs Llama 3.3 70B Instruct
o3-mini vs Llama 3.1 Nemotron 70B Instruct
o3-mini vs Command A
o3-mini vs Claude Sonnet 4
o3-mini vs Nova Lite
o3-mini vs Mistral Large 2
o3-mini vs GLM-4.5
o3-mini vs Nova Micro
o3-mini vs GPT-4.5
Grok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking
Grok 3 Beta vs Llama 4 Scout
Grok 3 Beta vs o4-mini
Grok 3 Beta vs GPT-4.1
Grok 3 Beta vs Claude Opus 4
Grok 3 Beta vs GPT-OSS
Grok 3 Beta vs Claude Opus 4.1
Grok 3 Beta vs Gemini 2.5 Flash Lite
Grok 3 Beta vs Gemini 2.0 Pro
Grok 3 Beta vs Gemini 2.0 Flash
Grok 3 Beta vs Claude 3.7 Sonnet
Grok 3 Beta vs Qwen2.5-VL-32B
Grok 3 Beta vs GPT-4.1 Nano
Grok 3 Beta vs GPT-5
Grok 3 Beta vs Gemini 2.0 Flash Thinking
Grok 3 Beta vs Llama 3.3 70B Instruct
Grok 3 Beta vs Llama 3.1 Nemotron 70B Instruct
Grok 3 Beta vs Command A
Grok 3 Beta vs Claude Sonnet 4
Grok 3 Beta vs Nova Lite
Grok 3 Beta vs Mistral Large 2
Grok 3 Beta vs GLM-4.5
Grok 3 Beta vs Nova Micro
Grok 3 Beta vs GPT-4.5
Claude 3.7 Sonnet - Extended Thinking vs Llama 4 Scout
Claude 3.7 Sonnet - Extended Thinking vs o4-mini
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1
Claude 3.7 Sonnet - Extended Thinking vs Claude Opus 4
Claude 3.7 Sonnet - Extended Thinking vs GPT-OSS
Claude 3.7 Sonnet - Extended Thinking vs Claude Opus 4.1
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.5 Flash Lite
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Pro
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Flash
Claude 3.7 Sonnet - Extended Thinking vs Claude 3.7 Sonnet
Claude 3.7 Sonnet - Extended Thinking vs Qwen2.5-VL-32B
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1 Nano
Claude 3.7 Sonnet - Extended Thinking vs GPT-5
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Flash Thinking
Claude 3.7 Sonnet - Extended Thinking vs Llama 3.3 70B Instruct
Claude 3.7 Sonnet - Extended Thinking vs Llama 3.1 Nemotron 70B Instruct
Claude 3.7 Sonnet - Extended Thinking vs Command A
Claude 3.7 Sonnet - Extended Thinking vs Claude Sonnet 4
Claude 3.7 Sonnet - Extended Thinking vs Nova Lite
Claude 3.7 Sonnet - Extended Thinking vs Mistral Large 2
Claude 3.7 Sonnet - Extended Thinking vs GLM-4.5
Claude 3.7 Sonnet - Extended Thinking vs Nova Micro
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.5
Llama 4 Scout vs o4-mini
Llama 4 Scout vs GPT-4.1
Llama 4 Scout vs Claude Opus 4
Llama 4 Scout vs GPT-OSS
Llama 4 Scout vs Claude Opus 4.1
Llama 4 Scout vs Gemini 2.5 Flash Lite
Llama 4 Scout vs Gemini 2.0 Pro
Llama 4 Scout vs Gemini 2.0 Flash
Llama 4 Scout vs Claude 3.7 Sonnet
Llama 4 Scout vs Qwen2.5-VL-32B
Llama 4 Scout vs GPT-4.1 Nano
Llama 4 Scout vs GPT-5
Llama 4 Scout vs Gemini 2.0 Flash Thinking
Llama 4 Scout vs Llama 3.3 70B Instruct
Llama 4 Scout vs Llama 3.1 Nemotron 70B Instruct
Llama 4 Scout vs Command A
Llama 4 Scout vs Claude Sonnet 4
Llama 4 Scout vs Nova Lite
Llama 4 Scout vs Mistral Large 2
Llama 4 Scout vs GLM-4.5
Llama 4 Scout vs Nova Micro
Llama 4 Scout vs GPT-4.5
o4-mini vs GPT-4.1
o4-mini vs Claude Opus 4
o4-mini vs GPT-OSS
o4-mini vs Claude Opus 4.1
o4-mini vs Gemini 2.5 Flash Lite
o4-mini vs Gemini 2.0 Pro
o4-mini vs Gemini 2.0 Flash
o4-mini vs Claude 3.7 Sonnet
o4-mini vs Qwen2.5-VL-32B
o4-mini vs GPT-4.1 Nano
o4-mini vs GPT-5
o4-mini vs Gemini 2.0 Flash Thinking
o4-mini vs Llama 3.3 70B Instruct
o4-mini vs Llama 3.1 Nemotron 70B Instruct
o4-mini vs Command A
o4-mini vs Claude Sonnet 4
o4-mini vs Nova Lite
o4-mini vs Mistral Large 2
o4-mini vs GLM-4.5
o4-mini vs Nova Micro
o4-mini vs GPT-4.5
GPT-4.1 vs Claude Opus 4
GPT-4.1 vs GPT-OSS
GPT-4.1 vs Claude Opus 4.1
GPT-4.1 vs Gemini 2.5 Flash Lite
GPT-4.1 vs Gemini 2.0 Pro
GPT-4.1 vs Gemini 2.0 Flash
GPT-4.1 vs Claude 3.7 Sonnet
GPT-4.1 vs Qwen2.5-VL-32B
GPT-4.1 vs GPT-4.1 Nano
GPT-4.1 vs GPT-5
GPT-4.1 vs Gemini 2.0 Flash Thinking
GPT-4.1 vs Llama 3.3 70B Instruct
GPT-4.1 vs Llama 3.1 Nemotron 70B Instruct
GPT-4.1 vs Command A
GPT-4.1 vs Claude Sonnet 4
GPT-4.1 vs Nova Lite
GPT-4.1 vs Mistral Large 2
GPT-4.1 vs GLM-4.5
GPT-4.1 vs Nova Micro
GPT-4.1 vs GPT-4.5
Claude Opus 4 vs GPT-OSS
Claude Opus 4 vs Claude Opus 4.1
Claude Opus 4 vs Gemini 2.5 Flash Lite
Claude Opus 4 vs Gemini 2.0 Pro
Claude Opus 4 vs Gemini 2.0 Flash
Claude Opus 4 vs Claude 3.7 Sonnet
Claude Opus 4 vs Qwen2.5-VL-32B
Claude Opus 4 vs GPT-4.1 Nano
Claude Opus 4 vs GPT-5
Claude Opus 4 vs Gemini 2.0 Flash Thinking
Claude Opus 4 vs Llama 3.3 70B Instruct
Claude Opus 4 vs Llama 3.1 Nemotron 70B Instruct
Claude Opus 4 vs Command A
Claude Opus 4 vs Claude Sonnet 4
Claude Opus 4 vs Nova Lite
Claude Opus 4 vs Mistral Large 2
Claude Opus 4 vs GLM-4.5
Claude Opus 4 vs Nova Micro
Claude Opus 4 vs GPT-4.5
GPT-OSS vs Claude Opus 4.1
GPT-OSS vs Gemini 2.5 Flash Lite
GPT-OSS vs Gemini 2.0 Pro
GPT-OSS vs Gemini 2.0 Flash
GPT-OSS vs Claude 3.7 Sonnet
GPT-OSS vs Qwen2.5-VL-32B
GPT-OSS vs GPT-4.1 Nano
GPT-OSS vs GPT-5
GPT-OSS vs Gemini 2.0 Flash Thinking
GPT-OSS vs Llama 3.3 70B Instruct
GPT-OSS vs Llama 3.1 Nemotron 70B Instruct
GPT-OSS vs Command A
GPT-OSS vs Claude Sonnet 4
GPT-OSS vs Nova Lite
GPT-OSS vs Mistral Large 2
GPT-OSS vs GLM-4.5
GPT-OSS vs Nova Micro
GPT-OSS vs GPT-4.5
Claude Opus 4.1 vs Gemini 2.5 Flash Lite
Claude Opus 4.1 vs Gemini 2.0 Pro
Claude Opus 4.1 vs Gemini 2.0 Flash
Claude Opus 4.1 vs Claude 3.7 Sonnet
Claude Opus 4.1 vs Qwen2.5-VL-32B
Claude Opus 4.1 vs GPT-4.1 Nano
Claude Opus 4.1 vs GPT-5
Claude Opus 4.1 vs Gemini 2.0 Flash Thinking
Claude Opus 4.1 vs Llama 3.3 70B Instruct
Claude Opus 4.1 vs Llama 3.1 Nemotron 70B Instruct
Claude Opus 4.1 vs Command A
Claude Opus 4.1 vs Claude Sonnet 4
Claude Opus 4.1 vs Nova Lite
Claude Opus 4.1 vs Mistral Large 2
Claude Opus 4.1 vs GLM-4.5
Claude Opus 4.1 vs Nova Micro
Claude Opus 4.1 vs GPT-4.5
Gemini 2.5 Flash Lite vs Gemini 2.0 Pro
Gemini 2.5 Flash Lite vs Gemini 2.0 Flash
Gemini 2.5 Flash Lite vs Claude 3.7 Sonnet
Gemini 2.5 Flash Lite vs Qwen2.5-VL-32B
Gemini 2.5 Flash Lite vs GPT-4.1 Nano
Gemini 2.5 Flash Lite vs GPT-5
Gemini 2.5 Flash Lite vs Gemini 2.0 Flash Thinking
Gemini 2.5 Flash Lite vs Llama 3.3 70B Instruct
Gemini 2.5 Flash Lite vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.5 Flash Lite vs Command A
Gemini 2.5 Flash Lite vs Claude Sonnet 4
Gemini 2.5 Flash Lite vs Nova Lite
Gemini 2.5 Flash Lite vs Mistral Large 2
Gemini 2.5 Flash Lite vs GLM-4.5
Gemini 2.5 Flash Lite vs Nova Micro
Gemini 2.5 Flash Lite vs GPT-4.5
Gemini 2.0 Pro vs Gemini 2.0 Flash
Gemini 2.0 Pro vs Claude 3.7 Sonnet
Gemini 2.0 Pro vs Qwen2.5-VL-32B
Gemini 2.0 Pro vs GPT-4.1 Nano
Gemini 2.0 Pro vs GPT-5
Gemini 2.0 Pro vs Gemini 2.0 Flash Thinking
Gemini 2.0 Pro vs Llama 3.3 70B Instruct
Gemini 2.0 Pro vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Pro vs Command A
Gemini 2.0 Pro vs Claude Sonnet 4
Gemini 2.0 Pro vs Nova Lite
Gemini 2.0 Pro vs Mistral Large 2
Gemini 2.0 Pro vs GLM-4.5
Gemini 2.0 Pro vs Nova Micro
Gemini 2.0 Pro vs GPT-4.5
Gemini 2.0 Flash vs Claude 3.7 Sonnet
Gemini 2.0 Flash vs Qwen2.5-VL-32B
Gemini 2.0 Flash vs GPT-4.1 Nano
Gemini 2.0 Flash vs GPT-5
Gemini 2.0 Flash vs Gemini 2.0 Flash Thinking
Gemini 2.0 Flash vs Llama 3.3 70B Instruct
Gemini 2.0 Flash vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Flash vs Command A
Gemini 2.0 Flash vs Claude Sonnet 4
Gemini 2.0 Flash vs Nova Lite
Gemini 2.0 Flash vs Mistral Large 2
Gemini 2.0 Flash vs GLM-4.5
Gemini 2.0 Flash vs Nova Micro
Gemini 2.0 Flash vs GPT-4.5
Claude 3.7 Sonnet vs Qwen2.5-VL-32B
Claude 3.7 Sonnet vs GPT-4.1 Nano
Claude 3.7 Sonnet vs GPT-5
Claude 3.7 Sonnet vs Gemini 2.0 Flash Thinking
Claude 3.7 Sonnet vs Llama 3.3 70B Instruct
Claude 3.7 Sonnet vs Llama 3.1 Nemotron 70B Instruct
Claude 3.7 Sonnet vs Command A
Claude 3.7 Sonnet vs Claude Sonnet 4
Claude 3.7 Sonnet vs Nova Lite
Claude 3.7 Sonnet vs Mistral Large 2
Claude 3.7 Sonnet vs GLM-4.5
Claude 3.7 Sonnet vs Nova Micro
Claude 3.7 Sonnet vs GPT-4.5
Qwen2.5-VL-32B vs GPT-4.1 Nano
Qwen2.5-VL-32B vs GPT-5
Qwen2.5-VL-32B vs Gemini 2.0 Flash Thinking
Qwen2.5-VL-32B vs Llama 3.3 70B Instruct
Qwen2.5-VL-32B vs Llama 3.1 Nemotron 70B Instruct
Qwen2.5-VL-32B vs Command A
Qwen2.5-VL-32B vs Claude Sonnet 4
Qwen2.5-VL-32B vs Nova Lite
Qwen2.5-VL-32B vs Mistral Large 2
Qwen2.5-VL-32B vs GLM-4.5
Qwen2.5-VL-32B vs Nova Micro
Qwen2.5-VL-32B vs GPT-4.5
GPT-4.1 Nano vs GPT-5
GPT-4.1 Nano vs Gemini 2.0 Flash Thinking
GPT-4.1 Nano vs Llama 3.3 70B Instruct
GPT-4.1 Nano vs Llama 3.1 Nemotron 70B Instruct
GPT-4.1 Nano vs Command A
GPT-4.1 Nano vs Claude Sonnet 4
GPT-4.1 Nano vs Nova Lite
GPT-4.1 Nano vs Mistral Large 2
GPT-4.1 Nano vs GLM-4.5
GPT-4.1 Nano vs Nova Micro
GPT-4.1 Nano vs GPT-4.5
GPT-5 vs Gemini 2.0 Flash Thinking
GPT-5 vs Llama 3.3 70B Instruct
GPT-5 vs Llama 3.1 Nemotron 70B Instruct
GPT-5 vs Command A
GPT-5 vs Claude Sonnet 4
GPT-5 vs Nova Lite
GPT-5 vs Mistral Large 2
GPT-5 vs GLM-4.5
GPT-5 vs Nova Micro
GPT-5 vs GPT-4.5
Gemini 2.0 Flash Thinking vs Llama 3.3 70B Instruct
Gemini 2.0 Flash Thinking vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Flash Thinking vs Command A
Gemini 2.0 Flash Thinking vs Claude Sonnet 4
Gemini 2.0 Flash Thinking vs Nova Lite
Gemini 2.0 Flash Thinking vs Mistral Large 2
Gemini 2.0 Flash Thinking vs GLM-4.5
Gemini 2.0 Flash Thinking vs Nova Micro
Gemini 2.0 Flash Thinking vs GPT-4.5
Llama 3.3 70B Instruct vs Llama 3.1 Nemotron 70B Instruct
Llama 3.3 70B Instruct vs Command A
Llama 3.3 70B Instruct vs Claude Sonnet 4
Llama 3.3 70B Instruct vs Nova Lite
Llama 3.3 70B Instruct vs Mistral Large 2
Llama 3.3 70B Instruct vs GLM-4.5
Llama 3.3 70B Instruct vs Nova Micro
Llama 3.3 70B Instruct vs GPT-4.5
Llama 3.1 Nemotron 70B Instruct vs Command A
Llama 3.1 Nemotron 70B Instruct vs Claude Sonnet 4
Llama 3.1 Nemotron 70B Instruct vs Nova Lite
Llama 3.1 Nemotron 70B Instruct vs Mistral Large 2
Llama 3.1 Nemotron 70B Instruct vs GLM-4.5
Llama 3.1 Nemotron 70B Instruct vs Nova Micro
Llama 3.1 Nemotron 70B Instruct vs GPT-4.5
Command A vs Claude Sonnet 4
Command A vs Nova Lite
Command A vs Mistral Large 2
Command A vs GLM-4.5
Command A vs Nova Micro
Command A vs GPT-4.5
Claude Sonnet 4 vs Nova Lite
Claude Sonnet 4 vs Mistral Large 2
Claude Sonnet 4 vs GLM-4.5
Claude Sonnet 4 vs Nova Micro
Claude Sonnet 4 vs GPT-4.5
Nova Lite vs Mistral Large 2
Nova Lite vs GLM-4.5
Nova Lite vs Nova Micro
Nova Lite vs GPT-4.5
Mistral Large 2 vs GLM-4.5
Mistral Large 2 vs Nova Micro
Mistral Large 2 vs GPT-4.5
GLM-4.5 vs Nova Micro
GLM-4.5 vs GPT-4.5
Nova Micro vs GPT-4.5

Compare LLMs
GPT‑5.1 vs DeepSeek-R1

GPT‑5.1

DeepSeek-R1

MathArena ?

Compare LLMs

Add a Comment

Compare LLMsGPT‑5.1 vs DeepSeek-R1

GPT‑5.1

DeepSeek-R1

MathArena ?

Compare LLMs

Add a Comment

Compare LLMs
GPT‑5.1 vs DeepSeek-R1