현대 언어 모델(LLM) 카탈로그 Ξ 기능 및 특성 비교

AI 모델 순위

언어 모델	제공자 ?	평점	출시일 ?	지식 업데이트 종료일 ?	오픈 소스 ?	API 제공자 ?	모달리티 ?	입력 가격 ?	출력 가격 ?	MMLU ?	MMLU-Pro ?	MMMU ?	HellaSwag ?	HumanEval ?	MATH ?	GPQA ?	IFEval ?	모바일 앱
Grok 4	xAI	⭐️ 4.4	7월 09, 2025	-	아니오	xAI	텍스트 ? 이미지 ? 음성 ? 비디오 ?	$3.00 100만 토큰당	$15.00 100만 토큰당	-	-	-	-	-	-	87.5% Science 출처	-	Google Play Apple Apps
Claude Opus 4.5	Anthropic	⭐️ 4.4	11월 24, 2025	알 수 없음	아니오	Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform	텍스트 ? 이미지 ?	$5 100만 토큰당	$25 100만 토큰당	90.8% 출처	-	80.7% Validation 출처	-	-	-	87% Diamond 출처	-	Google Play Apple Apps
Gemini 3 Pro	Google	⭐️ 4.4	11월 22, 2025	2025-01	아니오	Google AI Studio, Vertex AI, Gemini app	텍스트 ? 이미지 ? 음성 ? 비디오 ?	$2 100만 토큰당	$12 100만 토큰당	-	-	81% Pro 출처	-	-	-	91.9% Diamond, Scientific knowledge, No tools 출처	-	Google Play Apple Apps
GPT‑5.1	OpenAI	⭐️ 4.3	11월 13, 2025	06.2025	아니오	OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)	텍스트 ? 이미지 ?	$1.25 100만 토큰당	$10.00 100만 토큰당	-	78.4% 출처	85.4% 출처	-	-	-	88.1% Diamond 출처	-	Google Play Apple Apps
DeepSeek-R1	DeepSeek	⭐️ 4.2	1월 21, 2025	알 수 없음	예	DeepSeek, HuggingFace	텍스트 ?	$0.55 100만 토큰당	$2.19 100만 토큰당	90.8% Pass@1 출처	84% EM 출처	-	-	-	-	71.5% Pass@1 출처	83.3% Prompt Strict 출처	Google Play Apple Apps
Nova Pro	Amazon	⭐️ 4.2	12월 02, 2024	의도적으로 공개되지 않음	아니오	Amazon Bedrock	텍스트 ? 이미지 ? 비디오 ?	$0.80 100만 토큰당	$3.20 100만 토큰당	85.9% CoT 출처	정보 없음	정보 없음	정보 없음	89% pass@1 출처	76.6% CoT 출처	46.9% Main 출처	92.1% 출처	-
Gemini 2.5 Pro	Google	⭐️ 4.2	3월 25, 2025	-	아니오	Google AI Studio, Vertex AI, Gemini app	텍스트 ? 이미지 ? 음성 ? 비디오 ?	정보 없음	정보 없음	정보 없음	정보 없음	81.7% 출처	정보 없음	정보 없음	정보 없음	84.0% Diamond Science 출처	정보 없음	Google Play Apple Apps
Llama 4 Maverick	Meta	⭐️ 4.2	4월 05, 2025	2024-08	예 (출처)	Meta AI, Hugging Face, Fireworks, Together, DeepInfra	텍스트 ? 이미지 ? 비디오 ?	정보 없음	정보 없음	정보 없음	80.5% 출처	73.4% 출처	정보 없음	정보 없음	정보 없음	69.8% Diamond 출처	정보 없음	-
o3	OpenAI	⭐️ 4.2	4월 16, 2025	-	아니오	OpenAI API	텍스트 ? 이미지 ?	$10.00 100만 토큰당	$40.00 100만 토큰당	82.9% 출처	-	-	-	-	-	83.3% Diamond, no tools 출처	-	Google Play Apple Apps
Qwen 3	Alibaba	⭐️ 4.2	4월 29, 2025	-	예 (출처)	-	-	-	-	-	-	-	-	-	-	-	-	-
Claude 3.5 Haiku	Anthropic	⭐️ 4.1	11월 04, 2024	01.04.2024	아니오	Anthropic, AWS Bedrock, Vertex AI	텍스트 ?	$0.80 100만 토큰당	$4.00	정보 없음	65% 0-shot CoT 출처	정보 없음	정보 없음	88.1% 0-shot 출처	69.4% 0-shot CoT 출처	정보 없음	정보 없음	Google Play Apple Apps
o3-mini	OpenAI	⭐️ 4.1	1월 31, 2025	알 수 없음	아니오	OpenAI API	텍스트 ?	$1.10 100만 토큰당	$4.40 100만 토큰당	86.9% pass@1, high effort 출처	정보 없음	정보 없음	정보 없음	정보 없음	97.9% pass@1, high effort 출처	79.7% 0-shot, high effort 출처	정보 없음	Google Play Apple Apps
Grok 3 Beta	xAI	⭐️ 4.1	1월 19, 2025	2025-01	아니오	xAI	텍스트 ? 이미지 ? 비디오 ?	정보 없음	정보 없음	정보 없음	79.9% Base model 출처	78% With Think mode 출처	정보 없음	정보 없음	정보 없음	84.6% With Think mode, Diamond 출처	정보 없음	Google Play Apple Apps
Claude 3.7 Sonnet - Extended Thinking	Anthropic	⭐️ 4.1	2월 24, 2025	-	아니오	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI	텍스트 ? 이미지 ?	$3.00 100만 토큰당	$15.00 100만 토큰당	정보 없음	정보 없음	75% 출처	정보 없음	정보 없음	96.2% 출처	84.8% Diamond 출처	93.2% 출처	Google Play Apple Apps
Llama 4 Scout	Meta	⭐️ 4.1	4월 05, 2025	2025-04	예 (출처)	Meta AI, Hugging Face, Fireworks, Together, DeepInfra	텍스트 ? 이미지 ? 비디오 ?	정보 없음	정보 없음	정보 없음	74.3% Reasoning & Knowledge 출처	69.4% Image Reasoning 출처	정보 없음	정보 없음	정보 없음	57.2% Diamond 출처	정보 없음	-
o4-mini	OpenAI	⭐️ 4.1	4월 16, 2025	-	아니오	OpenAI API	텍스트 ? 이미지 ?	$1.10 100만 토큰당	$4.40 100만 토큰당	fort	-	81.6% 출처	-	14.28% 출처	-	81.4% 출처	-	Google Play Apple Apps
GPT-4.1	OpenAI	⭐️ 4.1	4월 14, 2025	-	아니오	OpenAI API	텍스트 ? 이미지 ?	$2.00 100만 토큰당	$8.00 100만 토큰당	90.2% pass@1 출처	-	74.8% 출처	-	-	-	66.3% Diamond 출처	-	Google Play Apple Apps
Claude Opus 4	Anthropic	⭐️ 4.1	5월 22, 2025	알 수 없음	아니오	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI	텍스트 ? 이미지 ?	$15	$75 100만 토큰당	88.8% 출처	-	76.5% 출처	-	-	-	79.6% Diamond 출처	-	Google Play Apple Apps
GPT-OSS	OpenAI	⭐️ 4.1	8월 05, 2025	-	예	Self-hosted, Hugging Face, AWS, Azure, Databricks	텍스트 ?	$0.15 100만 토큰당	$0.60 100만 토큰당	82.7% 출처	-	-	-	-	-	80.1% Diamond 출처	-	-
Claude Opus 4.1	Anthropic	⭐️ 4.1	8월 05, 2025	-	아니오	Anthropic API, Claude Code, Amazon Bedrock, Vertex AI, GitHub Copilot	텍스트 ? 이미지 ?	$15 100만 토큰당	$75 100만 토큰당	89.5% 출처	-	77.1% 출처	-	-	-	80.9% Diamond 출처	-	Google Play Apple Apps
Gemini 2.5 Flash Lite	Google	⭐️ 4.1	6월 17, 2025	-	아니오	Google AI Studio, Vertex AI, Gemini app	텍스트 ? 이미지 ? 음성 ? 비디오 ?	$0.10 100만 토큰당	$0.40 100만 토큰당	81.1% 출처	-	72.9% 출처	-	-	-	64.6% Diamond 출처	-	Google Play Apple Apps
Gemini 2.0 Pro	Google	⭐️ 4	12월 11, 2024	08.2024	아니오	Google AI Studio, Vertex AI	텍스트 ? 이미지 ? 음성 ? 비디오 ?	$0.10 100만 토큰당	$0.40 100만 토큰당	정보 없음	79.1% 출처	72.7% 출처	정보 없음	정보 없음	91.8% 출처	64.7% Diamond 출처	정보 없음	Google Play Apple Apps
Gemini 2.0 Flash	Google	⭐️ 4	12월 11, 2024	08.2024	아니오	Google AI Studio, Vertex AI	텍스트 ? 이미지 ? 음성 ? 비디오 ?	$0.10 100만 토큰당	$0.40 100만 토큰당	정보 없음	77.6% 출처	71.7% 출처	정보 없음	정보 없음	90.9% 출처	60.1% Diamond 출처	정보 없음	Google Play Apple Apps
Claude 3.7 Sonnet	Anthropic	⭐️ 4	2월 24, 2025	-	아니오	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI	텍스트 ? 이미지 ?	$3.00 100만 토큰당	$15.00 100만 토큰당	정보 없음	정보 없음	71.8% 출처	정보 없음	정보 없음	82.2% 출처	68% Diamond 출처	90.8% 출처	Google Play Apple Apps
Qwen2.5-VL-32B	Alibaba	⭐️ 4	3월 25, 2025	알 수 없음	예 (출처)	-	텍스트 ? 이미지 ? 비디오 ?	$0	$0	78.4% 출처	49.5%	70%	정보 없음	정보 없음	82.2%	46.0% Diamond	정보 없음	-
GPT-4.1 Nano	OpenAI	⭐️ 4	4월 14, 2025	-	아니오	OpenAI API	텍스트 ? 이미지 ?	$0.10 100만 토큰당	$0.40 100만 토큰당	80.1% 출처	-	55.4% 출처	-	-	-	50.3% Diamond 출처	74.5% 출처	Google Play Apple Apps
GPT-5	OpenAI	⭐️ 4	8월 07, 2025	-	아니오	OpenAI API	텍스트 ? 이미지 ? 음성 ? 비디오 ?	-	-	-	-	84.2% 출처	-	24.8% Full Set 출처	-	85.7% Diamond 출처	-	-
Gemini 2.0 Flash Thinking	Google	⭐️ 3.9	12월 19, 2024	04.2024	아니오	Google AI Studio, Vertex AI, Gemini API	텍스트 ? 이미지 ?	정보 없음	정보 없음	정보 없음	정보 없음	75.4% 출처	정보 없음	정보 없음	정보 없음	74.2% Diamond Science 출처	정보 없음	Google Play Apple Apps
Llama 3.3 70B Instruct	Meta	⭐️ 3.9	12월 06, 2024	12.2024	예	Fireworks, Together, DeepInfra, Hyperbolic	텍스트 ?	$0.23 100만 토큰당	$0.40 100만 토큰당	86% 0-shot, CoT 출처	68.9% 5-shot, CoT 출처	정보 없음	정보 없음	88.4% pass@1 출처	77% 0-shot, CoT 출처	50.5% 0-shot, CoT 출처	92.1% 출처	-
Llama 3.1 Nemotron 70B Instruct	NVIDIA	⭐️ 3.9	10월 15, 2023	-	예	OpenRouter	텍스트 ?	$0.35 100만 토큰당	$0.40 100만 토큰당	85% 5-shot 출처	정보 없음	정보 없음	정보 없음	75% 출처	71% 출처	정보 없음	정보 없음	-
Command A	Cohere	⭐️ 3.9	3월 14, 2025	-	예	Cohere, Hugging Face, Major cloud providers	텍스트 ?	$2.50 100만 토큰당	$10.00 100만 토큰당	85.5% 출처	정보 없음	정보 없음	정보 없음	정보 없음	80% 출처	50.8% 출처	90.9% 출처	-
Claude Sonnet 4	Anthropic	⭐️ 3.9	5월 22, 2025	알 수 없음	아니오	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI	텍스트 ? 이미지 ?	$3 100만 토큰당	$15 100만 토큰당	86.5% 출처	-	74.4% 출처	-	-	-	75.4% Diamond 출처	-	Google Play Apple Apps
Nova Lite	Amazon	⭐️ 3.8	12월 02, 2024	의도적으로 공개되지 않음	아니오	Amazon Bedrock	텍스트 ? 이미지 ? 비디오 ?	$0.06 100만 토큰당	$0.24 100만 토큰당	80.5% CoT 출처	정보 없음	정보 없음	정보 없음	85.4% pass@1 출처	73.3% CoT 출처	42% Main 출처	89.7% 출처	-
Mistral Large 2	Mistral AI	⭐️ 3.8	6월 24, 2024	알 수 없음	예	Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex	텍스트 ?	$3.00 100만 토큰당	$9.00 100만 토큰당	84% 5-shot 출처	50.69% 출처	정보 없음	정보 없음	정보 없음	1.13% 출처	24.94%	84.01%	-
GLM-4.5	Zhipu AI	⭐️ 3.8	7월 01, 2025	알 수 없음	예	Zhipu AI	텍스트 ?	-	-	84.6% Academic Knowledge 출처	-	-	-	-	-	-	-	-
Nova Micro	Amazon	⭐️ 3.6	12월 02, 2024	의도적으로 공개되지 않음	아니오	Amazon Bedrock	텍스트 ?	$0.04 100만 토큰당	$0.14 100만 토큰당	77.6% CoT 출처	-	-	-	81.1% pass@1 출처	69.3% CoT 출처	40% Main 출처	87.2% 출처	-
GPT-4.5	OpenAI	⭐️ 3.4	2월 27, 2025	2023-10	아니오	OpenAI, Azure OpenAI Service	텍스트 ? 이미지 ?	$75.00 100만 토큰당	$150.00 100만 토큰당	정보 없음	정보 없음	74.4% 출처	정보 없음	정보 없음	정보 없음	71.4% science 출처	정보 없음	Google Play Apple Apps

VideoGameBench Leaderboard ?

Source: https://www.vgbench.com/
언어 모델	총점	Doom II	Kirby's Dream Land (DX)	Link's Awakening (DX)	Civilization I	Pokemon Crystal	The Need for Speed	The Incredible Machine	Secret Game 1	Secret Game 2	Secret Game 3
VG-Agent + Gemini 2.0 Flash	0%	0%	0%	0%	0%	0%	0%	0%	0%	0%	0%
VG-Agent + Llama 4 Maverick	0%	0%	0%	0%	0%	0%	0%	0%	%0	0%	0%
VG-Agent + Claude 3.7 Sonnet	0%	0%	0%	0%	0%	0%	0%	0%	0%	0%	0%
VG-Agent + Gemini 2.5 Pro	0.48%	0%	4.8%	0%	0%	0%	0%	0%	0%	0%	0%

Source: https://matharena.ai/
언어 모델	평균 점수	AIME 2025 ?	HMMT February 2025 ?	BRUMO 2025	SMT 2025 ?	CMIMC 2025 ?
Grok 4	89%	91%	92%	95%	86%	83%
o4-mini	87%	92%	83%	87%	89%	84%
o3	86%	89%	78%	96%	88%	78%
GLM-4.5	83%	93%	78%	92%	82%	71%
DeepSeek-R1	82%	89%	77%	92%	83%	69%
Gemini 2.5 Pro	81%	87%	82%	90%	85%	58%

Source: https://matharena.ai/

언어 모델

평균 점수

AIME 2025 ?

HMMT February 2025 ?

BRUMO 2025

SMT 2025 ?

CMIMC 2025 ?

Grok 4

89%

91%

92%

95%

86%

83%

o4-mini

87%

92%

83%

87%

89%

84%

86%

89%

78%

96%

88%

78%

GLM-4.5

83%

93%

78%

92%

82%

71%

DeepSeek-R1

82%

89%

77%

92%

83%

69%

Gemini 2.5 Pro

81%

87%

82%

90%

85%

58%

언어 모델	장점	단점
Grok 4	4314	377
Claude Opus 4.5	4974	543
Gemini 3 Pro	3338	660
GPT‑5.1	3593	359
DeepSeek-R1	1224	21
Nova Pro	3775	982
Gemini 2.5 Pro	4870	204
Llama 4 Maverick	3589	252
o3	3218	928
Qwen 3	4507	122
Claude 3.5 Haiku	3369	663
o3-mini	4552	194
Grok 3 Beta	3792	261
Claude 3.7 Sonnet - Extended Thinking	4424	831
Llama 4 Scout	4193	846
o4-mini	4293	828
GPT-4.1	3374	887
Claude Opus 4	4975	513
GPT-OSS	0	0
Claude Opus 4.1	3651	704
Gemini 2.5 Flash Lite	4267	610
Gemini 2.0 Pro	4876	757
Gemini 2.0 Flash	4052	628
Claude 3.7 Sonnet	4934	979
Qwen2.5-VL-32B	3200	126
GPT-4.1 Nano	3631	651
GPT-5	3026	193
Gemini 2.0 Flash Thinking	4466	870
Llama 3.3 70B Instruct	3691	542
Llama 3.1 Nemotron 70B Instruct	4028	265
Command A	3020	186
Claude Sonnet 4	3409	961
Nova Lite	3967	820
Mistral Large 2	4923	871
GLM-4.5	4940	204
Nova Micro	2322	480
GPT-4.5	4249	760

언어 모델

장점

단점

Grok 4

4314

377

Claude Opus 4.5

4974

543

Gemini 3 Pro

3338

660

GPT‑5.1

3593

359

DeepSeek-R1

1224

Nova Pro

3775

982

Gemini 2.5 Pro

4870

204

Llama 4 Maverick

3589

252

3218

928

Qwen 3

4507

122

Claude 3.5 Haiku

3369

663

o3-mini

4552

194

Grok 3 Beta

3792

261

Claude 3.7 Sonnet - Extended Thinking

4424

831

Llama 4 Scout

4193

846

o4-mini

4293

828

GPT-4.1

3374

887

Claude Opus 4

4975

513

GPT-OSS

Claude Opus 4.1

3651

704

Gemini 2.5 Flash Lite

4267

610

Gemini 2.0 Pro

4876

757

Gemini 2.0 Flash

4052

628

Claude 3.7 Sonnet

4934

979

Qwen2.5-VL-32B

3200

126

GPT-4.1 Nano

3631

651

GPT-5

3026

193

Gemini 2.0 Flash Thinking

4466

870

Llama 3.3 70B Instruct

3691

542

Llama 3.1 Nemotron 70B Instruct

4028

265

Command A

3020

186

Claude Sonnet 4

3409

961

Nova Lite

3967

820

Mistral Large 2

4923

871

GLM-4.5

4940

204

Nova Micro

2322

480

GPT-4.5

4249

760

2026년 상위 5개 AI 모바일 앱 비교

	ChatGPT	DeepSeek - AI 어시스턴트	Google Gemini	Grok AI	Claude by Anthropic
업데이트됨	4월 10, 2026	4월 15, 2026	3월 18, 2026	4월 16, 2026	4월 17, 2026
앱 출시일	1.2026.097	1.8.5	1.0.882555348	1.1.55-release.00	1.260409.10
점수	★ ★ ★ ★ ★ 4.7	★ ★ ★ ★ ★ 4.2	★ ★ ★ ★ ★ 4.6	★ ★ ★ ★ ★ 4.9	★ ★ ★ ★ ★ 4.6

언어 모델 대조 가이드

AI 모델 순위

VideoGameBench Leaderboard ?

MathArena Leaderboard ?

LLM 개발 선두 기업

Anthropic

OpenAI

Google DeepMind

Meta AI

2026년 상위 5개 AI 모바일 앱 비교

모델 컬렉션

Alibaba

Qwen 3

출시일 2025-04-29

Qwen2.5-VL-32B

출시일 2025-03-25

Amazon

Nova Pro

출시일 2024-12-02

Nova Lite

출시일 2024-12-02

Nova Micro

출시일 2024-12-02

Anthropic

Claude Opus 4.5

출시일 2025-11-24

Claude Opus 4.1

출시일 2025-08-05

Claude Sonnet 4

출시일 2025-05-22

Claude Opus 4

출시일 2025-05-22

Claude 3.7 Sonnet - Extended Thinking

출시일 2025-02-24

Claude 3.7 Sonnet

출시일 2025-02-24

Claude 3.5 Haiku

출시일 2024-11-04

Cohere

Command A

출시일 2025-03-14

DeepSeek

DeepSeek-R1

출시일 2025-01-21

Google

Gemini 3 Pro

출시일 2025-11-22

Gemini 2.5 Flash Lite

출시일 2025-06-17

Gemini 2.5 Pro

출시일 2025-03-25

Gemini 2.0 Flash

출시일 2024-12-11

Gemini 2.0 Pro

출시일 2024-12-11

Gemini 2.0 Flash Thinking

출시일 2024-12-19

Meta

Llama 4 Maverick

출시일 2025-04-05

Llama 4 Scout

출시일 2025-04-05

Llama 3.3 70B Instruct

출시일 2024-12-06

Mistral AI

Mistral Large 2

출시일 2024-06-24

NVIDIA

Llama 3.1 Nemotron 70B Instruct

출시일 2023-10-15

OpenAI

GPT‑5.1

출시일 2025-11-13

GPT-5

출시일 2025-08-07

GPT-OSS

출시일 2025-08-05

GPT-4.1 Nano

출시일 2025-04-14

GPT-4.1