
| 언어 모델 | 제공자 | 평점 | 출시일 | 지식 업데이트 종료일 | 오픈 소스 | API 제공자 | 모달리티 | 입력 가격 | 출력 가격 | MMLU | MMLU-Pro | MMMU | HellaSwag | HumanEval | MATH | GPQA | IFEval | 모바일 앱 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Grok 4 | xAI | ⭐️ 4.4 | 7월 09, 2025 | - | 아니오 | xAI | 텍스트 이미지 음성 비디오 | $3.00 100만 토큰당 | $15.00 100만 토큰당 | - | - | - | - | - | - | 87.5% Science 출처 | - | Google Play Apple Apps |
| Claude Opus 4.5 | Anthropic | ⭐️ 4.4 | 11월 24, 2025 | 알 수 없음 | 아니오 | Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform | 텍스트 이미지 | $5 100만 토큰당 | $25 100만 토큰당 | 90.8% 출처 | - | 80.7% Validation 출처 | - | - | - | 87% Diamond 출처 | - | Google Play Apple Apps |
| Gemini 3 Pro | ⭐️ 4.4 | 11월 22, 2025 | 2025-01 | 아니오 | Google AI Studio, Vertex AI, Gemini app | 텍스트 이미지 음성 비디오 | $2 100만 토큰당 | $12 100만 토큰당 | - | - | 81% Pro 출처 | - | - | - | 91.9% Diamond, Scientific knowledge, No tools 출처 | - | Google Play Apple Apps | |
| GPT‑5.1 | OpenAI | ⭐️ 4.3 | 11월 13, 2025 | 06.2025 | 아니오 | OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE) | 텍스트 이미지 | $1.25 100만 토큰당 | $10.00 100만 토큰당 | - | 78.4% 출처 | 85.4% 출처 | - | - | - | 88.1% Diamond 출처 | - | Google Play Apple Apps |
| DeepSeek-R1 | DeepSeek | ⭐️ 4.2 | 1월 21, 2025 | 알 수 없음 | 예 | DeepSeek, HuggingFace | 텍스트 | $0.55 100만 토큰당 | $2.19 100만 토큰당 | 90.8% Pass@1 출처 | 84% EM 출처 | - | - | - | - | 71.5% Pass@1 출처 | 83.3% Prompt Strict 출처 | Google Play Apple Apps |
| Nova Pro | Amazon | ⭐️ 4.2 | 12월 02, 2024 | 의도적으로 공개되지 않음 | 아니오 | Amazon Bedrock | 텍스트 이미지 비디오 | $0.80 100만 토큰당 | $3.20 100만 토큰당 | 85.9% CoT 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 89% pass@1 출처 | 76.6% CoT 출처 | 46.9% Main 출처 | 92.1% 출처 | - |
| Gemini 2.5 Pro | ⭐️ 4.2 | 3월 25, 2025 | - | 아니오 | Google AI Studio, Vertex AI, Gemini app | 텍스트 이미지 음성 비디오 | 정보 없음 | 정보 없음 | 정보 없음 | 정보 없음 | 81.7% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 84.0% Diamond Science 출처 | 정보 없음 | Google Play Apple Apps | |
| Llama 4 Maverick | Meta | ⭐️ 4.2 | 4월 05, 2025 | 2024-08 | 예 (출처) | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | 텍스트 이미지 비디오 | 정보 없음 | 정보 없음 | 정보 없음 | 80.5% 출처 | 73.4% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 69.8% Diamond 출처 | 정보 없음 | - |
| o3 | OpenAI | ⭐️ 4.2 | 4월 16, 2025 | - | 아니오 | OpenAI API | 텍스트 이미지 | $10.00 100만 토큰당 | $40.00 100만 토큰당 | 82.9% 출처 | - | - | - | - | - | 83.3% Diamond, no tools 출처 | - | Google Play Apple Apps |
| Qwen 3 | Alibaba | ⭐️ 4.2 | 4월 29, 2025 | - | 예 (출처) | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Claude 3.5 Haiku | Anthropic | ⭐️ 4.1 | 11월 04, 2024 | 01.04.2024 | 아니오 | Anthropic, AWS Bedrock, Vertex AI | 텍스트 | $0.80 100만 토큰당 | $4.00 | 정보 없음 | 65% 0-shot CoT 출처 | 정보 없음 | 정보 없음 | 88.1% 0-shot 출처 | 69.4% 0-shot CoT 출처 | 정보 없음 | 정보 없음 | Google Play Apple Apps |
| o3-mini | OpenAI | ⭐️ 4.1 | 1월 31, 2025 | 알 수 없음 | 아니오 | OpenAI API | 텍스트 | $1.10 100만 토큰당 | $4.40 100만 토큰당 | 86.9% pass@1, high effort 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 정보 없음 | 97.9% pass@1, high effort 출처 | 79.7% 0-shot, high effort 출처 | 정보 없음 | Google Play Apple Apps |
| Grok 3 Beta | xAI | ⭐️ 4.1 | 1월 19, 2025 | 2025-01 | 아니오 | xAI | 텍스트 이미지 비디오 | 정보 없음 | 정보 없음 | 정보 없음 | 79.9% Base model 출처 | 78% With Think mode 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 84.6% With Think mode, Diamond 출처 | 정보 없음 | Google Play Apple Apps |
| Claude 3.7 Sonnet - Extended Thinking | Anthropic | ⭐️ 4.1 | 2월 24, 2025 | - | 아니오 | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | 텍스트 이미지 | $3.00 100만 토큰당 | $15.00 100만 토큰당 | 정보 없음 | 정보 없음 | 75% 출처 | 정보 없음 | 정보 없음 | 96.2% 출처 | 84.8% Diamond 출처 | 93.2% 출처 | Google Play Apple Apps |
| Llama 4 Scout | Meta | ⭐️ 4.1 | 4월 05, 2025 | 2025-04 | 예 (출처) | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | 텍스트 이미지 비디오 | 정보 없음 | 정보 없음 | 정보 없음 | 74.3% Reasoning & Knowledge 출처 | 69.4% Image Reasoning 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 57.2% Diamond 출처 | 정보 없음 | - |
| o4-mini | OpenAI | ⭐️ 4.1 | 4월 16, 2025 | - | 아니오 | OpenAI API | 텍스트 이미지 | $1.10 100만 토큰당 | $4.40 100만 토큰당 | fort | - | 81.6% 출처 | - | 14.28% 출처 | - | 81.4% 출처 | - | Google Play Apple Apps |
| GPT-4.1 | OpenAI | ⭐️ 4.1 | 4월 14, 2025 | - | 아니오 | OpenAI API | 텍스트 이미지 | $2.00 100만 토큰당 | $8.00 100만 토큰당 | 90.2% pass@1 출처 | - | 74.8% 출처 | - | - | - | 66.3% Diamond 출처 | - | Google Play Apple Apps |
| Claude Opus 4 | Anthropic | ⭐️ 4.1 | 5월 22, 2025 | 알 수 없음 | 아니오 | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI | 텍스트 이미지 | $15 | $75 100만 토큰당 | 88.8% 출처 | - | 76.5% 출처 | - | - | - | 79.6% Diamond 출처 | - | Google Play Apple Apps |
| GPT-OSS | OpenAI | ⭐️ 4.1 | 8월 05, 2025 | - | 예 | Self-hosted, Hugging Face, AWS, Azure, Databricks | 텍스트 | $0.15 100만 토큰당 | $0.60 100만 토큰당 | 82.7% 출처 | - | - | - | - | - | 80.1% Diamond 출처 | - | - |
| Claude Opus 4.1 | Anthropic | ⭐️ 4.1 | 8월 05, 2025 | - | 아니오 | Anthropic API, Claude Code, Amazon Bedrock, Vertex AI, GitHub Copilot | 텍스트 이미지 | $15 100만 토큰당 | $75 100만 토큰당 | 89.5% 출처 | - | 77.1% 출처 | - | - | - | 80.9% Diamond 출처 | - | Google Play Apple Apps |
| Gemini 2.5 Flash Lite | ⭐️ 4.1 | 6월 17, 2025 | - | 아니오 | Google AI Studio, Vertex AI, Gemini app | 텍스트 이미지 음성 비디오 | $0.10 100만 토큰당 | $0.40 100만 토큰당 | 81.1% 출처 | - | 72.9% 출처 | - | - | - | 64.6% Diamond 출처 | - | Google Play Apple Apps | |
| Gemini 2.0 Pro | ⭐️ 4 | 12월 11, 2024 | 08.2024 | 아니오 | Google AI Studio, Vertex AI | 텍스트 이미지 음성 비디오 | $0.10 100만 토큰당 | $0.40 100만 토큰당 | 정보 없음 | 79.1% 출처 | 72.7% 출처 | 정보 없음 | 정보 없음 | 91.8% 출처 | 64.7% Diamond 출처 | 정보 없음 | Google Play Apple Apps | |
| Gemini 2.0 Flash | ⭐️ 4 | 12월 11, 2024 | 08.2024 | 아니오 | Google AI Studio, Vertex AI | 텍스트 이미지 음성 비디오 | $0.10 100만 토큰당 | $0.40 100만 토큰당 | 정보 없음 | 77.6% 출처 | 71.7% 출처 | 정보 없음 | 정보 없음 | 90.9% 출처 | 60.1% Diamond 출처 | 정보 없음 | Google Play Apple Apps | |
| Claude 3.7 Sonnet | Anthropic | ⭐️ 4 | 2월 24, 2025 | - | 아니오 | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | 텍스트 이미지 | $3.00 100만 토큰당 | $15.00 100만 토큰당 | 정보 없음 | 정보 없음 | 71.8% 출처 | 정보 없음 | 정보 없음 | 82.2% 출처 | 68% Diamond 출처 | 90.8% 출처 | Google Play Apple Apps |
| Qwen2.5-VL-32B | Alibaba | ⭐️ 4 | 3월 25, 2025 | 알 수 없음 | 예 (출처) | - | 텍스트 이미지 비디오 | $0 | $0 | 78.4% 출처 | 49.5% | 70% | 정보 없음 | 정보 없음 | 82.2% | 46.0% Diamond | 정보 없음 | - |
| GPT-4.1 Nano | OpenAI | ⭐️ 4 | 4월 14, 2025 | - | 아니오 | OpenAI API | 텍스트 이미지 | $0.10 100만 토큰당 | $0.40 100만 토큰당 | 80.1% 출처 | - | 55.4% 출처 | - | - | - | 50.3% Diamond 출처 | 74.5% 출처 | Google Play Apple Apps |
| GPT-5 | OpenAI | ⭐️ 4 | 8월 07, 2025 | - | 아니오 | OpenAI API | 텍스트 이미지 음성 비디오 | - | - | - | - | 84.2% 출처 | - | 24.8% Full Set 출처 | - | 85.7% Diamond 출처 | - | - |
| Gemini 2.0 Flash Thinking | ⭐️ 3.9 | 12월 19, 2024 | 04.2024 | 아니오 | Google AI Studio, Vertex AI, Gemini API | 텍스트 이미지 | 정보 없음 | 정보 없음 | 정보 없음 | 정보 없음 | 75.4% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 74.2% Diamond Science 출처 | 정보 없음 | Google Play Apple Apps | |
| Llama 3.3 70B Instruct | Meta | ⭐️ 3.9 | 12월 06, 2024 | 12.2024 | 예 | Fireworks, Together, DeepInfra, Hyperbolic | 텍스트 | $0.23 100만 토큰당 | $0.40 100만 토큰당 | 86% 0-shot, CoT 출처 | 68.9% 5-shot, CoT 출처 | 정보 없음 | 정보 없음 | 88.4% pass@1 출처 | 77% 0-shot, CoT 출처 | 50.5% 0-shot, CoT 출처 | 92.1% 출처 | - |
| Llama 3.1 Nemotron 70B Instruct | NVIDIA | ⭐️ 3.9 | 10월 15, 2023 | - | 예 | OpenRouter | 텍스트 | $0.35 100만 토큰당 | $0.40 100만 토큰당 | 85% 5-shot 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 75% 출처 | 71% 출처 | 정보 없음 | 정보 없음 | - |
| Command A | Cohere | ⭐️ 3.9 | 3월 14, 2025 | - | 예 | Cohere, Hugging Face, Major cloud providers | 텍스트 | $2.50 100만 토큰당 | $10.00 100만 토큰당 | 85.5% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 정보 없음 | 80% 출처 | 50.8% 출처 | 90.9% 출처 | - |
| Claude Sonnet 4 | Anthropic | ⭐️ 3.9 | 5월 22, 2025 | 알 수 없음 | 아니오 | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI | 텍스트 이미지 | $3 100만 토큰당 | $15 100만 토큰당 | 86.5% 출처 | - | 74.4% 출처 | - | - | - | 75.4% Diamond 출처 | - | Google Play Apple Apps |
| Nova Lite | Amazon | ⭐️ 3.8 | 12월 02, 2024 | 의도적으로 공개되지 않음 | 아니오 | Amazon Bedrock | 텍스트 이미지 비디오 | $0.06 100만 토큰당 | $0.24 100만 토큰당 | 80.5% CoT 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 85.4% pass@1 출처 | 73.3% CoT 출처 | 42% Main 출처 | 89.7% 출처 | - |
| Mistral Large 2 | Mistral AI | ⭐️ 3.8 | 6월 24, 2024 | 알 수 없음 | 예 | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex | 텍스트 | $3.00 100만 토큰당 | $9.00 100만 토큰당 | 84% 5-shot 출처 | 50.69% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 1.13% 출처 | 24.94% | 84.01% | - |
| GLM-4.5 | Zhipu AI | ⭐️ 3.8 | 7월 01, 2025 | 알 수 없음 | 예 | Zhipu AI | 텍스트 | - | - | 84.6% Academic Knowledge 출처 | - | - | - | - | - | - | - | - |
| Nova Micro | Amazon | ⭐️ 3.6 | 12월 02, 2024 | 의도적으로 공개되지 않음 | 아니오 | Amazon Bedrock | 텍스트 | $0.04 100만 토큰당 | $0.14 100만 토큰당 | 77.6% CoT 출처 | - | - | - | 81.1% pass@1 출처 | 69.3% CoT 출처 | 40% Main 출처 | 87.2% 출처 | - |
| GPT-4.5 | OpenAI | ⭐️ 3.4 | 2월 27, 2025 | 2023-10 | 아니오 | OpenAI, Azure OpenAI Service | 텍스트 이미지 | $75.00 100만 토큰당 | $150.00 100만 토큰당 | 정보 없음 | 정보 없음 | 74.4% 출처 | 정보 없음 | 정보 없음 | 정보 없음 | 71.4% science 출처 | 정보 없음 | Google Play Apple Apps |
| 언어 모델 | 총점 | Doom II | Kirby's Dream Land (DX) | Link's Awakening (DX) | Civilization I | Pokemon Crystal | The Need for Speed | The Incredible Machine | Secret Game 1 | Secret Game 2 | Secret Game 3 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| VG-Agent + Gemini 2.0 Flash | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% |
| VG-Agent + Llama 4 Maverick | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | %0 | 0% | 0% |
| VG-Agent + Claude 3.7 Sonnet | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% |
| VG-Agent + Gemini 2.5 Pro | 0.48% | 0% | 4.8% | 0% | 0% | 0% | 0% | 0% | 0% | 0% | 0% |
| 언어 모델 | 평균 점수 | AIME 2025 | HMMT February 2025 | BRUMO 2025 | SMT 2025 | CMIMC 2025 |
|---|---|---|---|---|---|---|
| Grok 4 | 89% | 91% | 92% | 95% | 86% | 83% |
| o4-mini | 87% | 92% | 83% | 87% | 89% | 84% |
| o3 | 86% | 89% | 78% | 96% | 88% | 78% |
| GLM-4.5 | 83% | 93% | 78% | 92% | 82% | 71% |
| DeepSeek-R1 | 82% | 89% | 77% | 92% | 83% | 69% |
| Gemini 2.5 Pro | 81% | 87% | 82% | 90% | 85% | 58% |
현대 대형 언어 모델(LLM)은 계속 발전하며 사용자에게 강력한 텍스트 처리 및 생성 도구를 제공합니다. 이 섹션에서는 주요 개발 기업, 그들의 기술 및 기능을 소개합니다.
| 언어 모델 | 장점 | 단점 |
|---|---|---|
| Grok 4 | 4314 | 377 |
| Claude Opus 4.5 | 4974 | 543 |
| Gemini 3 Pro | 3338 | 660 |
| GPT‑5.1 | 3593 | 359 |
| DeepSeek-R1 | 1224 | 21 |
| Nova Pro | 3775 | 982 |
| Gemini 2.5 Pro | 4870 | 204 |
| Llama 4 Maverick | 3589 | 252 |
| o3 | 3218 | 928 |
| Qwen 3 | 4507 | 122 |
| Claude 3.5 Haiku | 3369 | 663 |
| o3-mini | 4552 | 194 |
| Grok 3 Beta | 3792 | 261 |
| Claude 3.7 Sonnet - Extended Thinking | 4424 | 831 |
| Llama 4 Scout | 4193 | 846 |
| o4-mini | 4293 | 828 |
| GPT-4.1 | 3374 | 887 |
| Claude Opus 4 | 4975 | 513 |
| GPT-OSS | 0 | 0 |
| Claude Opus 4.1 | 3651 | 704 |
| Gemini 2.5 Flash Lite | 4267 | 610 |
| Gemini 2.0 Pro | 4876 | 757 |
| Gemini 2.0 Flash | 4052 | 628 |
| Claude 3.7 Sonnet | 4934 | 979 |
| Qwen2.5-VL-32B | 3200 | 126 |
| GPT-4.1 Nano | 3631 | 651 |
| GPT-5 | 3026 | 193 |
| Gemini 2.0 Flash Thinking | 4466 | 870 |
| Llama 3.3 70B Instruct | 3691 | 542 |
| Llama 3.1 Nemotron 70B Instruct | 4028 | 265 |
| Command A | 3020 | 186 |
| Claude Sonnet 4 | 3409 | 961 |
| Nova Lite | 3967 | 820 |
| Mistral Large 2 | 4923 | 871 |
| GLM-4.5 | 4940 | 204 |
| Nova Micro | 2322 | 480 |
| GPT-4.5 | 4249 | 760 |

안전성과 신뢰성에 중점을 둔 언어 모델 Claude의 개발사.
텍스트 생성 및 분석을 위한 가장 강력한 언어 모델 중 하나인 GPT-4의 창시자.
검색 기술과 통합된 고급 모델 Gemini의 개발사.
연구 및 상업적 응용을 위한 오픈 언어 모델 Llama의 개발사.
| ChatGPT | DeepSeek - AI 어시스턴트 | Google Gemini | Grok AI | Claude by Anthropic | |
|---|---|---|---|---|---|
| 업데이트됨 | 4월 10, 2026 | 4월 15, 2026 | 3월 18, 2026 | 4월 16, 2026 | 4월 17, 2026 |
| 앱 출시일 | 1.2026.097 | 1.8.5 | 1.0.882555348 | 1.1.55-release.00 | 1.260409.10 |
| 점수 |
|
|
|
|
|