LLM Large Language Model Directory

现代人工智能技术为商业和科学开辟新机遇。重点分析主流语言模型的能力表现、测试结果和技术参数。先进语言模型开发者:

AI模型 排行榜

排序:
语言模型提供商 ?评分发布日期 ?知识截止日期 ?开源 ?API提供商 ?模态 ?输入定价 ?输出定价 ?MMLU ?MMLU-Pro ?MMMU ?HellaSwag ?HumanEval ?MATH ?GPQA ?IFEval ?移动应用
Grok 4xAI⭐️ 4.47月 09, 2025-xAI文本 ?
图像 ?
语音 ?
视频 ?
$3.00 每百万token$15.00 每百万token------87.5%
Science
来源
-Google Play
Apple Apps
Claude Opus 4.5Anthropic⭐️ 4.411月 24, 2025未知Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform文本 ?
图像 ?
$5 每百万token$25 每百万token90.8%
来源
-80.7%
Validation
来源
---87%
Diamond
来源
-Google Play
Apple Apps
Gemini 3 ProGoogle⭐️ 4.411月 22, 20252025-01Google AI Studio, Vertex AI, Gemini app文本 ?
图像 ?
语音 ?
视频 ?
$2 每百万token$12 每百万token--81%
Pro
来源
---91.9%
Diamond, Scientific knowledge, No tools
来源
-Google Play
Apple Apps
GPT‑5.1OpenAI⭐️ 4.311月 13, 202506.2025OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)文本 ?
图像 ?
$1.25 每百万token$10.00 每百万token-78.4%
来源
85.4%
来源
---88.1%
Diamond
来源
-Google Play
Apple Apps
DeepSeek-R1DeepSeek⭐️ 4.21月 21, 2025未知DeepSeek, HuggingFace文本 ?$0.55 每百万token$2.19 每百万token90.8%
Pass@1
来源
84%
EM
来源
----71.5%
Pass@1
来源
83.3%
Prompt Strict
来源
Google Play
Apple Apps
Nova ProAmazon⭐️ 4.212月 02, 2024主动不予披露Amazon Bedrock文本 ?
图像 ?
视频 ?
$0.80 每百万token$3.20 每百万token85.9%
CoT
来源
不可用不可用不可用89%
pass@1
来源
76.6%
CoT
来源
46.9%
Main
来源
92.1%
来源
-
Gemini 2.5 ProGoogle⭐️ 4.23月 25, 2025-Google AI Studio, Vertex AI, Gemini app文本 ?
图像 ?
语音 ?
视频 ?
不可用不可用不可用不可用81.7%
来源
不可用不可用不可用84.0%
Diamond Science
来源
不可用Google Play
Apple Apps
Llama 4 MaverickMeta⭐️ 4.24月 05, 20252024-08 (来源)Meta AI, Hugging Face, Fireworks, Together, DeepInfra文本 ?
图像 ?
视频 ?
不可用不可用不可用80.5%
来源
73.4%
来源
不可用不可用不可用69.8%
Diamond
来源
不可用-
o3OpenAI⭐️ 4.24月 16, 2025-OpenAI API文本 ?
图像 ?
$10.00 每百万token$40.00 每百万token82.9%
来源
-----83.3%
Diamond, no tools
来源
-Google Play
Apple Apps
Qwen 3Alibaba⭐️ 4.24月 29, 2025- (来源)-------------
Claude 3.5 HaikuAnthropic⭐️ 4.111月 04, 202401.04.2024Anthropic, AWS Bedrock, Vertex AI文本 ?$0.80 每百万token$4.00不可用65%
0-shot CoT
来源
不可用不可用88.1%
0-shot
来源
69.4%
0-shot CoT
来源
不可用不可用Google Play
Apple Apps
o3-miniOpenAI⭐️ 4.11月 31, 2025未知OpenAI API文本 ?$1.10 每百万token$4.40 每百万token86.9%
pass@1, high effort
来源
不可用不可用不可用不可用97.9%
pass@1, high effort
来源
79.7%
0-shot, high effort
来源
不可用Google Play
Apple Apps
Grok 3 BetaxAI⭐️ 4.11月 19, 20252025-01xAI文本 ?
图像 ?
视频 ?
不可用不可用不可用79.9%
Base model
来源
78%
With Think mode
来源
不可用不可用不可用84.6%
With Think mode, Diamond
来源
不可用Google Play
Apple Apps
Claude 3.7 Sonnet - Extended ThinkingAnthropic⭐️ 4.12月 24, 2025-Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI文本 ?
图像 ?
$3.00 每百万token$15.00 每百万token不可用不可用75%
来源
不可用不可用96.2%
来源
84.8%
Diamond
来源
93.2%
来源
Google Play
Apple Apps
Llama 4 ScoutMeta⭐️ 4.14月 05, 20252025-04 (来源)Meta AI, Hugging Face, Fireworks, Together, DeepInfra文本 ?
图像 ?
视频 ?
不可用不可用不可用74.3%
Reasoning & Knowledge
来源
69.4%
Image Reasoning
来源
不可用不可用不可用57.2%
Diamond
来源
不可用-
o4-miniOpenAI⭐️ 4.14月 16, 2025-OpenAI API文本 ?
图像 ?
$1.10 每百万token$4.40 每百万tokenfort
-81.6%
来源
-14.28%
来源
-81.4%
来源
-Google Play
Apple Apps
GPT-4.1OpenAI⭐️ 4.14月 14, 2025-OpenAI API文本 ?
图像 ?
$2.00 每百万token$8.00 每百万token90.2%
pass@1
来源
-74.8%
来源
---66.3%
Diamond
来源
-Google Play
Apple Apps
Claude Opus 4Anthropic⭐️ 4.15月 22, 2025未知Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI文本 ?
图像 ?
$15$75 每百万token88.8%
来源
-76.5%
来源
---79.6%
Diamond
来源
-Google Play
Apple Apps
GPT-OSSOpenAI⭐️ 4.18月 05, 2025-Self-hosted, Hugging Face, AWS, Azure, Databricks文本 ?$0.15 每百万token$0.60 每百万token82.7%
来源
-----80.1%
Diamond
来源
--
Claude Opus 4.1Anthropic⭐️ 4.18月 05, 2025-Anthropic API, Claude Code, Amazon Bedrock, Vertex AI, GitHub Copilot文本 ?
图像 ?
$15 每百万token$75 每百万token89.5%
来源
-77.1%
来源
---80.9%
Diamond
来源
-Google Play
Apple Apps
Gemini 2.5 Flash LiteGoogle⭐️ 4.16月 17, 2025-Google AI Studio, Vertex AI, Gemini app文本 ?
图像 ?
语音 ?
视频 ?
$0.10 每百万token$0.40 每百万token81.1%
来源
-72.9%
来源
---64.6%
Diamond
来源
-Google Play
Apple Apps
Gemini 2.0 ProGoogle⭐️ 412月 11, 202408.2024Google AI Studio, Vertex AI文本 ?
图像 ?
语音 ?
视频 ?
$0.10 每百万token$0.40 每百万token不可用79.1%
来源
72.7%
来源
不可用不可用91.8%
来源
64.7%
Diamond
来源
不可用Google Play
Apple Apps
Gemini 2.0 FlashGoogle⭐️ 412月 11, 202408.2024Google AI Studio, Vertex AI文本 ?
图像 ?
语音 ?
视频 ?
$0.10 每百万token$0.40 每百万token不可用77.6%
来源
71.7%
来源
不可用不可用90.9%
来源
60.1%
Diamond
来源
不可用Google Play
Apple Apps
Claude 3.7 SonnetAnthropic⭐️ 42月 24, 2025-Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI文本 ?
图像 ?
$3.00 每百万token$15.00 每百万token不可用不可用71.8%
来源
不可用不可用82.2%
来源
68%
Diamond
来源
90.8%
来源
Google Play
Apple Apps
Qwen2.5-VL-32BAlibaba⭐️ 43月 25, 2025未知 (来源)-文本 ?
图像 ?
视频 ?
$0$078.4%
来源
49.5%
70%
不可用不可用82.2%
46.0%
Diamond
不可用-
GPT-4.1 NanoOpenAI⭐️ 44月 14, 2025-OpenAI API文本 ?
图像 ?
$0.10 每百万token$0.40 每百万token80.1%
来源
-55.4%
来源
---50.3%
Diamond
来源
74.5%
来源
Google Play
Apple Apps
GPT-5OpenAI⭐️ 48月 07, 2025-OpenAI API文本 ?
图像 ?
语音 ?
视频 ?
----84.2%
来源
-24.8%
Full Set
来源
-85.7%
Diamond
来源
--
Gemini 2.0 Flash ThinkingGoogle⭐️ 3.912月 19, 202404.2024Google AI Studio, Vertex AI, Gemini API文本 ?
图像 ?
不可用不可用不可用不可用75.4%
来源
不可用不可用不可用74.2%
Diamond Science
来源
不可用Google Play
Apple Apps
Llama 3.3 70B InstructMeta⭐️ 3.912月 06, 202412.2024Fireworks, Together, DeepInfra, Hyperbolic文本 ?$0.23 每百万token$0.40 每百万token86%
0-shot, CoT
来源
68.9%
5-shot, CoT
来源
不可用不可用88.4%
pass@1
来源
77%
0-shot, CoT
来源
50.5%
0-shot, CoT
来源
92.1%
来源
-
Llama 3.1 Nemotron 70B InstructNVIDIA⭐️ 3.910月 15, 2023-OpenRouter文本 ?$0.35 每百万token$0.40 每百万token85%
5-shot
来源
不可用不可用不可用75%
来源
71%
来源
不可用不可用-
Command ACohere⭐️ 3.93月 14, 2025-Cohere, Hugging Face, Major cloud providers文本 ?$2.50 每百万token$10.00 每百万token85.5%
来源
不可用不可用不可用不可用80%
来源
50.8%
来源
90.9%
来源
-
Claude Sonnet 4Anthropic⭐️ 3.95月 22, 2025未知Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI文本 ?
图像 ?
$3 每百万token$15 每百万token86.5%
来源
-74.4%
来源
---75.4%
Diamond
来源
-Google Play
Apple Apps
Nova LiteAmazon⭐️ 3.812月 02, 2024主动不予披露Amazon Bedrock文本 ?
图像 ?
视频 ?
$0.06 每百万token$0.24 每百万token80.5%
CoT
来源
不可用不可用不可用85.4%
pass@1
来源
73.3%
CoT
来源
42%
Main
来源
89.7%
来源
-
Mistral Large 2Mistral AI⭐️ 3.86月 24, 2024未知Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex文本 ?$3.00 每百万token$9.00 每百万token84%
5-shot
来源
50.69%
来源
不可用不可用不可用1.13%
来源
24.94%
84.01%
-
GLM-4.5Zhipu AI⭐️ 3.87月 01, 2025未知Zhipu AI文本 ?--84.6%
Academic Knowledge
来源
--------
Nova MicroAmazon⭐️ 3.612月 02, 2024主动不予披露Amazon Bedrock文本 ?$0.04 每百万token$0.14 每百万token77.6%
CoT
来源
---81.1%
pass@1
来源
69.3%
CoT
来源
40%
Main
来源
87.2%
来源
-
GPT-4.5OpenAI⭐️ 3.42月 27, 20252023-10OpenAI, Azure OpenAI Service文本 ?
图像 ?
$75.00 每百万token$150.00 每百万token不可用不可用74.4%
来源
不可用不可用不可用71.4%
science
来源
不可用Google Play
Apple Apps

VideoGameBench Leaderboard ?

Source: https://www.vgbench.com/
语言模型总分Doom IIKirby's Dream Land (DX)Link's Awakening (DX)Civilization IPokemon CrystalThe Need for SpeedThe Incredible MachineSecret Game 1Secret Game 2Secret Game 3
VG-Agent + Gemini 2.0 Flash0%0%0%0%0%0%0%0%0%0%0%
VG-Agent + Llama 4 Maverick0%0%0%0%0%0%0%0%%00%0%
VG-Agent + Claude 3.7 Sonnet0%0%0%0%0%0%0%0%0%0%0%
VG-Agent + Gemini 2.5 Pro0.48%0%4.8%0%0%0%0%0%0%0%0%

MathArena Leaderboard ?

Source: https://matharena.ai/
语言模型平均分数AIME 2025 ?HMMT February 2025 ?BRUMO 2025SMT 2025 ?CMIMC 2025 ?
Grok 489%91%92%95%86%83%
o4-mini87%92%83%87%89%84%
o386%89%78%96%88%78%
GLM-4.583%93%78%92%82%71%
DeepSeek-R182%89%77%92%83%69%
Gemini 2.5 Pro81%87%82%90%85%58%

现代大语言模型(LLM)持续演进,为用户提供强大的文本处理和生成工具。本节展示核心开发公司及其技术与能力。

语言模型优点缺点
Grok 44314377
Claude Opus 4.54974543
Gemini 3 Pro3338660
GPT‑5.13593359
DeepSeek-R1122421
Nova Pro3775982
Gemini 2.5 Pro4870204
Llama 4 Maverick3589252
o33218928
Qwen 34507122
Claude 3.5 Haiku3369663
o3-mini4552194
Grok 3 Beta3792261
Claude 3.7 Sonnet - Extended Thinking4424831
Llama 4 Scout4193846
o4-mini4293828
GPT-4.13374887
Claude Opus 44975513
GPT-OSS00
Claude Opus 4.13651704
Gemini 2.5 Flash Lite4267610
Gemini 2.0 Pro4876757
Gemini 2.0 Flash4052628
Claude 3.7 Sonnet4934979
Qwen2.5-VL-32B3200126
GPT-4.1 Nano3631651
GPT-53026193
Gemini 2.0 Flash Thinking4466870
Llama 3.3 70B Instruct3691542
Llama 3.1 Nemotron 70B Instruct4028265
Command A3020186
Claude Sonnet 43409961
Nova Lite3967820
Mistral Large 24923871
GLM-4.54940204
Nova Micro2322480
GPT-4.54249760
AI模型 排行榜

LLM开发领导者

Anthropic

Claude开发者 - 专注安全可靠的语言模型

OpenAI

GPT-4创造者 - 文本生成和分析领域最强大的语言模型之一

Google DeepMind

Gemini开发者 - 集成搜索技术的先进模型

Meta AI

Llama开发者 - 面向研究和商业应用的开源语言模型

2026年五大AI移动应用对比

最佳AI移动应用的详细概述,包括其功能、性能和用户评分。 找出哪款应用最适合您的需求。
ChatGPTDeepSeek - AI 智能助手Google GeminiGrok - 人工智能助理Claude by Anthropic
已更新4月 10, 20264月 15, 20263月 18, 20264月 16, 20264月 17, 2026
应用发布时间1.2026.0971.8.51.0.8825553481.1.55-release.001.260409.10
评分
4.7
4.2
4.6
4.9
4.6
了解更多

模型集合

Alibaba

Amazon

Anthropic

Cohere

DeepSeek

Google

Meta

Mistral AI

NVIDIA

OpenAI

Zhipu AI

xAI

对比LLM

其他工具


10%
本网站使用cookies

隐私和Cookie政策:本网站使用cookies。继续使用本网站即表示您同意使用cookies。