Mistral Large 2 AIの技術仕様とレビュー

Mistral Large 2

コメント: 0

Mistral Large 2は、Mistralによって開発され、128Kトークンのコンテキストウィンドウを提供し、100万入力トークンあたり3.00ドル、100万出力トークンあたり9.00ドルで価格設定されています。2024年7月24日にリリースされ、5-shot評価でMMLUベンチマークで84.0を記録し、多様なタスクで強力なパフォーマンスを発揮します。

4923

871

総合ランキングにおける位置
6月 2026

ユーザー評価
https://compare-ai.foundtt.com

3.8

モデル概要

ウェブサイト AIモデルのウェブページ	Open
プロバイダーこのモデルを提供するエンティティ。	Mistral AI
チャットメッセージを入力してチャットを開始	-
リリース日モデルが最初にリリースされた日時。	1 年 ago 6月 24, 2024
モダリティこのモデルが処理できるデータの種類	テキスト ?
APIプロバイダーこのモデルを提供するプロバイダー。（これは完全なリストではありません。）	Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
知識のカットオフ日モデルの知識が最後に更新された日時。	不明
オープンソースモデルのコードが公開されているかどうか。	はい
入力料金プロンプト内のトークン処理のコスト	$3.00 100万トークンあたり
出力料金モデルによって生成されたトークンのコスト	$9.00 100万トークンあたり
MMLU Massive Multitask Language Understanding - 数学、歴史、法律など57の科目にわたる知識をテスト	84% 5-shot ソース
MMLU-Pro より堅牢なMMLUベンチマークで、難易度の高い推論中心の質問、より大きな選択肢セット、プロンプト感度の低減を特徴とする	50.69% ソース
MMMU Massive Multitask Multimodal Understanding - テキスト、画像、音声、動画にわたる理解をテスト	利用不可
HellaSwag 挑戦的な文完成ベンチマーク	利用不可
HumanEval コード生成と問題解決能力を評価	利用不可
MATH さまざまな難易度レベルでの数学的問題解決能力をテスト	1.13% ソース
GPQA 化学、生物学、物理学における博士レベルの知識を、深い専門知識を必要とする多肢選択問題でテスト	24.94%
IFEval モデルが明示的なフォーマット指示に正確に従い、適切な出力を生成し、異なるタスク間で一貫した指示遵守を維持する能力をテスト	84.01%
SimpleQA シンプルな質問の精度評価	-
AIME 2024	-
AIME 2025	-
Aider Polyglot 多言語プログラミングベンチマーク	-
LiveCodeBench v5 リアルタイムプログラミングのベンチマーク	-
Global MMLU (Lite) モデルの汎用性をグローバルレベルで評価するための簡易版ベンチマーク。	-
MathVista 視覚的な文脈におけるAIモデルの数学的推論能力を評価します	-
モバイルアプリケーション	-

Mistral Large 2の仕様、レビュー、比較

Mistral Large 2

モデル概要

コメントを追加

LLMを比較