Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet est le modèle d'IA le plus avancé d'Anthropic à ce jour et le premier système de raisonnement hybride sur le marché. Il propose des modes de pensée standard et étendu, ce dernier offrant un raisonnement transparent et étape par étape. Le modèle démontre des améliorations significatives en codage et en développement web front-end, obtenant des résultats de pointe sur SWE-bench Verified et TAU-bench. Disponible via Claude.ai, l'API Anthropic, Amazon Bedrock et Google Cloud Vertex AI, il établit une nouvelle référence pour la résolution intelligente de problèmes pilotée par l'IA.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, conçu par Meta, est un grand modèle de langage multilingue spécialement affiné pour les tâches basées sur des instructions et optimisé pour les applications conversationnelles. Il peut traiter et générer du texte en plusieurs langues, avec une fenêtre contextuelle prenant en charge jusqu'à 128 000 tokens. Lancé le 6 décembre 2024, le modèle surpasse de nombreux chatbots open-source et propriétaires selon divers benchmarks industriels. Il utilise le Grouped-Query Attention (GQA) pour améliorer l'évolutivité et a été entraîné sur un ensemble de données diversifié comprenant plus de 15 billions de tokens provenant de sources publiques. Les connaissances du modèle sont à jour jusqu'en décembre 2023.

Claude 3.7 Sonnet - Extended ThinkingLlama 3.3 70B Instruct
Fournisseur
Site web
Date de sortie
Feb 24, 2025
1 mois ago
Dec 06, 2024
4 mois ago
Modalités
texte ?
images ?
texte ?
Fournisseurs d’API
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fireworks, Together, DeepInfra, Hyperbolic
Date de mise à jour des connaissances
-
12.2024
Open Source
Non
Oui
Tarification d’entrée
$3.00 par million de tokens
$0.23 par million de tokens
Tarification de sortie
$15.00 par million de tokens
$0.40 par million de tokens
MMLU
Non disponible
86%
0-shot, CoT
Source
MMLU Pro
Non disponible
68.9%
5-shot, CoT
Source
MMMU
75%
Source
Non disponible
HellaSwag
Non disponible
Non disponible
HumanEval
Non disponible
88.4%
pass@1
Source
MATH
96.2%
Source
77%
0-shot, CoT
Source
GPQA
84.8%
Diamond
Source
50.5%
0-shot, CoT
Source
IFEval
93.2%
Source
92.1%
Source
Application mobile
-

Comparer les LLMs

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.