Claude 3.7 Sonnet - Extended Thinking vs Llama 3.3 70B Instruct

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet est le modèle d'IA le plus avancé d'Anthropic à ce jour et le premier système de raisonnement hybride sur le marché. Il propose des modes de pensée standard et étendu, ce dernier offrant un raisonnement transparent et étape par étape. Le modèle démontre des améliorations significatives en codage et en développement web front-end, obtenant des résultats de pointe sur SWE-bench Verified et TAU-bench. Disponible via Claude.ai, l'API Anthropic, Amazon Bedrock et Google Cloud Vertex AI, il établit une nouvelle référence pour la résolution intelligente de problèmes pilotée par l'IA.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, conçu par Meta, est un grand modèle de langage multilingue spécialement affiné pour les tâches basées sur des instructions et optimisé pour les applications conversationnelles. Il peut traiter et générer du texte en plusieurs langues, avec une fenêtre contextuelle prenant en charge jusqu'à 128 000 tokens. Lancé le 6 décembre 2024, le modèle surpasse de nombreux chatbots open-source et propriétaires selon divers benchmarks industriels. Il utilise le Grouped-Query Attention (GQA) pour améliorer l'évolutivité et a été entraîné sur un ensemble de données diversifié comprenant plus de 15 billions de tokens provenant de sources publiques. Les connaissances du modèle sont à jour jusqu'en décembre 2023.

	Claude 3.7 Sonnet - Extended Thinking	Llama 3.3 70B Instruct
Site web ?	Open	Open
Fournisseur ?	Anthropic	Meta
Chat ?
Date de sortie ?
Modalités ?	texte ? images ?	texte ?
Fournisseurs d’API ?	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI	Fireworks, Together, DeepInfra, Hyperbolic
Date de mise à jour des connaissances ?	-	12.2024
Open Source ?	Non	Oui
Tarification d’entrée ?	$3.00 par million de tokens	$0.23 par million de tokens
Tarification de sortie ?	$15.00 par million de tokens	$0.40 par million de tokens
MMLU ?	Non disponible	86% 0-shot, CoT Source
MMLU-Pro ?	Non disponible	68.9% 5-shot, CoT Source
MMMU ?	75% Source	Non disponible
HellaSwag ?	Non disponible	Non disponible
HumanEval ?	Non disponible	88.4% pass@1 Source
MATH ?	96.2% Source	77% 0-shot, CoT Source
GPQA ?	84.8% Diamond Source	50.5% 0-shot, CoT Source
IFEval ?	93.2% Source	92.1% Source
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Application mobile	Google Play Apple Apps	-

Claude 3.7 Sonnet - Extended Thinking

Llama 3.3 70B Instruct

Site web ?

Open

Fournisseur ?

Anthropic

Comparer les LLMs
Claude 3.7 Sonnet - Extended Thinking vs Llama 3.3 70B Instruct