Claude 3.7 Sonnet es el modelo más avanzado de Anthropic hasta la fecha y la primera IA de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo sobresale en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.
„Llama 3.3 70B Instruct“, creado por Meta, es un modelo de lenguaje grande y multilingüe afinado específicamente para tareas basadas en instrucciones y optimizado para aplicaciones conversacionales. Es capaz de procesar y generar texto en varios idiomas, con una ventana de contexto que admite hasta 128.000 tokens. Lanzado el 6 de diciembre de 2024, el modelo supera a numerosos chatbots de código abierto y propietarios en diversas pruebas comparativas de la industria. Utiliza Grouped-Query Attention (GQA) para mejorar la escalabilidad y ha sido entrenado con un conjunto de datos diverso que incluye más de 15 billones de tokens de fuentes públicas. El conocimiento del modelo está actualizado hasta diciembre de 2023.
Claude 3.7 Sonnet | Llama 3.3 70B Instruct | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Feb 24, 2025 1 mes ago | Dec 06, 2024 4 meses ago |
Modalidades | texto imágenes | texto |
Proveedores de API | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | Fireworks, Together, DeepInfra, Hyperbolic |
Fecha de Corte de Conocimiento | - | 12.2024 |
Código Abierto | No | Sí |
Costo de Entrada | $3.00 por millón de tokens | $0.23 por millón de tokens |
Costo de Salida | $15.00 por millón de tokens | $0.40 por millón de tokens |
MMLU | No disponible | 86% 0-shot, CoT Fuente |
MMLU Pro | No disponible | 68.9% 5-shot, CoT Fuente |
MMMU | 71.8% Fuente | No disponible |
HellaSwag | No disponible | No disponible |
HumanEval | No disponible | 88.4% pass@1 Fuente |
MATH | 82.2% Fuente | 77% 0-shot, CoT Fuente |
GPQA | 68% Diamond Fuente | 50.5% 0-shot, CoT Fuente |
IFEval | 90.8% Fuente | 92.1% Fuente |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.