Claude 3.7 Sonnet es el modelo más avanzado de Anthropic hasta la fecha y la primera IA de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo sobresale en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.
Mistral Large 2, desarrollado por Mistral, ofrece una ventana de contexto de 128 000 tokens y tiene un precio de 3,00 USD por millón de tokens de entrada y 9,00 USD por millón de tokens de salida. Lanzado el 24 de julio de 2024, el modelo obtuvo una puntuación de 84,0 en el benchmark MMLU en una evaluación de 5-shot, demostrando un fuerte rendimiento en diversas tareas.
Claude 3.7 Sonnet | Mistral Large 2 | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Feb 24, 2025 1 mes ago | Jun 24, 2024 9 meses ago |
Modalidades | texto imágenes | texto |
Proveedores de API | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
Fecha de Corte de Conocimiento | - | Desconocido |
Código Abierto | No | Sí |
Costo de Entrada | $3.00 por millón de tokens | $3.00 por millón de tokens |
Costo de Salida | $15.00 por millón de tokens | $9.00 por millón de tokens |
MMLU | No disponible | 84% 5-shot Fuente |
MMLU Pro | No disponible | 50.69% Fuente |
MMMU | 71.8% Fuente | No disponible |
HellaSwag | No disponible | No disponible |
HumanEval | No disponible | No disponible |
MATH | 82.2% Fuente | 1.13% Fuente |
GPQA | 68% Diamond Fuente | 24.94% |
IFEval | 90.8% Fuente | 84.01% |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.