Especificaciones Técnicas y Reseña de Claude Sonnet 4 AI

Claude Sonnet 4

Comentarios: 0

3409

961

Posición en el ranking general al
Junio 2026

Calificación de usuarios
https://compare-ai.foundtt.com

3.9

Resumen del Modelo

Sitio Web Página Web del Modelo de IA	Open
Proveedor La entidad que proporciona este modelo.	Anthropic
Chat Ingresa un mensaje para comenzar a chatear	Open
Fecha de Lanzamiento Cuándo se lanzó el modelo por primera vez.	1 año ago May 22, 2025
Modalidades Tipos de datos que este modelo puede procesar	texto ? imágenes ?
Proveedores de API Los proveedores que ofrecen este modelo. (Esta no es una lista exhaustiva).	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Fecha de Corte de Conocimiento Cuándo se actualizó por última vez el conocimiento del modelo.	Desconocido
Código Abierto Si el código del modelo está disponible para uso público.	No
Costo de Entrada Costo por procesar tokens en tus solicitudes	$3 por millón de tokens
Costo de Salida Costo por tokens generados por el modelo	$15 por millón de tokens
MMLU Evaluación de Comprensión Multitarea Masiva - Pruebas de conocimiento en 57 disciplinas, incluyendo matemáticas, historia, derecho y más.	86.5% Fuente
MMLU-Pro Un criterio MMLU más avanzado con preguntas más difíciles enfocadas en el razonamiento, un mayor conjunto de opciones y menor sensibilidad a los prompts.	-
MMMU Evaluación de Comprensión Multitarea Multimodal - Pruebas de comprensión en texto, imágenes, audio y video.	74.4% Fuente
HellaSwag Un exigente criterio de evaluación para completar oraciones.	-
HumanEval Evalúa la generación de código y habilidades de resolución de problemas.	-
MATH Pruebas de resolución de problemas matemáticos en distintos niveles de dificultad.	-
GPQA Evalúa conocimientos a nivel de doctorado en química, biología y física mediante preguntas de opción múltiple que requieren una comprensión profunda del dominio.	75.4% Diamond Fuente
IFEval Evalúa la capacidad del modelo para seguir instrucciones de formato explícitas, generar respuestas adecuadas y mantener la coherencia en diversas tareas.	-
SimpleQA Evaluación de la precisión de preguntas simples	-
AIME 2024	-
AIME 2025	75.5% Fuente
Aider Polyglot Benchmark de programación multilingüe.	-
LiveCodeBench v5 Benchmark para programación en tiempo real	-
Global MMLU (Lite) Una versión simplificada del benchmark para evaluar la universalidad de los modelos a nivel global.	-
MathVista Evalúa las habilidades de razonamiento matemático de los modelos de IA dentro de contextos visuales	-
Aplicación Móvil	Google Play Apple Apps

Especificaciones, Reseña y Comparación de Claude Sonnet 4

Claude Sonnet 4

Resumen del Modelo

Agregar un Comentario

Comparar LLMs