Claude 3.7 Sonnet

Claude 3.7 Sonnet es el modelo más avanzado de Anthropic hasta la fecha y la primera IA de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo sobresale en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking es un modelo avanzado de razonamiento diseñado para mejorar el rendimiento y la explicabilidad al hacer visible su proceso de pensamiento. Destaca en la resolución de problemas complejos, desafíos de programación y razonamiento matemático, proporcionando soluciones paso a paso. Optimizado para tareas que requieren explicaciones detalladas y análisis lógico, el modelo también cuenta con integración nativa de herramientas, incluyendo ejecución de código y capacidades de búsqueda en Google.

Claude 3.7 SonnetGemini 2.0 Flash Thinking
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
imágenes ?
Proveedores de API ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Google AI Studio, Vertex AI, Gemini API
Fecha de Corte de Conocimiento ?
-
04.2024
Código Abierto ?
No
No
Costo de Entrada ?
$3.00 por millón de tokens
No disponible
Costo de Salida ?
$15.00 por millón de tokens
No disponible
MMLU ?
No disponible
No disponible
MMLU-Pro ?
No disponible
No disponible
MMMU ?
71.8%
Fuente
75.4%
Fuente
HellaSwag ?
No disponible
No disponible
HumanEval ?
No disponible
No disponible
MATH ?
82.2%
Fuente
No disponible
GPQA ?
68%
Diamond
Fuente
74.2%
Diamond Science
Fuente
IFEval ?
90.8%
Fuente
No disponible
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil

VideoGameBench ?

Puntuación total
0%
-
Doom II
0%
-
Dream DX
0%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.