Grok 3 Beta

„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.

Claude 3.5 Haiku

Claude 3.5 Haiku, desarrollado por Anthropic, ofrece una ventana de contexto de 200.000 tokens. El precio está fijado en 1 $ por millón de tokens de entrada y 5 $ por millón de tokens de salida, con posibles ahorros de hasta un 90 % mediante el almacenamiento en caché de prompts y un 50 % a través de la API de Message Batches. Este modelo, lanzado el 4 de noviembre de 2024, destaca en la autocompletación de código, chatbots interactivos, extracción y etiquetado de datos, así como en la moderación de contenido en tiempo real.

Grok 3 BetaClaude 3.5 Haiku
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
video ?
texto ?
Proveedores de API ?
xAI
Anthropic, AWS Bedrock, Vertex AI
Fecha de Corte de Conocimiento ?
2025-01
01.04.2024
Código Abierto ?
No
No
Costo de Entrada ?
No disponible
$0.80 por millón de tokens
Costo de Salida ?
No disponible
$4.00
MMLU ?
No disponible
No disponible
MMLU-Pro ?
79.9%
Base model
Fuente
65%
0-shot CoT
Fuente
MMMU ?
78%
With Think mode
Fuente
No disponible
HellaSwag ?
No disponible
No disponible
HumanEval ?
No disponible
88.1%
0-shot
Fuente
MATH ?
No disponible
69.4%
0-shot CoT
Fuente
GPQA ?
84.6%
With Think mode, Diamond
Fuente
No disponible
IFEval ?
No disponible
No disponible
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.