Grok 3 Beta

„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.

o3

OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.

Grok 3 Betao3
Proveedor
Sitio Web
Fecha de Lanzamiento
Jan 19, 2025
3 meses ago
Apr 16, 2025
1 semana ago
Modalidades
texto ?
imágenes ?
video ?
texto ?
imágenes ?
Proveedores de API
xAI
OpenAI API
Fecha de Corte de Conocimiento
2025-01
-
Código Abierto
No
No
Costo de Entrada
No disponible
$10.00 por millón de tokens
Costo de Salida
No disponible
$40.00 por millón de tokens
MMLU
No disponible
82.9%
Fuente
MMLU Pro
79.9%
Base model
Fuente
-
MMMU
78%
With Think mode
Fuente
-
HellaSwag
No disponible
-
HumanEval
No disponible
-
MATH
No disponible
-
GPQA
84.6%
With Think mode, Diamond
Fuente
83.3%
Diamond, no tools
Fuente
IFEval
No disponible
-
Aplicación Móvil

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.