Grok 3 Beta

„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.

Llama 3.1 Nemotron 70B Instruct

Llama 3.1 Nemotron 70B de NVIDIA es un potente modelo de lenguaje optimizado para ofrecer respuestas precisas e informativas. Basado en la arquitectura Llama 3.1 70B y mejorado con Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF),logra un rendimiento superior en benchmarks de alineación automática. Diseñado para aplicaciones que requieren alta precisión en la generación de respuestas y utilidad, este modelo es ideal para una amplia gama de consultas de usuarios en múltiples dominios.

Grok 3 BetaLlama 3.1 Nemotron 70B Instruct
Proveedor
Sitio Web
Fecha de Lanzamiento
Jan 19, 2025
3 meses ago
Oct 15, 2023
1 año ago
Modalidades
texto ?
imágenes ?
video ?
texto ?
Proveedores de API
xAI
OpenRouter
Fecha de Corte de Conocimiento
2025-01
-
Código Abierto
No
Costo de Entrada
No disponible
$0.35 por millón de tokens
Costo de Salida
No disponible
$0.40 por millón de tokens
MMLU
No disponible
85%
5-shot
Fuente
MMLU Pro
79.9%
Base model
Fuente
No disponible
MMMU
78%
With Think mode
Fuente
No disponible
HellaSwag
No disponible
No disponible
HumanEval
No disponible
75%
Fuente
MATH
No disponible
71%
Fuente
GPQA
84.6%
With Think mode, Diamond
Fuente
No disponible
IFEval
No disponible
No disponible
Aplicación Móvil
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.