LLaMA 4 Scout es un modelo de 17 mil millones de parámetros que utiliza una arquitectura Mixture-of-Experts con 16 expertos activos, posicionándose como el mejor modelo multimodal en su categoría. Supera constantemente a competidores como Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en una amplia gama de tareas de evaluación. A pesar de su rendimiento, LLaMA 4 Scout es increíblemente eficiente: puede ejecutarse en una sola GPU NVIDIA H100 con cuantización Int4. También cuenta con una ventana de contexto líder en la industria de 10 millones de tokens y es nativamente multimodal, lo que le permite procesar texto, imágenes y video de forma fluida para aplicaciones avanzadas del mundo real.
„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.
Llama 4 Scout | Grok 3 Beta | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Apr 05, 2025 2 semanas ago | Jan 19, 2025 3 meses ago |
Modalidades | texto imágenes video | texto imágenes video |
Proveedores de API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | xAI |
Fecha de Corte de Conocimiento | 2025-04 | 2025-01 |
Código Abierto | Sí (Fuente) | No |
Costo de Entrada | No disponible | No disponible |
Costo de Salida | No disponible | No disponible |
MMLU | No disponible | No disponible |
MMLU Pro | 74.3% Reasoning & Knowledge Fuente | 79.9% Base model Fuente |
MMMU | 69.4% Image Reasoning Fuente | 78% With Think mode Fuente |
HellaSwag | No disponible | No disponible |
HumanEval | No disponible | No disponible |
MATH | No disponible | No disponible |
GPQA | 57.2% Diamond Fuente | 84.6% With Think mode, Diamond Fuente |
IFEval | No disponible | No disponible |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.