Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking es un modelo avanzado de razonamiento diseñado para mejorar el rendimiento y la explicabilidad al hacer visible su proceso de pensamiento. Destaca en la resolución de problemas complejos, desafíos de programación y razonamiento matemático, proporcionando soluciones paso a paso. Optimizado para tareas que requieren explicaciones detalladas y análisis lógico, el modelo también cuenta con integración nativa de herramientas, incluyendo ejecución de código y capacidades de búsqueda en Google.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, creado por Meta, es un modelo de lenguaje grande y multilingüe afinado específicamente para tareas basadas en instrucciones y optimizado para aplicaciones conversacionales. Es capaz de procesar y generar texto en varios idiomas, con una ventana de contexto que admite hasta 128.000 tokens. Lanzado el 6 de diciembre de 2024, el modelo supera a numerosos chatbots de código abierto y propietarios en diversas pruebas comparativas de la industria. Utiliza Grouped-Query Attention (GQA) para mejorar la escalabilidad y ha sido entrenado con un conjunto de datos diverso que incluye más de 15 billones de tokens de fuentes públicas. El conocimiento del modelo está actualizado hasta diciembre de 2023.

Gemini 2.0 Flash ThinkingLlama 3.3 70B Instruct
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
Proveedores de API ?
Google AI Studio, Vertex AI, Gemini API
Fireworks, Together, DeepInfra, Hyperbolic
Fecha de Corte de Conocimiento ?
04.2024
12.2024
Código Abierto ?
No
Costo de Entrada ?
No disponible
$0.23 por millón de tokens
Costo de Salida ?
No disponible
$0.40 por millón de tokens
MMLU ?
No disponible
86%
0-shot, CoT
Fuente
MMLU-Pro ?
No disponible
68.9%
5-shot, CoT
Fuente
MMMU ?
75.4%
Fuente
No disponible
HellaSwag ?
No disponible
No disponible
HumanEval ?
No disponible
88.4%
pass@1
Fuente
MATH ?
No disponible
77%
0-shot, CoT
Fuente
GPQA ?
74.2%
Diamond Science
Fuente
50.5%
0-shot, CoT
Fuente
IFEval ?
No disponible
92.1%
Fuente
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.