DeepSeek-R1 est un modèle Mixture-of-Experts (MoE) de 671 milliards de paramètres, avec 37 milliards de paramètres activés par token, entraîné via un apprentissage par renforcement à grande échelle avec un accent sur les capacités de raisonnement. Il intègre deux étapes de RL pour découvrir des schémas de raisonnement améliorés et s’aligner sur les préférences humaines, ainsi que deux étapes de SFT pour amorcer les capacités de raisonnement et non-raisonnement. Le modèle atteint des performances comparables à OpenAI-o1 sur les tâches de mathématiques, de codage et de raisonnement.
Gemini 2.0 Pro est le modèle le plus avancé de Google à ce jour, offrant des performances exceptionnelles en programmation et gérant avec aisance des instructions complexes. Il est doté de capacités améliorées telles que l’intégration native d’outils, la génération d’images et la synthèse vocale. Conçu pour un raisonnement avancé, ce modèle prend en charge les entrées multimodales, y compris le texte, les images, la vidéo et l’audio. Disponible via Google AI Studio et Vertex AI, il offre des améliorations significatives par rapport aux versions précédentes tout en maintenant une grande efficacité.
DeepSeek-R1 | Gemini 2.0 Pro | |
---|---|---|
Fournisseur | ||
Site web | ||
Date de sortie | Jan 21, 2025 3 mois ago | Dec 11, 2024 4 mois ago |
Modalités | texte | texte images voix vidéo |
Fournisseurs d’API | DeepSeek, HuggingFace | Google AI Studio, Vertex AI |
Date de mise à jour des connaissances | Inconnu | 08.2024 |
Open Source | Oui | Non |
Tarification d’entrée | $0.55 par million de tokens | $0.10 par million de tokens |
Tarification de sortie | $2.19 par million de tokens | $0.40 par million de tokens |
MMLU | 90.8% Pass@1 Source | Non disponible |
MMLU Pro | 84% EM Source | 79.1% Source |
MMMU | - | 72.7% Source |
HellaSwag | - | Non disponible |
HumanEval | - | Non disponible |
MATH | - | 91.8% Source |
GPQA | 71.5% Pass@1 Source | 64.7% Diamond Source |
IFEval | 83.3% Prompt Strict Source | Non disponible |
Application mobile |
Compare AI. Test. Benchmarks. Applications de chatbots mobiles, Sketch
Copyright © 2025 All Right Reserved.