DeepSeek-R1 est un modèle Mixture-of-Experts (MoE) de 671 milliards de paramètres, avec 37 milliards de paramètres activés par token, entraîné via un apprentissage par renforcement à grande échelle avec un accent sur les capacités de raisonnement. Il intègre deux étapes de RL pour découvrir des schémas de raisonnement améliorés et s’aligner sur les préférences humaines, ainsi que deux étapes de SFT pour amorcer les capacités de raisonnement et non-raisonnement. Le modèle atteint des performances comparables à OpenAI-o1 sur les tâches de mathématiques, de codage et de raisonnement.
Amazon Nova Lite est un modèle multimodal polyvalent conçu pour traiter des entrées textuelles, visuelles et vidéo, en produisant des sorties sous forme de texte. Avec une fenêtre contextuelle de 300 000 tokens, il est particulièrement adapté aux interactions en temps réel, à l’analyse de documents et aux réponses aux questions visuelles. Faisant partie des modèles de base Amazon Nova, il prend en charge l'affinage et la distillation, permettant une personnalisation avancée.
DeepSeek-R1 | Nova Lite | |
---|---|---|
Fournisseur | ||
Site web | - | |
Date de sortie | Jan 21, 2025 3 mois ago | Dec 02, 2024 4 mois ago |
Modalités | texte | texte images vidéo |
Fournisseurs d’API | DeepSeek, HuggingFace | Amazon Bedrock |
Date de mise à jour des connaissances | Inconnu | Délibérément non divulgué |
Open Source | Oui | Non |
Tarification d’entrée | $0.55 par million de tokens | $0.06 par million de tokens |
Tarification de sortie | $2.19 par million de tokens | $0.24 par million de tokens |
MMLU | 90.8% Pass@1 Source | 80.5% CoT Source |
MMLU Pro | 84% EM Source | Non disponible |
MMMU | - | Non disponible |
HellaSwag | - | Non disponible |
HumanEval | - | 85.4% pass@1 Source |
MATH | - | 73.3% CoT Source |
GPQA | 71.5% Pass@1 Source | 42% Main Source |
IFEval | 83.3% Prompt Strict Source | 89.7% Source |
Application mobile | - |
Compare AI. Test. Benchmarks. Applications de chatbots mobiles, Sketch
Copyright © 2025 All Right Reserved.