DeepSeek-R1 is een Mixture-of-Experts (MoE)-model met 671B parameters en 37B geactiveerde parameters per token, getraind via grootschalige reinforcement learning met een focus op redeneervaardigheden. Het omvat twee RL-fasen voor het ontdekken van verbeterde redeneerpatronen en afstemming op menselijke voorkeuren, evenals twee SFT-fasen voor het ontwikkelen van redeneer- en niet-redeneervaardigheden. Het model bereikt prestaties die vergelijkbaar zijn met OpenAI-o1 op het gebied van wiskunde, code en redeneertaken.
Gemini 2.0 Flash Thinking is een geavanceerd redeneermodel ontworpen om prestaties en verklaarbaarheid te verbeteren door het denkproces zichtbaar te maken. Het blinkt uit in complexe probleemoplossing, programmeeruitdagingen en wiskundig redeneren, waarbij het stapsgewijze oplossingen demonstreert. Geoptimaliseerd voor taken die gedetailleerde uitleg en logische analyse vereisen, beschikt het model ook over native toolintegratie, inclusief code-uitvoering en Google Search-mogelijkheden.
DeepSeek-R1 | Gemini 2.0 Flash Thinking | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Jan 21, 2025 3 maanden ago | Dec 19, 2024 4 maanden ago |
Modaliteiten | tekst | tekst afbeeldingen |
API-Aanbieders | DeepSeek, HuggingFace | Google AI Studio, Vertex AI, Gemini API |
Kennisafsluitdatum | Onbekend | 04.2024 |
Open Source | Ja | Nee |
Prijzen Invoer | $0.55 per miljoen tokens | Niet beschikbaar |
Prijzen Uitvoer | $2.19 per miljoen tokens | Niet beschikbaar |
MMLU | 90.8% Pass@1 Bron | Niet beschikbaar |
MMLU Pro | 84% EM Bron | Niet beschikbaar |
MMMU | - | 75.4% Bron |
HellaSwag | - | Niet beschikbaar |
HumanEval | - | Niet beschikbaar |
MATH | - | Niet beschikbaar |
GPQA | 71.5% Pass@1 Bron | 74.2% Diamond Science Bron |
IFEval | 83.3% Prompt Strict Bron | Niet beschikbaar |
Mobiele applicatie |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.