
A DeepSeek-R1 egy 671B paraméteres Mixture-of-Experts (MoE) modell, amely tokenenként 37B aktivált paraméterrel rendelkezik, és nagymértékű megerősítéses tanuláson keresztül készült, kiemelt figyelmet fordítva a gondolkodási képességekre. Két RL (reinforcement learning) szakaszt tartalmaz a javított gondolkodási minták felfedezésére és az emberi preferenciákhoz igazításra, valamint két SFT (supervised fine-tuning) szakaszt a gondolkodási és nem-gondolkodási képességek bevetésére. A modell teljesítménye hasonló az OpenAI-o1 modelléhez matematikai, kódolási és gondolkodási feladatokban.
A Gemini 2.5 Pro a Google legfejlettebb AI modellje, mély gondolkodásra és átgondolt válaszgenerálásra tervezve. Kiemelkedő eredményt mutat kulcsfontosságú benchmarkokon, kivételes logikával és kódolási készséggel. Dinamikus webalkalmazások építésére, autonóm kódrendszerekre és kódadaptációra optimalizálva magas szintű teljesítményt nyújt. Beépített multimodális képességekkel és kiterjesztett kontextusablakkal hatékonyan dolgoz fel nagy adathalmazokat és integrál különféle információs forrásokat komplex kihívások kezelésére.
| DeepSeek-R1 | Gemini 2.5 Pro | |
|---|---|---|
Weboldal
| ||
Szolgáltató
| ||
Csevegés
| ||
Kiadási Dátum
| ||
Modalitások
| szöveg | szöveg képek hang videó |
API Szolgáltatók
| DeepSeek, HuggingFace | Google AI Studio, Vertex AI, Gemini app |
Tudás Befejezési Dátuma
| Ismeretlen | - |
Nyílt Forráskódú
| Igen | Nem |
Bemeneti Árazás
| $0.55 millió tokenenként | Nem elérhető |
Kimeneti Árazás
| $2.19 millió tokenenként | Nem elérhető |
MMLU
| 90.8% Pass@1 Forrás | Nem elérhető |
MMLU-Pro
| 84% EM Forrás | Nem elérhető |
MMMU
| - | 81.7% Forrás |
HellaSwag
| - | Nem elérhető |
HumanEval
| - | Nem elérhető |
MATH
| - | Nem elérhető |
GPQA
| 71.5% Pass@1 Forrás | 84.0% Diamond Science Forrás |
IFEval
| 83.3% Prompt Strict Forrás | Nem elérhető |
SimpleQA
| - | 52.9% |
AIME 2024 | - | 92.0% |
AIME 2025 | - | 86.7% |
Aider Polyglot
| - | 74.0% / 68.6% |
LiveCodeBench v5
| - | 70.4% |
Global MMLU (Lite)
| - | 89.8% |
MathVista
| - | - |
Mobilalkalmazás | ||
VideoGameBench | ||
Összesített pontszám | - | 0.48% |
Doom II | - | 0% |
Dream DX | - | 4.8% |
Awakening DX | - | 0% |
Civilization I | - | 0% |
Pokemon Crystal | - | 0% |
The Need for Speed | - | 0% |
The Incredible Machine | - | 0% |
Secret Game 1 | - | 0% |
Secret Game 2 | - | 0% |
Secret Game 3 | - | 0% |
MathArena | ||
| Átlagpontszám | 82% | 81% |
AIME 2025 Teszt, amely az American Invitational Mathematics Examination verseny feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál. | 89% | 87% |
HMMT February 2025 Teszt, amely a Harvard-MIT Mathematics Tournament 2025. februári feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál. | 77% | 82% |
BRUMO 2025 | 92% | 90% |
SMT 2025 Teszt, amely a Stanford Math Tournament 2025. évi feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál. | 83% | 85% |
CMIMC 2025 Teszt, amely a Canadian Mathematical Olympiad 2025. évi feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál. | 69% | 58% |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2026 All Right Reserved.
Hozzászólások (1)
Jacquie
27 Január 2026Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar