Claude 3.7 Sonnet, Anthropic'in şimdiye kadarki en gelişmiş modeli olup, piyasadaki ilk hibrit akıl yürütme yapay zekasıdır. Hem standart hem de genişletilmiş düşünme modları sunar; genişletilmiş mod, şeffaf ve adım adım akıl yürütme sağlar. Model, kodlama ve ön yüz web geliştirmede üstün performans göstererek SWE-bench Verified ve TAU-bench'te son teknoloji sonuçlar elde etmiştir. Claude.ai, Anthropic API, Amazon Bedrock ve Google Cloud'un Vertex AI hizmetleri aracılığıyla kullanılabilir ve yapay zeka destekli problem çözme konusunda yeni bir ölçüt belirler.
NVIDIA’nın Llama 3.1 Nemotron 70B modeli, doğru ve bilgilendirici yanıtlar sunmak üzere optimize edilmiş güçlü bir dil modelidir. Llama 3.1 70B mimarisi üzerine inşa edilmiş olup, İnsan Geribildirimli Pekiştirmeli Öğrenme (RLHF) ile geliştirilmiştir ve otomatik hizalama kıyaslamalarında en üst performansa ulaşır. Yanıt üretiminde yüksek hassasiyet ve fayda gerektiren uygulamalar için tasarlanmış bu model, çok çeşitli alanlarda kullanıcı sorgularına yanıt verebilir.
Claude 3.7 Sonnet | Llama 3.1 Nemotron 70B Instruct | |
---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin görseller | metin |
API Sağlayıcıları
| Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | OpenRouter |
Bilgi Kesim Tarihi
| - | - |
Açık Kaynak
| Hayır | Evet |
Fiyatlandırma Girdisi
| $3.00 milyon belirteç başına | $0.35 milyon belirteç başına |
Fiyatlandırma Çıktısı
| $15.00 milyon belirteç başına | $0.40 milyon belirteç başına |
MMLU
| Mevcut değil | 85% 5-shot Kaynak |
MMLU-Pro
| Mevcut değil | Mevcut değil |
MMMU
| 71.8% Kaynak | Mevcut değil |
HellaSwag
| Mevcut değil | Mevcut değil |
HumanEval
| Mevcut değil | 75% Kaynak |
MATH
| 82.2% Kaynak | 71% Kaynak |
GPQA
| 68% Diamond Kaynak | Mevcut değil |
IFEval
| 90.8% Kaynak | Mevcut değil |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobil Uygulama | - | |
VideoGameBench | ||
Toplam puan | 0% | - |
Doom II | 0% | - |
Dream DX | 0% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2025 All Right Reserved.