Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet, Anthropic'in şimdiye kadarki en gelişmiş yapay zeka modeli olup, piyasadaki ilk hibrit akıl yürütme sistemidir. Hem standart hem de genişletilmiş düşünme modları sunar; genişletilmiş mod, şeffaf ve adım adım akıl yürütme sağlar. Model, kodlama ve ön yüz web geliştirmede önemli iyileştirmeler göstererek SWE-bench Verified ve TAU-bench'te son teknoloji sonuçlar elde etmiştir. Claude.ai, Anthropic API, Amazon Bedrock ve Google Cloud'un Vertex AI hizmetleri aracılığıyla kullanılabilir ve yapay zeka destekli problem çözme konusunda yeni bir standart belirler.

GPT-4.1

OpenAI tarafından 14 Nisan 2025'te piyasaya sürülen GPT-4.1, 1 milyon token bağlam penceresi sunar ve istek başına 32.768 token'a kadar çıktı desteği sağlar. Kodlama görevlerinde olağanüstü performans göstererek SWE-Bench Verified ölçütünde %54,6 başarı elde etmiş ve MultiChallenge'da GPT-4o'ya kıyasla talimat takip etmede %10,5 iyileşme sağlamıştır. Modelin bilgi kesim tarihi Haziran 2024 olarak belirlenmiştir. Fiyatlandırma, milyon giriş token başına 2,00$ ve milyon çıkış token başına 8,00$ olarak belirlenmiş olup, önbelleğe alınmış girdiler için %75 indirim uygulanarak tekrar eden sorgular için oldukça maliyet etkin hale getirilmiştir.

Claude 3.7 Sonnet - Extended ThinkingGPT-4.1
Web Sitesi ?
Sağlayıcı ?
Sohbet ?
Yayın Tarihi ?
Modallikler ?
metin ?
görseller ?
metin ?
görseller ?
API Sağlayıcıları ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
OpenAI API
Bilgi Kesim Tarihi ?
-
-
Açık Kaynak ?
Hayır
Hayır
Fiyatlandırma Girdisi ?
$3.00 milyon belirteç başına
$2.00 milyon belirteç başına
Fiyatlandırma Çıktısı ?
$15.00 milyon belirteç başına
$8.00 milyon belirteç başına
MMLU ?
Mevcut değil
90.2%
pass@1
Kaynak
MMLU-Pro ?
Mevcut değil
-
MMMU ?
75%
Kaynak
74.8%
Kaynak
HellaSwag ?
Mevcut değil
-
HumanEval ?
Mevcut değil
-
MATH ?
96.2%
Kaynak
-
GPQA ?
84.8%
Diamond
Kaynak
66.3%
Diamond
Kaynak
IFEval ?
93.2%
Kaynak
-
SimpleQA ?
-
-
AIME 2024
-
48.1%
Kaynak
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
87.3%
pass@1
Kaynak
MathVista ?
-
-
Mobil Uygulama

LLM Karşılaştırması

Yorum Ekle


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.