Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet, Anthropic'in şimdiye kadarki en gelişmiş yapay zeka modeli olup, piyasadaki ilk hibrit akıl yürütme sistemidir. Hem standart hem de genişletilmiş düşünme modları sunar; genişletilmiş mod, şeffaf ve adım adım akıl yürütme sağlar. Model, kodlama ve ön yüz web geliştirmede önemli iyileştirmeler göstererek SWE-bench Verified ve TAU-bench'te son teknoloji sonuçlar elde etmiştir. Claude.ai, Anthropic API, Amazon Bedrock ve Google Cloud'un Vertex AI hizmetleri aracılığıyla kullanılabilir ve yapay zeka destekli problem çözme konusunda yeni bir standart belirler.

GPT-4.1

OpenAI tarafından 14 Nisan 2025'te piyasaya sürülen GPT-4.1, 1 milyon token bağlam penceresi sunar ve istek başına 32.768 token'a kadar çıktı desteği sağlar. Kodlama görevlerinde olağanüstü performans göstererek SWE-Bench Verified ölçütünde %54,6 başarı elde etmiş ve MultiChallenge'da GPT-4o'ya kıyasla talimat takip etmede %10,5 iyileşme sağlamıştır. Modelin bilgi kesim tarihi Haziran 2024 olarak belirlenmiştir. Fiyatlandırma, milyon giriş token başına 2,00$ ve milyon çıkış token başına 8,00$ olarak belirlenmiş olup, önbelleğe alınmış girdiler için %75 indirim uygulanarak tekrar eden sorgular için oldukça maliyet etkin hale getirilmiştir.

	Claude 3.7 Sonnet - Extended Thinking	GPT-4.1
Web Sitesi ?	Open	Open
Sağlayıcı ?	Anthropic	OpenAI
Sohbet ?
Yayın Tarihi ?
Modallikler ?	metin ? görseller ?	metin ? görseller ?
API Sağlayıcıları ?	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI	OpenAI API
Bilgi Kesim Tarihi ?	-	-
Açık Kaynak ?	Hayır	Hayır
Fiyatlandırma Girdisi ?	$3.00 milyon belirteç başına	$2.00 milyon belirteç başına
Fiyatlandırma Çıktısı ?	$15.00 milyon belirteç başına	$8.00 milyon belirteç başına
MMLU ?	Mevcut değil	90.2% pass@1 Kaynak
MMLU-Pro ?	Mevcut değil	-
MMMU ?	75% Kaynak	74.8% Kaynak
HellaSwag ?	Mevcut değil	-
HumanEval ?	Mevcut değil	-
MATH ?	96.2% Kaynak	-
GPQA ?	84.8% Diamond Kaynak	66.3% Diamond Kaynak
IFEval ?	93.2% Kaynak	-
SimpleQA ?	-	-
AIME 2024	-	48.1% Kaynak
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	87.3% pass@1 Kaynak
MathVista ?	-	-
Mobil Uygulama	Google Play Apple Apps	Google Play Apple Apps

Claude 3.7 Sonnet - Extended Thinking

GPT-4.1

Web Sitesi ?

Open

Sağlayıcı ?

Anthropic

OpenAI

Sohbet ?

Yayın Tarihi ?

Modallikler ?

metin ?
görseller ?

API Sağlayıcıları ?

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

OpenAI API

Bilgi Kesim Tarihi ?

Açık Kaynak ?

Hayır

Fiyatlandırma Girdisi ?

$3.00 milyon belirteç başına

$2.00 milyon belirteç başına

Fiyatlandırma Çıktısı ?

$15.00 milyon belirteç başına

$8.00 milyon belirteç başına

MMLU ?

Mevcut değil

90.2%
pass@1
Kaynak

MMLU-Pro ?

Mevcut değil

MMMU ?

75%
Kaynak

74.8%
Kaynak

HellaSwag ?

Mevcut değil

HumanEval ?

Mevcut değil

MATH ?

96.2%
Kaynak

GPQA ?

84.8%
Diamond
Kaynak

66.3%
Diamond
Kaynak

IFEval ?

93.2%
Kaynak

SimpleQA ?

AIME 2024

48.1%
Kaynak

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

87.3%
pass@1
Kaynak

MathVista ?

Mobil Uygulama

Google Play
Apple Apps

LLM Karşılaştırması
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1