GPT-4.1

OpenAI tarafından 14 Nisan 2025'te piyasaya sürülen GPT-4.1, 1 milyon token bağlam penceresi sunar ve istek başına 32.768 token'a kadar çıktı desteği sağlar. Kodlama görevlerinde olağanüstü performans göstererek SWE-Bench Verified ölçütünde %54,6 başarı elde etmiş ve MultiChallenge'da GPT-4o'ya kıyasla talimat takip etmede %10,5 iyileşme sağlamıştır. Modelin bilgi kesim tarihi Haziran 2024 olarak belirlenmiştir. Fiyatlandırma, milyon giriş token başına 2,00$ ve milyon çıkış token başına 8,00$ olarak belirlenmiş olup, önbelleğe alınmış girdiler için %75 indirim uygulanarak tekrar eden sorgular için oldukça maliyet etkin hale getirilmiştir.

GLM-4.5

GPT-4.1GLM-4.5
Web Sitesi ?
Sağlayıcı ?
Sohbet ?
Yayın Tarihi ?
Modallikler ?
metin ?
görseller ?
metin ?
API Sağlayıcıları ?
OpenAI API
Zhipu AI
Bilgi Kesim Tarihi ?
-
Bilinmiyor
Açık Kaynak ?
Hayır
Evet
Fiyatlandırma Girdisi ?
$2.00 milyon belirteç başına
-
Fiyatlandırma Çıktısı ?
$8.00 milyon belirteç başına
-
MMLU ?
90.2%
pass@1
Kaynak
84.6%
Academic Knowledge
Kaynak
MMLU-Pro ?
-
-
MMMU ?
74.8%
Kaynak
-
HellaSwag ?
-
-
HumanEval ?
-
-
MATH ?
-
-
GPQA ?
66.3%
Diamond
Kaynak
-
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
48.1%
Kaynak
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
87.3%
pass@1
Kaynak
-
MathVista ?
-
-
Mobil Uygulama
-

MathArena ?

Ortalama puan
-
83%
AIME 2025
American Invitational Mathematics Examination sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
-
93%
HMMT February 2025
Şubat 2025 Harvard-MIT Mathematics Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
-
78%
BRUMO 2025
-
92%
SMT 2025
2025 Stanford Math Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
-
82%
CMIMC 2025
2025 Canadian Mathematical Olympiad sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
-
71%

LLM Karşılaştırması

Yorum Ekle


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.