
OpenAI tarafından 14 Nisan 2025'te piyasaya sürülen GPT-4.1, 1 milyon token bağlam penceresi sunar ve istek başına 32.768 token'a kadar çıktı desteği sağlar. Kodlama görevlerinde olağanüstü performans göstererek SWE-Bench Verified ölçütünde %54,6 başarı elde etmiş ve MultiChallenge'da GPT-4o'ya kıyasla talimat takip etmede %10,5 iyileşme sağlamıştır. Modelin bilgi kesim tarihi Haziran 2024 olarak belirlenmiştir. Fiyatlandırma, milyon giriş token başına 2,00$ ve milyon çıkış token başına 8,00$ olarak belirlenmiş olup, önbelleğe alınmış girdiler için %75 indirim uygulanarak tekrar eden sorgular için oldukça maliyet etkin hale getirilmiştir.
| GPT-4.1 | GLM-4.5 | |
|---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin görseller | metin |
API Sağlayıcıları
| OpenAI API | Zhipu AI |
Bilgi Kesim Tarihi
| - | Bilinmiyor |
Açık Kaynak
| Hayır | Evet |
Fiyatlandırma Girdisi
| $2.00 milyon belirteç başına | - |
Fiyatlandırma Çıktısı
| $8.00 milyon belirteç başına | - |
MMLU
| 90.2% pass@1 Kaynak | 84.6% Academic Knowledge Kaynak |
MMLU-Pro
| - | - |
MMMU
| 74.8% Kaynak | - |
HellaSwag
| - | - |
HumanEval
| - | - |
MATH
| - | - |
GPQA
| 66.3% Diamond Kaynak | - |
IFEval
| - | - |
SimpleQA
| - | - |
AIME 2024 | 48.1% Kaynak | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| 87.3% pass@1 Kaynak | - |
MathVista
| - | - |
Mobil Uygulama | - | |
MathArena | ||
| Ortalama puan | - | 83% |
AIME 2025 American Invitational Mathematics Examination sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | - | 93% |
HMMT February 2025 Şubat 2025 Harvard-MIT Mathematics Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | - | 78% |
BRUMO 2025 | - | 92% |
SMT 2025 2025 Stanford Math Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | - | 82% |
CMIMC 2025 2025 Canadian Mathematical Olympiad sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | - | 71% |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2026 All Right Reserved.