OpenAI o3-mini, STEM uygulamaları için tasarlanmış yüksek hızlı ve maliyet etkin bir akıl yürütme modelidir; bilim, matematik ve kodlama alanlarında güçlü performans sergiler. Ocak 2025’te piyasaya sürülen model, fonksiyon çağrısı, yapılandırılmış çıktılar ve geliştirici mesajları gibi temel geliştirici özelliklerini içerir. Kullanıcılar, düşük, orta ve yüksek düzeyde akıl yürütme yoğunluğu arasında seçim yaparak yanıt süresi ile derin analiz arasında denge kurabilir. Görsel yeteneklere sahip olmayan bu model, başlangıçta yalnızca seviye 3-5 API geliştiricilerine sunulmuştur ve Chat Completions API, Assistants API ve Batch API aracılığıyla erişilebilir.
LLaMA 4 Scout, 17 milyar parametreli bir model olup, 16 aktif uzman içeren Mixture-of-Experts mimarisinden yararlanarak kategorisinde en iyi çok modlu model konumundadır. Gemma 3, Gemini 2.0 Flash-Lite ve Mistral 3.1 gibi rakipleri çeşitli ölçütlerde sürekli olarak geride bırakmaktadır. Performansına rağmen, LLaMA 4 Scout son derece verimlidir—Int4 kuantizasyonu ile tek bir NVIDIA H100 GPU üzerinde çalışabilmektedir. Ayrıca, sektör lideri 10 milyon token bağlam penceresi sunmakta ve doğal olarak çok modlu olup, gelişmiş gerçek dünya uygulamaları için metin, görüntü ve video girişlerini sorunsuz bir şekilde işlemektedir.
o3-mini | Llama 4 Scout | |
---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin | metin görseller video |
API Sağlayıcıları
| OpenAI API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra |
Bilgi Kesim Tarihi
| Bilinmiyor | 2025-04 |
Açık Kaynak
| Hayır | Evet (Kaynak) |
Fiyatlandırma Girdisi
| $1.10 milyon belirteç başına | Mevcut değil |
Fiyatlandırma Çıktısı
| $4.40 milyon belirteç başına | Mevcut değil |
MMLU
| 86.9% pass@1, high effort Kaynak | Mevcut değil |
MMLU-Pro
| Mevcut değil | 74.3% Reasoning & Knowledge Kaynak |
MMMU
| Mevcut değil | 69.4% Image Reasoning Kaynak |
HellaSwag
| Mevcut değil | Mevcut değil |
HumanEval
| Mevcut değil | Mevcut değil |
MATH
| 97.9% pass@1, high effort Kaynak | Mevcut değil |
GPQA
| 79.7% 0-shot, high effort Kaynak | 57.2% Diamond Kaynak |
IFEval
| Mevcut değil | Mevcut değil |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobil Uygulama | - |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2025 All Right Reserved.