GPT-4.1, von OpenAI am 14. April 2025 eingeführt, bietet ein Kontextfenster von 1 Million Token und unterstützt Ausgaben von bis zu 32.768 Token pro Anfrage. Es liefert herausragende Leistung bei Codierungsaufgaben, erreicht 54,6 % im SWE-Bench Verified-Benchmark und zeigt eine 10,5 %ige Verbesserung gegenüber GPT-4o im MultiChallenge für die Befolgung von Anweisungen. Der Wissensstand des Modells ist auf Juni 2024 festgelegt. Die Preisgestaltung beträgt 2,00 $ pro Million Token für Eingaben und 8,00 $ pro Million Token für Ausgaben, mit einem 75 %igen Rabatt für zwischengespeicherte Eingaben, was es für wiederholte Abfragen äußerst kosteneffizient macht.
Llama 4 Maverick | GPT-4.1 | |
---|---|---|
Webseite
| ||
Anbieter
| ||
Chat
| ||
Veröffentlichungsdatum
| ||
Modalitäten
| Text Bilder Video | Text Bilder |
API-Anbieter
| Meta AI, Hugging Face, Fireworks, Together, DeepInfra | OpenAI API |
Datum des Wissensstandes
| 2024-08 | - |
Open Source
| Ja (Quelle) | Nein |
Preisgestaltung Eingabe
| Nicht verfügbar | $2.00 pro Million Token |
Preisgestaltung Ausgabe
| Nicht verfügbar | $8.00 pro Million Token |
MMLU
| Nicht verfügbar | 90.2% pass@1 Quelle |
MMLU-Pro
| 80.5% Quelle | - |
MMMU
| 73.4% Quelle | 74.8% Quelle |
HellaSwag
| Nicht verfügbar | - |
HumanEval
| Nicht verfügbar | - |
MATH
| Nicht verfügbar | - |
GPQA
| 69.8% Diamond Quelle | 66.3% Diamond Quelle |
IFEval
| Nicht verfügbar | - |
SimpleQA
| - | - |
AIME 2024 | - | 48.1% Quelle |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | 87.3% pass@1 Quelle |
MathVista
| - | - |
Mobile Anwendung | - | |
VideoGameBench | ||
Gesamtpunktzahl | 0% | - |
Doom II | 0% | - |
Dream DX | 0% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | %0 | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2025 All Right Reserved.