GPT-4.1, von OpenAI am 14. April 2025 eingeführt, bietet ein Kontextfenster von 1 Million Token und unterstützt Ausgaben von bis zu 32.768 Token pro Anfrage. Es liefert herausragende Leistung bei Codierungsaufgaben, erreicht 54,6 % im SWE-Bench Verified-Benchmark und zeigt eine 10,5 %ige Verbesserung gegenüber GPT-4o im MultiChallenge für die Befolgung von Anweisungen. Der Wissensstand des Modells ist auf Juni 2024 festgelegt. Die Preisgestaltung beträgt 2,00 $ pro Million Token für Eingaben und 8,00 $ pro Million Token für Ausgaben, mit einem 75 %igen Rabatt für zwischengespeicherte Eingaben, was es für wiederholte Abfragen äußerst kosteneffizient macht.
In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.
GPT-4.1 | Qwen2.5-VL-32B | |
---|---|---|
Anbieter | ||
Webseite | ||
Veröffentlichungsdatum | Apr 14, 2025 1 Monat ago | Mar 25, 2025 2 Monate ago |
Modalitäten | Text Bilder | Text Bilder Video |
API-Anbieter | OpenAI API | - |
Datum des Wissensstandes | - | Unbekannt |
Open Source | Nein | Ja (Quelle) |
Preisgestaltung Eingabe | $2.00 pro Million Token | $0 |
Preisgestaltung Ausgabe | $8.00 pro Million Token | $0 |
MMLU | 90.2% pass@1 Quelle | 78.4% Quelle |
MMLU Pro | - | 49.5% |
MMMU | 74.8% Quelle | 70% |
HellaSwag | - | Nicht verfügbar |
HumanEval | - | Nicht verfügbar |
MATH | - | 82.2% |
GPQA | 66.3% Diamond Quelle | 46.0% Diamond |
IFEval | - | Nicht verfügbar |
Array | - | - |
AIME 2024 | 48.1% Quelle | - |
AIME 2025 | - | - |
Array | - | - |
Array | - | - |
Array | 87.3% pass@1 Quelle | - |
Array | - | - |
Mobile Anwendung | - |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2025 All Right Reserved.