OpenAI o3 ist das fortschrittlichste Denkmodell von OpenAI, speziell für komplexe, hochkognitive Aufgaben entwickelt. Im April 2025 eingeführt, bietet es herausragende Leistung in Softwareentwicklung, Mathematik und wissenschaftlicher Problemlösung. Das Modell führt drei Stufen von Denkanstrengung ein – niedrig, mittel und hoch –, sodass Benutzer je nach Aufgabenkomplexität zwischen Latenz und Denktiefe abwägen können. o3 unterstützt wesentliche Entwicklertools, einschließlich Funktionsaufrufe, strukturierte Ausgaben und Systemnachrichten. Mit integrierten Bildfähigkeiten kann o3 Bilder interpretieren und analysieren, was es für multimodale Anwendungen geeignet macht. Es ist über Chat Completions API, Assistants API und Batch API für flexible Integration in Unternehmens- und Forschungsworkflows verfügbar.
Gemini 2.0 Flash Thinking ist ein fortschrittliches Modell für logisches Denken, das die Leistung und Erklärbarkeit verbessert, indem es seinen Denkprozess sichtbar macht. Es zeichnet sich durch die Lösung komplexer Probleme, Programmierherausforderungen und mathematische Argumentation aus und zeigt Schritt-für-Schritt-Lösungen. Optimiert für Aufgaben, die detaillierte Erklärungen und logische Analysen erfordern, verfügt das Modell über eine native Tool-Integration, einschließlich Codeausführung und Google-Suche.
o3 | Gemini 2.0 Flash Thinking | |
---|---|---|
Anbieter | ||
Webseite | ||
Veröffentlichungsdatum | Apr 16, 2025 1 Woche ago | Dec 19, 2024 4 Monate ago |
Modalitäten | Text Bilder | Text Bilder |
API-Anbieter | OpenAI API | Google AI Studio, Vertex AI, Gemini API |
Datum des Wissensstandes | - | 04.2024 |
Open Source | Nein | Nein |
Preisgestaltung Eingabe | $10.00 pro Million Token | Nicht verfügbar |
Preisgestaltung Ausgabe | $40.00 pro Million Token | Nicht verfügbar |
MMLU | 82.9% Quelle | Nicht verfügbar |
MMLU Pro | - | Nicht verfügbar |
MMMU | - | 75.4% Quelle |
HellaSwag | - | Nicht verfügbar |
HumanEval | - | Nicht verfügbar |
MATH | - | Nicht verfügbar |
GPQA | 83.3% Diamond, no tools Quelle | 74.2% Diamond Science Quelle |
IFEval | - | Nicht verfügbar |
Mobile Anwendung |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2025 All Right Reserved.