De OpenAI o3-mini is een hoogwaardig, kosteneffectief redeneermodel ontworpen voor STEM-toepassingen, met sterke prestaties in wetenschap, wiskunde en programmeren. Gelanceerd in januari 2025, omvat het essentiële ontwikkelaarsfuncties zoals functie-aanroepen, gestructureerde uitvoer en ontwikkelaarsberichten. Het model biedt drie redeneerinspanningen—laag, medium en hoog—waardoor gebruikers kunnen optimaliseren tussen diepere analyse en snellere reactietijden. In tegenstelling tot het o3-model heeft het geen visuele mogelijkheden. In eerste instantie beschikbaar voor geselecteerde ontwikkelaars in API-gebruiksniveaus 3-5, kan het worden benaderd via de Chat Completions API, Assistants API en Batch API.
Gemini 2.0 Flash Thinking is een geavanceerd redeneermodel ontworpen om prestaties en verklaarbaarheid te verbeteren door het denkproces zichtbaar te maken. Het blinkt uit in complexe probleemoplossing, programmeeruitdagingen en wiskundig redeneren, waarbij het stapsgewijze oplossingen demonstreert. Geoptimaliseerd voor taken die gedetailleerde uitleg en logische analyse vereisen, beschikt het model ook over native toolintegratie, inclusief code-uitvoering en Google Search-mogelijkheden.
o3-mini | Gemini 2.0 Flash Thinking | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Jan 31, 2025 2 maanden ago | Dec 19, 2024 4 maanden ago |
Modaliteiten | tekst | tekst afbeeldingen |
API-Aanbieders | OpenAI API | Google AI Studio, Vertex AI, Gemini API |
Kennisafsluitdatum | Onbekend | 04.2024 |
Open Source | Nee | Nee |
Prijzen Invoer | $1.10 per miljoen tokens | Niet beschikbaar |
Prijzen Uitvoer | $4.40 per miljoen tokens | Niet beschikbaar |
MMLU | 86.9% pass@1, high effort Bron | Niet beschikbaar |
MMLU Pro | Niet beschikbaar | Niet beschikbaar |
MMMU | Niet beschikbaar | 75.4% Bron |
HellaSwag | Niet beschikbaar | Niet beschikbaar |
HumanEval | Niet beschikbaar | Niet beschikbaar |
MATH | 97.9% pass@1, high effort Bron | Niet beschikbaar |
GPQA | 79.7% 0-shot, high effort Bron | 74.2% Diamond Science Bron |
IFEval | Niet beschikbaar | Niet beschikbaar |
Mobiele applicatie |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.