GPT-4.1, gelanceerd door OpenAI op 14 april 2025, introduceert een contextvenster van 1 miljoen tokens en ondersteunt uitvoer van maximaal 32.768 tokens per verzoek. Het levert uitstekende prestaties bij codeertaken, behaalt 54,6% op de SWE-Bench Verified-benchmark en toont een verbetering van 10,5% ten opzichte van GPT-4o op MultiChallenge voor het opvolgen van instructies. De kennis van het model is bijgewerkt tot juni 2024. De prijs is $2,00 per miljoen tokens voor invoer en $8,00 per miljoen tokens voor uitvoer, met een korting van 75% op gecachete invoer, wat het zeer kostenefficiënt maakt voor herhaalde queries.
Gemini 2.0 Flash Thinking is een geavanceerd redeneermodel ontworpen om prestaties en verklaarbaarheid te verbeteren door het denkproces zichtbaar te maken. Het blinkt uit in complexe probleemoplossing, programmeeruitdagingen en wiskundig redeneren, waarbij het stapsgewijze oplossingen demonstreert. Geoptimaliseerd voor taken die gedetailleerde uitleg en logische analyse vereisen, beschikt het model ook over native toolintegratie, inclusief code-uitvoering en Google Search-mogelijkheden.
GPT-4.1 | Gemini 2.0 Flash Thinking | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Apr 14, 2025 2 weken ago | Dec 19, 2024 4 maanden ago |
Modaliteiten | tekst afbeeldingen | tekst afbeeldingen |
API-Aanbieders | OpenAI API | Google AI Studio, Vertex AI, Gemini API |
Kennisafsluitdatum | - | 04.2024 |
Open Source | Nee | Nee |
Prijzen Invoer | $2.00 per miljoen tokens | Niet beschikbaar |
Prijzen Uitvoer | $8.00 per miljoen tokens | Niet beschikbaar |
MMLU | 90.2% pass@1 Bron | Niet beschikbaar |
MMLU Pro | - | Niet beschikbaar |
MMMU | 74.8% Bron | 75.4% Bron |
HellaSwag | - | Niet beschikbaar |
HumanEval | - | Niet beschikbaar |
MATH | - | Niet beschikbaar |
GPQA | 66.3% Diamond Bron | 74.2% Diamond Science Bron |
IFEval | - | Niet beschikbaar |
Mobiele applicatie |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.