



Website AI Model Webpagina | |
Aanbieder De entiteit die dit model aanbiedt. | |
Chat Voer een bericht in om te beginnen met chatten | |
Releasedatum Wanneer het model voor het eerst is vrijgegeven. | 11 maanden ago Jun 17, 2025 |
Modaliteiten Soorten gegevens die dit model kan verwerken | tekst afbeeldingen spraak video |
API-Aanbieders De aanbieders die dit model leveren. (Dit is geen uitputtende lijst.) | Google AI Studio, Vertex AI, Gemini app |
Kennisafsluitdatum Wanneer de kennis van het model voor het laatst is bijgewerkt. | - |
Open Source Of de code van het model beschikbaar is voor publiek gebruik. | Nee |
Prijzen Invoer Kosten voor het verwerken van tokens in uw prompts | $0.10 per miljoen tokens |
Prijzen Uitvoer Kosten voor tokens gegenereerd door het model | $0.40 per miljoen tokens |
MMLU Massive Multitask Language Understanding - Test kennis over 57 onderwerpen, waaronder wiskunde, geschiedenis, recht en meer | 81.1% Bron |
MMLU-Pro Een robuustere MMLU-benchmark met moeilijkere, op redenering gerichte vragen, een grotere keuzeset en verminderde gevoeligheid voor prompts | - |
MMMU Massive Multitask Multimodal Understanding - Test begrip van tekst, afbeeldingen, audio en video | 72.9% Bron |
HellaSwag Een uitdagende benchmark voor zinsvoltooiing | - |
HumanEval Evalueert codegeneratie en probleemoplossende vaardigheden | - |
MATH Test wiskundige probleemoplossende vaardigheden op verschillende moeilijkheidsniveaus | - |
GPQA Test PhD-niveau kennis in scheikunde, biologie en natuurkunde door meerkeuzevragen die diepgaande domeinkennis vereisen | 64.6% Diamond Bron |
IFEval Test het vermogen van het model om expliciete opmaakinstructies nauwkeurig te volgen, geschikte uitvoer te genereren en consistente instructienaleving te behouden bij verschillende taken | - |
SimpleQA Evaluatie van de nauwkeurigheid van eenvoudige vragen | 13% Bron |
AIME 2024 | - |
AIME 2025 | 49.8% Bron |
Aider Polyglot Meertalige programmeerbenchmark. | - |
LiveCodeBench v5 Benchmark voor realtime programmeren | - |
Global MMLU (Lite) Een vereenvoudigde versie van de benchmark om de universaliteit van modellen op wereldwijd niveau te beoordelen. | - |
MathVista Evalueert de wiskundige redeneervermogens van AI-modellen binnen visuele contexten | - |
Mobiele applicatie |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2026 All Right Reserved.