



Website AI Model Webpagina | |
Aanbieder De entiteit die dit model aanbiedt. | |
Chat Voer een bericht in om te beginnen met chatten | |
Releasedatum Wanneer het model voor het eerst is vrijgegeven. | 1 jaar ago Apr 29, 2025 |
Modaliteiten Soorten gegevens die dit model kan verwerken | - |
API-Aanbieders De aanbieders die dit model leveren. (Dit is geen uitputtende lijst.) | - |
Kennisafsluitdatum Wanneer de kennis van het model voor het laatst is bijgewerkt. | - |
Open Source Of de code van het model beschikbaar is voor publiek gebruik. | Ja (Bron) |
Prijzen Invoer Kosten voor het verwerken van tokens in uw prompts | - |
Prijzen Uitvoer Kosten voor tokens gegenereerd door het model | - |
MMLU Massive Multitask Language Understanding - Test kennis over 57 onderwerpen, waaronder wiskunde, geschiedenis, recht en meer | - |
MMLU-Pro Een robuustere MMLU-benchmark met moeilijkere, op redenering gerichte vragen, een grotere keuzeset en verminderde gevoeligheid voor prompts | - |
MMMU Massive Multitask Multimodal Understanding - Test begrip van tekst, afbeeldingen, audio en video | - |
HellaSwag Een uitdagende benchmark voor zinsvoltooiing | - |
HumanEval Evalueert codegeneratie en probleemoplossende vaardigheden | - |
MATH Test wiskundige probleemoplossende vaardigheden op verschillende moeilijkheidsniveaus | - |
GPQA Test PhD-niveau kennis in scheikunde, biologie en natuurkunde door meerkeuzevragen die diepgaande domeinkennis vereisen | - |
IFEval Test het vermogen van het model om expliciete opmaakinstructies nauwkeurig te volgen, geschikte uitvoer te genereren en consistente instructienaleving te behouden bij verschillende taken | - |
SimpleQA Evaluatie van de nauwkeurigheid van eenvoudige vragen | - |
AIME 2024 | Bron |
AIME 2025 | Bron |
Aider Polyglot Meertalige programmeerbenchmark. | - |
LiveCodeBench v5 Benchmark voor realtime programmeren | - |
Global MMLU (Lite) Een vereenvoudigde versie van de benchmark om de universaliteit van modellen op wereldwijd niveau te beoordelen. | - |
MathVista Evalueert de wiskundige redeneervermogens van AI-modellen binnen visuele contexten | - |
Mobiele applicatie | - |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2026 All Right Reserved.