


Website AI Model Webpagina | |
Aanbieder De entiteit die dit model aanbiedt. | |
Chat Voer een bericht in om te beginnen met chatten | |
Releasedatum Wanneer het model voor het eerst is vrijgegeven. | 1 jaar ago Mei 22, 2025 |
Modaliteiten Soorten gegevens die dit model kan verwerken | tekst afbeeldingen |
API-Aanbieders De aanbieders die dit model leveren. (Dit is geen uitputtende lijst.) | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI |
Kennisafsluitdatum Wanneer de kennis van het model voor het laatst is bijgewerkt. | Onbekend |
Open Source Of de code van het model beschikbaar is voor publiek gebruik. | Nee |
Prijzen Invoer Kosten voor het verwerken van tokens in uw prompts | $15 |
Prijzen Uitvoer Kosten voor tokens gegenereerd door het model | $75 per miljoen tokens |
MMLU Massive Multitask Language Understanding - Test kennis over 57 onderwerpen, waaronder wiskunde, geschiedenis, recht en meer | 88.8% Bron |
MMLU-Pro Een robuustere MMLU-benchmark met moeilijkere, op redenering gerichte vragen, een grotere keuzeset en verminderde gevoeligheid voor prompts | - |
MMMU Massive Multitask Multimodal Understanding - Test begrip van tekst, afbeeldingen, audio en video | 76.5% Bron |
HellaSwag Een uitdagende benchmark voor zinsvoltooiing | - |
HumanEval Evalueert codegeneratie en probleemoplossende vaardigheden | - |
MATH Test wiskundige probleemoplossende vaardigheden op verschillende moeilijkheidsniveaus | - |
GPQA Test PhD-niveau kennis in scheikunde, biologie en natuurkunde door meerkeuzevragen die diepgaande domeinkennis vereisen | 79.6% Diamond Bron |
IFEval Test het vermogen van het model om expliciete opmaakinstructies nauwkeurig te volgen, geschikte uitvoer te genereren en consistente instructienaleving te behouden bij verschillende taken | - |
SimpleQA Evaluatie van de nauwkeurigheid van eenvoudige vragen | - |
AIME 2024 | - |
AIME 2025 | 75.5% Bron |
Aider Polyglot Meertalige programmeerbenchmark. | - |
LiveCodeBench v5 Benchmark voor realtime programmeren | - |
Global MMLU (Lite) Een vereenvoudigde versie van de benchmark om de universaliteit van modellen op wereldwijd niveau te beoordelen. | - |
MathVista Evalueert de wiskundige redeneervermogens van AI-modellen binnen visuele contexten | - |
Mobiele applicatie |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2026 All Right Reserved.
Reacties (1)
Tawfiq
18 Juli 2025اريد claude opus