




Claude 3.7 Sonnet ist das bisher fortschrittlichste Modell von Anthropic und die erste hybride Denk-KI auf dem Markt. Es bietet sowohl Standard- als auch erweiterte Denkmodi, wobei letzterer transparente, schrittweise Argumentation ermöglicht. Das Modell glänzt in der Programmierung und Front-End-Webentwicklung und erzielt Spitzenergebnisse bei SWE-bench Verified und TAU-bench. Verfügbar über Claude.ai, die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI, setzt es neue Maßstäbe für intelligente, KI-gestützte Problemlösungen.
Webseite KI-Modell-Webseite | |
Anbieter Die Entität, die dieses Modell bereitstellt. | |
Chat Geben Sie eine Nachricht ein, um zu chatten | - |
Veröffentlichungsdatum Wann das Modell erstmals veröffentlicht wurde. | 1 Jahr ago Feb 24, 2025 |
Modalitäten Arten von Daten, die dieses Modell verarbeiten kann | Text Bilder |
API-Anbieter Die Anbieter, die dieses Modell anbieten. (Diese Liste ist nicht vollständig.) | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI |
Datum des Wissensstandes Wann das Wissen des Modells zuletzt aktualisiert wurde. | - |
Open Source Ob der Code des Modells öffentlich verfügbar ist. | Nein |
Preisgestaltung Eingabe Kosten für die Verarbeitung von Token in Ihren Eingaben | $3.00 pro Million Token |
Preisgestaltung Ausgabe Kosten für vom Modell generierte Token | $15.00 pro Million Token |
MMLU Massive Multitask Language Understanding – Testet Wissen in 57 Fächern, darunter Mathematik, Geschichte, Recht und mehr | Nicht verfügbar |
MMLU-Pro Ein robusterer MMLU-Benchmark mit schwierigeren, auf logisches Denken fokussierten Fragen, einer größeren Auswahl an Antworten und geringerer Sensitivität für Eingabevariationen | Nicht verfügbar |
MMMU Massive Multitask Multimodal Understanding – Testet das Verständnis über Text, Bilder, Audio und Video hinweg | 71.8% Quelle |
HellaSwag Ein anspruchsvoller Benchmark für Satzvervollständigung | Nicht verfügbar |
HumanEval Bewertet Codegenerierung und Problemlösungsfähigkeiten | Nicht verfügbar |
MATH Testet mathematische Problemlösungsfähigkeiten auf verschiedenen Schwierigkeitsstufen | 82.2% Quelle |
GPQA Testet Wissen auf PhD-Niveau in Chemie, Biologie und Physik durch Multiple-Choice-Fragen, die tiefgehendes Fachwissen erfordern | 68% Diamond Quelle |
IFEval Testet die Fähigkeit des Modells, Formatierungsvorgaben genau zu befolgen, angemessene Ausgaben zu generieren und konsistente Instruktionsbefolgung über verschiedene Aufgaben hinweg zu gewährleisten | 90.8% Quelle |
SimpleQA Bewertung der Genauigkeit einfacher Fragen | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Mehrsprachige Programmier-Benchmark. | - |
LiveCodeBench v5 Benchmark für Echtzeit-Programmierung | - |
Global MMLU (Lite) Eine vereinfachte Version des Benchmarks zur Beurteilung der Universalität von Modellen auf globaler Ebene. | - |
MathVista Bewertet die mathematischen Denkfähigkeiten von KI-Modellen in visuellen Kontexten | - |
Mobile Anwendung | |
VideoGameBench | |
| Gesamtpunktzahl | 0% |
| Doom II | 0% |
| Dream DX | 0% |
| Awakening DX | 0% |
| Civilization I | 0% |
| Pokemon Crystal | 0% |
| The Need for Speed | 0% |
| The Incredible Machine | 0% |
| Secret Game 1 | 0% |
| Secret Game 2 | 0% |
| Secret Game 3 | 0% |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2026 All Right Reserved.