Claude 3.7 Sonnet ist das bisher fortschrittlichste Modell von Anthropic und die erste hybride Denk-KI auf dem Markt. Es bietet sowohl Standard- als auch erweiterte Denkmodi, wobei letzterer transparente, schrittweise Argumentation ermöglicht. Das Modell glänzt in der Programmierung und Front-End-Webentwicklung und erzielt Spitzenergebnisse bei SWE-bench Verified und TAU-bench. Verfügbar über Claude.ai, die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI, setzt es neue Maßstäbe für intelligente, KI-gestützte Problemlösungen.
In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.
Claude 3.7 Sonnet | Qwen2.5-VL-32B | |
---|---|---|
Webseite
| ||
Anbieter
| ||
Chat
| ||
Veröffentlichungsdatum
| ||
Modalitäten
| Text Bilder | Text Bilder Video |
API-Anbieter
| Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | - |
Datum des Wissensstandes
| - | Unbekannt |
Open Source
| Nein | Ja (Quelle) |
Preisgestaltung Eingabe
| $3.00 pro Million Token | $0 |
Preisgestaltung Ausgabe
| $15.00 pro Million Token | $0 |
MMLU
| Nicht verfügbar | 78.4% Quelle |
MMLU-Pro
| Nicht verfügbar | 49.5% |
MMMU
| 71.8% Quelle | 70% |
HellaSwag
| Nicht verfügbar | Nicht verfügbar |
HumanEval
| Nicht verfügbar | Nicht verfügbar |
MATH
| 82.2% Quelle | 82.2% |
GPQA
| 68% Diamond Quelle | 46.0% Diamond |
IFEval
| 90.8% Quelle | Nicht verfügbar |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobile Anwendung | - | |
VideoGameBench | ||
Gesamtpunktzahl | 0% | - |
Doom II | 0% | - |
Dream DX | 0% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2025 All Right Reserved.