In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.
Claude 3.5 Haiku, entwickelt von Anthropic, bietet ein Kontextfenster von 200.000 Token. Die Preisgestaltung beträgt 1 $ pro Million Eingabe-Token und 5 $ pro Million Ausgabe-Token, mit möglichen Einsparungen von bis zu 90 % durch Prompt-Caching und 50 % über die Message Batches API. Dieses Modell, das am 4. November 2024 veröffentlicht wurde, zeichnet sich durch Codevervollständigung, interaktive Chatbots, Datenextraktion und -kennzeichnung sowie Echtzeit-Inhaltsmoderation aus.
Qwen2.5-VL-32B | Claude 3.5 Haiku | |
---|---|---|
Anbieter | ||
Webseite | ||
Veröffentlichungsdatum | Mar 25, 2025 4 Wochen ago | Nov 04, 2024 5 Monate ago |
Modalitäten | Text Bilder Video | Text |
API-Anbieter | - | Anthropic, AWS Bedrock, Vertex AI |
Datum des Wissensstandes | Unbekannt | 01.04.2024 |
Open Source | Ja (Quelle) | Nein |
Preisgestaltung Eingabe | $0 | $0.80 pro Million Token |
Preisgestaltung Ausgabe | $0 | $4.00 |
MMLU | 78.4% Quelle | Nicht verfügbar |
MMLU Pro | 49.5% | 65% 0-shot CoT Quelle |
MMMU | 70% | Nicht verfügbar |
HellaSwag | Nicht verfügbar | Nicht verfügbar |
HumanEval | Nicht verfügbar | 88.1% 0-shot Quelle |
MATH | 82.2% | 69.4% 0-shot CoT Quelle |
GPQA | 46.0% Diamond | Nicht verfügbar |
IFEval | Nicht verfügbar | Nicht verfügbar |
Mobile Anwendung | - |
Compare AI. Test. Benchmarks. Mobile Chatbot-Apps, Sketch
Copyright © 2025 All Right Reserved.