Claude 3.5 Haiku المواصفات الفنية للذكاء الاصطناعي ومراجعته

Claude 3.5 Haiku

تعليقات: 0

كلود 3.5 هايكو، المطور من قبل أنثروبيك، يوفر نافذة سياقية تبلغ 200 ألف وحدة. يتم تحديد التسعير عند 1 دولار لكل مليون وحدة إدخال و5 دولارات لكل مليون وحدة إخراج، مع توفير محتمل يصل إلى 90٪ عبر التخزين المؤقت للطلبات و50٪ عبر واجهة Message Batches API. تم إصداره في 4 نوفمبر 2024، ويتفوق هذا النموذج في إكمال الأكواد، والدردشات التفاعلية، واستخراج البيانات وتصنيفها، بالإضافة إلى مراقبة المحتوى في الوقت الفعلي.

3369

663

المركز في التصنيف العام اعتبارًا من
يوليو 2026

تقييم المستخدمين
https://compare-ai.foundtt.com

4.1

نظرة عامة على النموذج

موقع الويب صفحة نموذج الذكاء الاصطناعي على الويب	Open
المزود الكيان الذي يوفر هذا النموذج.	Anthropic
الدردشة أدخل رسالة لبدء الدردشة	-
تاريخ الإصدار تاريخ الإصدار الأول للنموذج.	1 سنة ago نوف 04, 2024
الوسائط أنواع البيانات التي يمكن لهذا النموذج معالجتها	نص ?
مزودو API المزودون الذين يقدمون هذا النموذج. (هذه ليست قائمة شاملة.)	Anthropic, AWS Bedrock, Vertex AI
تاريخ قطع المعرفة تاريخ آخر تحديث لمعرفة النموذج.	01.04.2024
مفتوح المصدر ما إذا كان كود النموذج متاحًا للاستخدام العام.	لا
تسعير الإدخال تكلفة معالجة الرموز في مطالباتك	$0.80 لكل مليون رمز
تسعير الإخراج تكلفة الرموز التي يولدها النموذج	$4.00
MMLU فهم اللغة متعدد المهام الضخم - يختبر المعرفة عبر 57 موضوعًا بما في ذلك الرياضيات والتاريخ والقانون والمزيد	غير متاح
MMLU-Pro معيار MMLU أكثر قوة مع أسئلة أكثر صعوبة تركز على التفكير، ومجموعة اختيار أكبر، وتقليل حساسية المطالبة	65% 0-shot CoT المصدر
MMMU فهم متعدد المهام والوسائط الضخم - يختبر الفهم عبر النصوص والصور والصوت والفيديو	غير متاح
HellaSwag معيار إكمال الجمل الصعب	غير متاح
HumanEval يقيم قدرات توليد الكود وحل المشكلات	88.1% 0-shot المصدر
MATH يختبر قدرات حل المشكلات الرياضية عبر مستويات صعوبة مختلفة	69.4% 0-shot CoT المصدر
GPQA يختبر المعرفة على مستوى الدكتوراه في الكيمياء والأحياء والفيزياء من خلال أسئلة متعددة الخيارات تتطلب خبرة عميقة في المجال	غير متاح
IFEval يختبر قدرة النموذج على اتباع تعليمات التنسيق الصريحة بدقة، وتوليد مخرجات مناسبة، والحفاظ على الالتزام بالتعليمات عبر مهام مختلفة	غير متاح
SimpleQA تقييم دقة الأسئلة البسيطة	-
AIME 2024	-
AIME 2025	-
Aider Polyglot معيار البرمجة متعدد اللغات.	-
LiveCodeBench v5 معيار للبرمجة في الوقت الحقيقي	-
Global MMLU (Lite) نسخة مبسطة من المعيار لتقييم عالمية النماذج على المستوى العالمي.	-
MathVista تقييم قدرات التفكير الرياضي لنماذج الذكاء الاصطناعي في سياقات بصرية	-
تطبيق الجوال	Google Play Apple Apps

Claude 3.5 Haiku المواصفات، المراجعة، والمقارنة

Claude 3.5 Haiku

نظرة عامة على النموذج

إضافة تعليق

مقارنة نماذج LLM