Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet — це найдосконаліша модель ШІ від Anthropic на сьогодні та перша гібридна система для міркувань на ринку. Він пропонує як стандартний, так і розширений режими мислення, причому останній забезпечує прозоре, покрокове міркування. Модель демонструє значні покращення в кодуванні та фронтенд-розробці, досягаючи передових результатів у тестах SWE-bench Verified і TAU-bench. Доступний через Claude.ai, API Anthropic, Amazon Bedrock і Google Cloud Vertex AI, він задає новий стандарт для інтелектуального вирішення проблем, керованого ШІ.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, створена Meta, — це багатомовна велика мовна модель, спеціально налаштована для завдань на основі інструкцій і оптимізована для розмовних додатків. Вона може обробляти та генерувати текст кількома мовами, підтримуючи контекстне вікно до 128 000 токенів. Запущена 6 грудня 2024 року, модель перевершує багато відкритих і комерційних чат-ботів у різних галузевих тестах. Використовує Grouped-Query Attention (GQA) для покращення масштабованості та навчена на різноманітному наборі даних, що містить понад 15 трильйонів токенів із публічних джерел. Знання моделі актуальні до грудня 2023 року.

Claude 3.7 Sonnet - Extended ThinkingLlama 3.3 70B Instruct
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
текст ?
Постачальники API ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fireworks, Together, DeepInfra, Hyperbolic
Дата оновлення знань ?
-
12.2024
Відкритий код ?
Ні
Так
Вартість введення ?
$3.00 за мільйон токенів
$0.23 за мільйон токенів
Вартість виведення ?
$15.00 за мільйон токенів
$0.40 за мільйон токенів
MMLU ?
Недоступно
86%
0-shot, CoT
Джерело
MMLU-Pro ?
Недоступно
68.9%
5-shot, CoT
Джерело
MMMU ?
75%
Джерело
Недоступно
HellaSwag ?
Недоступно
Недоступно
HumanEval ?
Недоступно
88.4%
pass@1
Джерело
MATH ?
96.2%
Джерело
77%
0-shot, CoT
Джерело
GPQA ?
84.8%
Diamond
Джерело
50.5%
0-shot, CoT
Джерело
IFEval ?
93.2%
Джерело
92.1%
Джерело
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Мобільний додаток
-

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.