Claude 3.5 Haiku

Komentarze: 0
Claude 3.5 Haiku #0
Claude 3.5 Haiku #1
Claude 3.5 Haiku #2
Claude 3.5 Haiku #3
Claude 3.5 Haiku #4

Claude 3.5 Haiku, opracowany przez Anthropic, oferuje okno kontekstowe o wielkości 200 000 tokenów. Cena wynosi 1 $ za milion tokenów wejściowych i 5 $ za milion tokenów wyjściowych, przy czym możliwe są oszczędności do 90% dzięki buforowaniu promptów oraz do 50% poprzez API Message Batches. Model ten, wydany 4 listopada 2024 roku, wyróżnia się w uzupełnianiu kodu, interaktywnych chatbotach, ekstrakcji i etykietowaniu danych, a także moderacji treści w czasie rzeczywistym.

3369
663

Pozycja w ogólnym rankingu na dzień
Czerwiec 2026
11
Ocena użytkowników
https://compare-ai.foundtt.com
4.1

Przegląd modelu

Strona internetowa
Strona internetowa modelu AI
Dostawca
Podmiot dostarczający ten model.
Czat
Wpisz wiadomość, aby rozpocząć czat
-
Data wydania
Kiedy model został po raz pierwszy wydany.
1 rok ago
Lis 04, 2024
Modalności
Rodzaje danych, które ten model może przetwarzać
tekst ?
Dostawcy API
Dostawcy oferujący ten model. (To nie jest wyczerpująca lista.)
Anthropic, AWS Bedrock, Vertex AI
Data ostatniej aktualizacji wiedzy
Kiedy wiedza modelu była ostatnio aktualizowana.
01.04.2024
Open Source
Czy kod modelu jest dostępny do publicznego użytku.
Nie
Cena za wejście
Koszt przetwarzania tokenów w Twoich promptach
$0.80 za milion tokenów
Cena za wyjście
Koszt za tokeny wygenerowane przez model
$4.00
MMLU
Massive Multitask Language Understanding - Testuje wiedzę z 57 dziedzin, w tym matematyki, historii, prawa i innych
Niedostępne
MMLU-Pro
Bardziej zaawansowane benchmarki MMLU z trudniejszymi pytaniami skupionymi na rozumowaniu, większym zestawem wyborów i zmniejszoną wrażliwością na prompty
65%
0-shot CoT
Źródło
MMMU
Massive Multitask Multimodal Understanding - Testuje rozumienie tekstu, obrazów, dźwięku i wideo
Niedostępne
HellaSwag
Wymagające benchmarki uzupełniania zdań
Niedostępne
HumanEval
Ocenia możliwości generowania kodu i rozwiązywania problemów
88.1%
0-shot
Źródło
MATH
Testuje umiejętności rozwiązywania problemów matematycznych na różnych poziomach trudności
69.4%
0-shot CoT
Źródło
GPQA
Testuje wiedzę na poziomie doktorskim z chemii, biologii i fizyki poprzez pytania wielokrotnego wyboru wymagające głębokiej wiedzy specjalistycznej
Niedostępne
IFEval
Testuje zdolność modelu do dokładnego przestrzegania wyraźnych instrukcji formatowania, generowania odpowiednich wyników i utrzymania spójnego przestrzegania instrukcji w różnych zadaniach
Niedostępne
SimpleQA
Ocena dokładności prostych pytań
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Wielojęzyczny benchmark programistyczny.
-
LiveCodeBench v5
Benchmark programowania w czasie rzeczywistym
-
Global MMLU (Lite)
Uproszczona wersja benchmarku do oceny uniwersalności modeli na poziomie globalnym.
-
MathVista
Ocenia zdolności rozumowania matematycznego modeli AI w kontekstach wizualnych
-
Aplikacja mobilna

Dodaj komentarz

Porównaj LLM


10%
Polityka prywatności i ciasteczka

Używamy plików cookies, by ułatwić korzystanie z naszych serwisów. Jeśli nie chcesz, by pliki cookies były zapisywane na Twoim dysku, zmień ustawienia swojej przeglądarki.