Claude Opus 4

Komentarze: 1
Claude Opus 4 #0
Claude Opus 4 #1
4975
513

Pozycja w ogólnym rankingu na dzień
Czerwiec 2026
18
Ocena użytkowników
https://compare-ai.foundtt.com
4.1

Przegląd modelu

Strona internetowa
Strona internetowa modelu AI
Dostawca
Podmiot dostarczający ten model.
Czat
Wpisz wiadomość, aby rozpocząć czat
Data wydania
Kiedy model został po raz pierwszy wydany.
1 rok ago
Maj 22, 2025
Modalności
Rodzaje danych, które ten model może przetwarzać
tekst ?
obrazy ?
Dostawcy API
Dostawcy oferujący ten model. (To nie jest wyczerpująca lista.)
Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Data ostatniej aktualizacji wiedzy
Kiedy wiedza modelu była ostatnio aktualizowana.
Nieznane
Open Source
Czy kod modelu jest dostępny do publicznego użytku.
Nie
Cena za wejście
Koszt przetwarzania tokenów w Twoich promptach
$15
Cena za wyjście
Koszt za tokeny wygenerowane przez model
$75 za milion tokenów
MMLU
Massive Multitask Language Understanding - Testuje wiedzę z 57 dziedzin, w tym matematyki, historii, prawa i innych
88.8%
Źródło
MMLU-Pro
Bardziej zaawansowane benchmarki MMLU z trudniejszymi pytaniami skupionymi na rozumowaniu, większym zestawem wyborów i zmniejszoną wrażliwością na prompty
-
MMMU
Massive Multitask Multimodal Understanding - Testuje rozumienie tekstu, obrazów, dźwięku i wideo
76.5%
Źródło
HellaSwag
Wymagające benchmarki uzupełniania zdań
-
HumanEval
Ocenia możliwości generowania kodu i rozwiązywania problemów
-
MATH
Testuje umiejętności rozwiązywania problemów matematycznych na różnych poziomach trudności
-
GPQA
Testuje wiedzę na poziomie doktorskim z chemii, biologii i fizyki poprzez pytania wielokrotnego wyboru wymagające głębokiej wiedzy specjalistycznej
79.6%
Diamond
Źródło
IFEval
Testuje zdolność modelu do dokładnego przestrzegania wyraźnych instrukcji formatowania, generowania odpowiednich wyników i utrzymania spójnego przestrzegania instrukcji w różnych zadaniach
-
SimpleQA
Ocena dokładności prostych pytań
-
AIME 2024
-
AIME 2025
75.5%
Źródło
Aider Polyglot
Wielojęzyczny benchmark programistyczny.
-
LiveCodeBench v5
Benchmark programowania w czasie rzeczywistym
-
Global MMLU (Lite)
Uproszczona wersja benchmarku do oceny uniwersalności modeli na poziomie globalnym.
-
MathVista
Ocenia zdolności rozumowania matematycznego modeli AI w kontekstach wizualnych
-
Aplikacja mobilna

Komentarze (1)

  1. Tawfiq

    18 Lipiec 2025

    اريد claude opus

Dodaj komentarz

Porównaj LLM


10%
Polityka prywatności i ciasteczka

Używamy plików cookies, by ułatwić korzystanie z naszych serwisów. Jeśli nie chcesz, by pliki cookies były zapisywane na Twoim dysku, zmień ustawienia swojej przeglądarki.