Claude Opus 4 AI Specyfikacja techniczna i recenzja

Claude Opus 4

Komentarze: 1

4975

513

Pozycja w ogólnym rankingu na dzień
Czerwiec 2026

Ocena użytkowników
https://compare-ai.foundtt.com

4.1

Przegląd modelu

Strona internetowa Strona internetowa modelu AI	Open
Dostawca Podmiot dostarczający ten model.	Anthropic
Czat Wpisz wiadomość, aby rozpocząć czat	Open
Data wydania Kiedy model został po raz pierwszy wydany.	1 rok ago Maj 22, 2025
Modalności Rodzaje danych, które ten model może przetwarzać	tekst ? obrazy ?
Dostawcy API Dostawcy oferujący ten model. (To nie jest wyczerpująca lista.)	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Data ostatniej aktualizacji wiedzy Kiedy wiedza modelu była ostatnio aktualizowana.	Nieznane
Open Source Czy kod modelu jest dostępny do publicznego użytku.	Nie
Cena za wejście Koszt przetwarzania tokenów w Twoich promptach	$15
Cena za wyjście Koszt za tokeny wygenerowane przez model	$75 za milion tokenów
MMLU Massive Multitask Language Understanding - Testuje wiedzę z 57 dziedzin, w tym matematyki, historii, prawa i innych	88.8% Źródło
MMLU-Pro Bardziej zaawansowane benchmarki MMLU z trudniejszymi pytaniami skupionymi na rozumowaniu, większym zestawem wyborów i zmniejszoną wrażliwością na prompty	-
MMMU Massive Multitask Multimodal Understanding - Testuje rozumienie tekstu, obrazów, dźwięku i wideo	76.5% Źródło
HellaSwag Wymagające benchmarki uzupełniania zdań	-
HumanEval Ocenia możliwości generowania kodu i rozwiązywania problemów	-
MATH Testuje umiejętności rozwiązywania problemów matematycznych na różnych poziomach trudności	-
GPQA Testuje wiedzę na poziomie doktorskim z chemii, biologii i fizyki poprzez pytania wielokrotnego wyboru wymagające głębokiej wiedzy specjalistycznej	79.6% Diamond Źródło
IFEval Testuje zdolność modelu do dokładnego przestrzegania wyraźnych instrukcji formatowania, generowania odpowiednich wyników i utrzymania spójnego przestrzegania instrukcji w różnych zadaniach	-
SimpleQA Ocena dokładności prostych pytań	-
AIME 2024	-
AIME 2025	75.5% Źródło
Aider Polyglot Wielojęzyczny benchmark programistyczny.	-
LiveCodeBench v5 Benchmark programowania w czasie rzeczywistym	-
Global MMLU (Lite) Uproszczona wersja benchmarku do oceny uniwersalności modeli na poziomie globalnym.	-
MathVista Ocenia zdolności rozumowania matematycznego modeli AI w kontekstach wizualnych	-
Aplikacja mobilna	Google Play Apple Apps

Komentarze (1)

Tawfiq
18 Lipiec 2025
اريد claude opus

Claude Opus 4 Specyfikacja, recenzja i porównanie

Claude Opus 4

Przegląd modelu

Komentarze (1)

Tawfiq

Dodaj komentarz

Porównaj LLM