o3

Komentarze: 0
o3 #0
o3 #1
o3 #2
o3 #3

OpenAI o3 to najbardziej zaawansowany model rozumowania od OpenAI, stworzony specjalnie do obsługi złożonych zadań wymagających wysokiej sprawności poznawczej. Wprowadzony w kwietniu 2025 roku, zapewnia wyjątkową wydajność w inżynierii oprogramowania, matematyce i rozwiązywaniu problemów naukowych. Model wprowadza trzy poziomy wysiłku rozumowania — niski, średni i wysoki — pozwalając użytkownikom zrównoważyć opóźnienie i głębię rozumowania w zależności od złożoności zadania. o3 obsługuje niezbędne narzędzia dla deweloperów, w tym wywoływanie funkcji, strukturalne wyniki i komunikaty na poziomie systemu. Dzięki wbudowanym możliwościom wizyjnym o3 może interpretować i analizować obrazy, co czyni go odpowiednim do zastosowań multimodalnych. Jest dostępny przez Chat Completions API, Assistants API i Batch API, umożliwiając elastyczną integrację z przepływami pracy przedsiębiorstw i badań.

3218
928

Pozycja w ogólnym rankingu na dzień
Czerwiec 2026
9
Ocena użytkowników
https://compare-ai.foundtt.com
4.2

Przegląd modelu

Strona internetowa
Strona internetowa modelu AI
Dostawca
Podmiot dostarczający ten model.
Czat
Wpisz wiadomość, aby rozpocząć czat
Data wydania
Kiedy model został po raz pierwszy wydany.
1 rok ago
Kwi 16, 2025
Modalności
Rodzaje danych, które ten model może przetwarzać
tekst ?
obrazy ?
Dostawcy API
Dostawcy oferujący ten model. (To nie jest wyczerpująca lista.)
OpenAI API
Data ostatniej aktualizacji wiedzy
Kiedy wiedza modelu była ostatnio aktualizowana.
-
Open Source
Czy kod modelu jest dostępny do publicznego użytku.
Nie
Cena za wejście
Koszt przetwarzania tokenów w Twoich promptach
$10.00 za milion tokenów
Cena za wyjście
Koszt za tokeny wygenerowane przez model
$40.00 za milion tokenów
MMLU
Massive Multitask Language Understanding - Testuje wiedzę z 57 dziedzin, w tym matematyki, historii, prawa i innych
82.9%
Źródło
MMLU-Pro
Bardziej zaawansowane benchmarki MMLU z trudniejszymi pytaniami skupionymi na rozumowaniu, większym zestawem wyborów i zmniejszoną wrażliwością na prompty
-
MMMU
Massive Multitask Multimodal Understanding - Testuje rozumienie tekstu, obrazów, dźwięku i wideo
-
HellaSwag
Wymagające benchmarki uzupełniania zdań
-
HumanEval
Ocenia możliwości generowania kodu i rozwiązywania problemów
-
MATH
Testuje umiejętności rozwiązywania problemów matematycznych na różnych poziomach trudności
-
GPQA
Testuje wiedzę na poziomie doktorskim z chemii, biologii i fizyki poprzez pytania wielokrotnego wyboru wymagające głębokiej wiedzy specjalistycznej
83.3%
Diamond, no tools
Źródło
IFEval
Testuje zdolność modelu do dokładnego przestrzegania wyraźnych instrukcji formatowania, generowania odpowiednich wyników i utrzymania spójnego przestrzegania instrukcji w różnych zadaniach
-
SimpleQA
Ocena dokładności prostych pytań
-
AIME 2024
91.6%
Źródło
AIME 2025
88.9%
Źródło
Aider Polyglot
Wielojęzyczny benchmark programistyczny.
-
LiveCodeBench v5
Benchmark programowania w czasie rzeczywistym
-
Global MMLU (Lite)
Uproszczona wersja benchmarku do oceny uniwersalności modeli na poziomie globalnym.
-
MathVista
Ocenia zdolności rozumowania matematycznego modeli AI w kontekstach wizualnych
-
Aplikacja mobilna

MathArena ?

Średni wynik86%
AIME 2025
Test oparty na zadaniach z konkursu matematycznego (American Invitational Mathematics Examination),mający na celu sprawdzenie umiejętności matematycznych modeli.
89%
HMMT February 2025
Test oparty na zadaniach z Harvard-MIT Mathematics Tournament, luty 2025, mający na celu sprawdzenie umiejętności matematycznych modeli.
78%
BRUMO 202596%
SMT 2025
Test oparty na zadaniach z Stanford Math Tournament, 2025, mający na celu sprawdzenie umiejętności matematycznych modeli.
88%
CMIMC 2025
Test oparty na zadaniach z Canadian Mathematical Olympiad, 2025, mający na celu sprawdzenie umiejętności matematycznych modeli.
78%

Dodaj komentarz

Porównaj LLM


10%
Polityka prywatności i ciasteczka

Używamy plików cookies, by ułatwić korzystanie z naszych serwisów. Jeśli nie chcesz, by pliki cookies były zapisywane na Twoim dysku, zmień ustawienia swojej przeglądarki.