OpenAI o3 to najbardziej zaawansowany model rozumowania od OpenAI, stworzony specjalnie do obsługi złożonych zadań wymagających wysokiej sprawności poznawczej. Wprowadzony w kwietniu 2025 roku, zapewnia wyjątkową wydajność w inżynierii oprogramowania, matematyce i rozwiązywaniu problemów naukowych. Model wprowadza trzy poziomy wysiłku rozumowania — niski, średni i wysoki — pozwalając użytkownikom zrównoważyć opóźnienie i głębię rozumowania w zależności od złożoności zadania. o3 obsługuje niezbędne narzędzia dla deweloperów, w tym wywoływanie funkcji, strukturalne wyniki i komunikaty na poziomie systemu. Dzięki wbudowanym możliwościom wizyjnym o3 może interpretować i analizować obrazy, co czyni go odpowiednim do zastosowań multimodalnych. Jest dostępny przez Chat Completions API, Assistants API i Batch API, umożliwiając elastyczną integrację z przepływami pracy przedsiębiorstw i badań.
LLaMA 4 Scout to model o 17 miliardach parametrów wykorzystujący architekturę Mixture-of-Experts z 16 aktywnymi ekspertami, co czyni go czołowym modelem multimodalnym w swojej kategorii. Regularnie przewyższa konkurentów takich jak Gemma 3, Gemini 2.0 Flash-Lite i Mistral 3.1 w różnych zadaniach testowych. Pomimo swojej wydajności, LLaMA 4 Scout jest wyjątkowo efektywny — może działać na pojedynczym GPU NVIDIA H100 z kwantyzacją Int4. Dodatkowo oferuje wiodące w branży okno kontekstowe o długości 10 milionów tokenów i jest natywnie multimodalny, umożliwiając płynne przetwarzanie tekstu, obrazów i wideo w zaawansowanych zastosowaniach rzeczywistych.
o3 | Llama 4 Scout | |
---|---|---|
Dostawca | ||
Strona internetowa | ||
Data wydania | Apr 16, 2025 1 miesiąc ago | Apr 05, 2025 1 miesiąc ago |
Modalności | tekst obrazy | tekst obrazy wideo |
Dostawcy API | OpenAI API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra |
Data ostatniej aktualizacji wiedzy | - | 2025-04 |
Open Source | Nie | Tak (Źródło) |
Cena za wejście | $10.00 za milion tokenów | Niedostępne |
Cena za wyjście | $40.00 za milion tokenów | Niedostępne |
MMLU | 82.9% Źródło | Niedostępne |
MMLU Pro | - | 74.3% Reasoning & Knowledge Źródło |
MMMU | - | 69.4% Image Reasoning Źródło |
HellaSwag | - | Niedostępne |
HumanEval | - | Niedostępne |
MATH | - | Niedostępne |
GPQA | 83.3% Diamond, no tools Źródło | 57.2% Diamond Źródło |
IFEval | - | Niedostępne |
Array | - | - |
AIME 2024 | 91.6% Źródło | - |
AIME 2025 | 88.9% Źródło | - |
Array | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Aplikacja mobilna | - |
Compare AI. Test. Benchmarks. Chatboty mobilne, Sketch
Copyright © 2025 All Right Reserved.