GPT-4.1, wprowadzony przez OpenAI 14 kwietnia 2025 roku, oferuje okno kontekstu o rozmiarze 1 miliona tokenów i obsługuje do 32 768 tokenów na żądanie. Wyróżnia się doskonałą wydajnością w zadaniach programistycznych, osiągając 54,6% w benchmarku SWE-Bench Verified i wykazując 10,5% poprawę względem GPT-4o w MultiChallenge pod względem wykonywania instrukcji. Dane modelu są aktualne do czerwca 2024. Cena wynosi 2,00 $ za milion tokenów wejściowych i 8,00 $ za milion tokenów wyjściowych, z 75% zniżką dla buforowanych danych wejściowych, co czyni go wysoce opłacalnym dla powtarzających się zapytań.
„Llama 3.3 70B Instruct“, stworzony przez Meta, to wielojęzyczny duży model językowy, specjalnie dostrojony do zadań opartych na instrukcjach i zoptymalizowany pod kątem aplikacji konwersacyjnych. Jest w stanie przetwarzać i generować tekst w wielu językach, a jego okno kontekstowe obsługuje do 128 000 tokenów. Wprowadzony na rynek 6 grudnia 2024 r., model przewyższa wiele otwartoźródłowych i komercyjnych chatbotów w różnych branżowych testach porównawczych. Wykorzystuje Grouped-Query Attention (GQA) w celu poprawy skalowalności i został wytrenowany na zróżnicowanym zbiorze danych obejmującym ponad 15 bilionów tokenów z publicznie dostępnych źródeł. Wiedza modelu jest aktualna do grudnia 2023 r.
GPT-4.1 | Llama 3.3 70B Instruct | |
---|---|---|
Dostawca | ||
Strona internetowa | ||
Data wydania | Apr 14, 2025 2 tygodnie ago | Dec 06, 2024 4 miesiące ago |
Modalności | tekst obrazy | tekst |
Dostawcy API | OpenAI API | Fireworks, Together, DeepInfra, Hyperbolic |
Data ostatniej aktualizacji wiedzy | - | 12.2024 |
Open Source | Nie | Tak |
Cena za wejście | $2.00 za milion tokenów | $0.23 za milion tokenów |
Cena za wyjście | $8.00 za milion tokenów | $0.40 za milion tokenów |
MMLU | 90.2% pass@1 Źródło | 86% 0-shot, CoT Źródło |
MMLU Pro | - | 68.9% 5-shot, CoT Źródło |
MMMU | 74.8% Źródło | Niedostępne |
HellaSwag | - | Niedostępne |
HumanEval | - | 88.4% pass@1 Źródło |
MATH | - | 77% 0-shot, CoT Źródło |
GPQA | 66.3% Diamond Źródło | 50.5% 0-shot, CoT Źródło |
IFEval | - | 92.1% Źródło |
Aplikacja mobilna | - |
Compare AI. Test. Benchmarks. Chatboty mobilne, Sketch
Copyright © 2025 All Right Reserved.