o4-mini

Az OpenAI o4-mini az o-sorozat legújabb, könnyű modellje, amelyet hatékony és képes gondolkodásra terveztek szöveges és vizuális feladatokban. A sebesség és teljesítmény optimalizálásával kiemelkedik a kódgenerálásban és a képalapú megértésben, miközben megőrzi a késleltetés és a gondolkodás mélysége közötti egyensúlyt. A modell 200 000 tokenes kontextusablakot támogat, legfeljebb 100 000 kimeneti tokenig, ami lehetővé teszi a kiterjedt, nagy mennyiségű interakciókat. Kezeli a szöveges és képes bemeneteket is, szöveges kimeneteket állít elő fejlett gondolkodási képességekkel. Kompakt architektúrájával és sokoldalú teljesítményével az o4-mini ideális számos valós alkalmazáshoz, amelyek gyors és költséghatékony intelligenciát igényelnek.

Qwen2.5-VL-32B

Az Qwen2-VL megjelenése után öt hónappal a fejlesztők új modelleket építettek rá, értékes visszajelzést nyújtva. Most az Qwen2.5-VL továbbfejlesztett képességeket mutat be, beleértve a képek, szövegek és diagramok pontos elemzését, valamint objektumok lokalizálását strukturált JSON kimenetekkel. Megérti a hosszú videókat, kulcseseményeket azonosít, és ügynökként működik, eszközökkel kommunikálva számítógépeken és telefonokon. A modell architektúrája dinamikus videofeldolgozást és optimalizált ViT kódolót tartalmaz a gyorsaság és pontosság javításáért.

o4-miniQwen2.5-VL-32B
Weboldal ?
Szolgáltató ?
Csevegés ?
Kiadási Dátum ?
Modalitások ?
szöveg ?
képek ?
szöveg ?
képek ?
videó ?
API Szolgáltatók ?
OpenAI API
-
Tudás Befejezési Dátuma ?
-
Ismeretlen
Nyílt Forráskódú ?
Nem
Igen (Forrás)
Bemeneti Árazás ?
$1.10 millió tokenenként
$0
Kimeneti Árazás ?
$4.40 millió tokenenként
$0
MMLU ?
fort
78.4%
Forrás
MMLU-Pro ?
-
49.5%
MMMU ?
81.6%
Forrás
70%
HellaSwag ?
-
Nem elérhető
HumanEval ?
14.28%
Forrás
Nem elérhető
MATH ?
-
82.2%
GPQA ?
81.4%
Forrás
46.0%
Diamond
IFEval ?
-
Nem elérhető
SimpleQA ?
-
-
AIME 2024
93.4%
Forrás
-
AIME 2025
92.7%
Forrás
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilalkalmazás
-

MathArena ?

Átlagpontszám
87%
-
AIME 2025
Teszt, amely az American Invitational Mathematics Examination verseny feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál.
92%
-
HMMT February 2025
Teszt, amely a Harvard-MIT Mathematics Tournament 2025. februári feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál.
83%
-
BRUMO 2025
87%
-
SMT 2025
Teszt, amely a Stanford Math Tournament 2025. évi feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál.
89%
-
CMIMC 2025
Teszt, amely a Canadian Mathematical Olympiad 2025. évi feladataira épül, és a modellek matematikai készségeinek ellenőrzésére szolgál.
84%
-

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.