




A Gemini 2.0 Flash Thinking egy fejlett logikai modell, amely a teljesítmény és érthetőség javítására lett tervezve, azáltal, hogy láthatóvá teszi gondolkodási folyamatát. Kiválóan alkalmas összetett problémák megoldására, programozási kihívásokra és matematikai érvelésre, lépésről lépésre bemutatva a megoldásokat. Azokra a feladatokra optimalizálták, amelyek részletes magyarázatot és logikai elemzést igényelnek, továbbá natív eszközintegrációval rendelkezik, beleértve a kódvégrehajtást és a Google Keresés funkciókat.
Weboldal AI Modell Weboldal | |
Szolgáltató A modellt biztosító entitás. | |
Csevegés Írjon be egy üzenetet a csevegés megkezdéséhez | - |
Kiadási Dátum Mikor jelent meg a modell először. | 1 év ago Dec 19, 2024 |
Modalitások A modell által feldolgozható adattípusok | szöveg képek |
API Szolgáltatók A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.) | Google AI Studio, Vertex AI, Gemini API |
Tudás Befejezési Dátuma Utoljára mikor frissült a modell tudása. | 04.2024 |
Nyílt Forráskódú A modell kódja nyilvánosan használható-e. | Nem |
Bemeneti Árazás A promptokban feldolgozott tokenek költsége | Nem elérhető |
Kimeneti Árazás A modell által generált tokenek költsége | Nem elérhető |
MMLU Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket | Nem elérhető |
MMLU-Pro Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel | Nem elérhető |
MMMU Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén | 75.4% Forrás |
HellaSwag Egy kihívást jelentő mondatkiegészítési benchmark | Nem elérhető |
HumanEval Értékeli a kódgenerálás és problémamegoldó képességeket | Nem elérhető |
MATH Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket | Nem elérhető |
GPQA Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek | 74.2% Diamond Science Forrás |
IFEval Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során | Nem elérhető |
SimpleQA Egyszerű kérdések pontosságának értékelése | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Többnyelvű programozási benchmark. | - |
LiveCodeBench v5 Valós idejű programozási benchmark | - |
Global MMLU (Lite) A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére. | - |
MathVista Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben | - |
Mobilalkalmazás |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2026 All Right Reserved.