Gemini 2.0 Flash Thinking

Hozzászólások: 0
Gemini 2.0 Flash Thinking #0
Gemini 2.0 Flash Thinking #1
Gemini 2.0 Flash Thinking #2
Gemini 2.0 Flash Thinking #3

A Gemini 2.0 Flash Thinking egy fejlett logikai modell, amely a teljesítmény és érthetőség javítására lett tervezve, azáltal, hogy láthatóvá teszi gondolkodási folyamatát. Kiválóan alkalmas összetett problémák megoldására, programozási kihívásokra és matematikai érvelésre, lépésről lépésre bemutatva a megoldásokat. Azokra a feladatokra optimalizálták, amelyek részletes magyarázatot és logikai elemzést igényelnek, továbbá natív eszközintegrációval rendelkezik, beleértve a kódvégrehajtást és a Google Keresés funkciókat.

4466
870

Helyezés az összesített rangsorban dátummal Június 2026
28
Felhasználói értékelés https://compare-ai.foundtt.com
3.9

Modell Áttekintés

Weboldal
AI Modell Weboldal
Szolgáltató
A modellt biztosító entitás.
Csevegés
Írjon be egy üzenetet a csevegés megkezdéséhez
-
Kiadási Dátum
Mikor jelent meg a modell először.
1 év ago
Dec 19, 2024
Modalitások
A modell által feldolgozható adattípusok
szöveg ?
képek ?
API Szolgáltatók
A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.)
Google AI Studio, Vertex AI, Gemini API
Tudás Befejezési Dátuma
Utoljára mikor frissült a modell tudása.
04.2024
Nyílt Forráskódú
A modell kódja nyilvánosan használható-e.
Nem
Bemeneti Árazás
A promptokban feldolgozott tokenek költsége
Nem elérhető
Kimeneti Árazás
A modell által generált tokenek költsége
Nem elérhető
MMLU
Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket
Nem elérhető
MMLU-Pro
Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel
Nem elérhető
MMMU
Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén
75.4%
Forrás
HellaSwag
Egy kihívást jelentő mondatkiegészítési benchmark
Nem elérhető
HumanEval
Értékeli a kódgenerálás és problémamegoldó képességeket
Nem elérhető
MATH
Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket
Nem elérhető
GPQA
Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek
74.2%
Diamond Science
Forrás
IFEval
Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során
Nem elérhető
SimpleQA
Egyszerű kérdések pontosságának értékelése
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Többnyelvű programozási benchmark.
-
LiveCodeBench v5
Valós idejű programozási benchmark
-
Global MMLU (Lite)
A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére.
-
MathVista
Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben
-
Mobilalkalmazás

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.