gemini

Google predstavil Gemini 3: prvý model v histórii s Elo skóre nad 1 500

Google 18. novembra 2025 spustil Gemini 3 — tretiu generáciu AI modelov s historicky najvyšším skóre na LMArene a výraznými zlepšeniami v multimodálnych schopnostiach a kódovaní.

Google 18. novembra 2025 predstavil Gemini 3 — svoju tretiu generáciu AI modelov, ktorú Google DeepMind označuje za najinteligentnejší model, aký kedy vytvorili. Hneď v deň spustenia podľa oficiálneho blogu Google model dosiahol historicky najvyššie skóre v slepom hodnotení používateľov a predbehol konkurenčné modely od OpenAI aj Anthropic. Dostupný je okamžite cez Gemini appku, Google Search, AI Studio aj podnikový Vertex AI.

Čo je LMArena a prečo je výsledok historický?

LMArena je platforma, kde skutoční používatelia porovnávajú odpovede dvoch AI modelov vedľa seba — bez toho, aby vedeli, ktorý model je ktorý. Na základe toho, ktorá odpoveď sa im zdá lepšia, sa modelom počíta Elo skóre (systém hodnotenia prevzatý zo šachu, kde vyššie číslo znamená lepší výkon). Gemini 3 Pro dosiahol skóre 1 501 Elo — ako vôbec prvý model v histórii, ktorý prelomil hranicu 1 500. Pre porovnanie: predchádzajúci líder, Gemini 2.5 Pro, mal skóre 1 451. Gemini 3 tak predbehol GPT-5.1 od OpenAI aj Claude Sonnet 4.5 od Anthropic nielen v celkovom hodnotení, ale aj v samostatných kategóriách pre texty, kódovanie a prácu s obrázkami. VentureBeat uvádza, že na LMArene Gemini 3 predbehol konkurenciu v matematike, dlhých textoch, kreatívnom písaní aj odborných oblastiach. Zároveň Google zverejnil výsledky na akademickom teste GPQA Diamond — zbierke otázok doktorandskej úrovne z vedy — kde model dosiahol 91,9 %. V réžii špeciálneho režimu Deep Think (hlbšie rozmýšľanie, určené pre najnáročnejšie úlohy) toto číslo stúpa na 93,8 %.

Prečo je najväčší skok práve v obrázkoch a videu?

Predchádzajúce generácie Gemini už zvládali spracovávať text, obrázky aj video, no Gemini 3 posunul tieto schopnosti výrazne ďalej. Na štandardizovanom teste MMMU-Pro, ktorý meria pochopenie obrázkov v kombinácii s textom, dosiahol model 81 %. Na teste Video-MMMU, kde AI musí odpovedať na otázky na základe video obsahu, dosiahol 87,6 %. Oba výsledky prekonávajú aktuálne vlajkové modely od OpenAI aj Anthropic. Čo to v praxi znamená? Model dokáže v jednom požiadavku spracovať kombináciu PDF dokumentov, snímok obrazovky a videoklipu — bez toho, aby ste museli budovať osobitné systémy pre každý typ obsahu. Pre firmy, ktoré pracujú s faktúrami, technickými výkresmi, protokolmi z výroby alebo medicínskymi snímkami, ide o zásadný posun. Okrem vizuálnych úloh si Gemini 3 posilnil aj v kódovaní. Na teste SWE-bench Verified — kde AI rieši reálne nahlásené chyby z open-source projektov na GitHube — dosiahol model 76,2 %, čo je výrazné zlepšenie oproti predchádzajúcej generácii. Výsledok je blízky najlepším kódovacím modelom od Anthropic, pričom Claude Sonnet 4.5 dosiahol na tom istom teste 77,2 % — Anthropic teda mierne vedie o jeden percentuálny bod.

Čo to znamená pre vaše podnikanie?

Gemini 3 je dostupný niekoľkými cestami. Bežní používatelia ho nájdu v Gemini appke a v Google Search. Vývojári a firmy s ním môžu pracovať cez Google AI Studio alebo podnikový Vertex AI. Cena za API prístup (rozhranie, cez ktoré firmy prepájajú model so svojimi systémami) začína pri 2 dolároch za milión vstupných tokenov — zhruba toľko, ako stojí spracovanie asi 750 000 slov. Lacnejšia verzia modelu, Gemini 3 Flash, vychádza na 0,50 dolárov za milión vstupných tokenov, čo z nej robí jednu z najdostupnejších možností na trhu. Pre slovenské a stredoeurópske firmy je zaujímavá najmä dostupnosť cez Vertex AI — Google Cloud platformu, ktorá ponúka európske dátové centrá, čo môže byť dôležité z pohľadu GDPR a lokalizácie dát. Konkrétne oblasti, kde môže Gemini 3 priniesť reálnu úsporu: spracovanie faktúr a účtovných dokladov (model prečíta naskenovaný dokument a extrahuje dáta), kontrola kvality vo výrobe (analýza fotografií produktov na identifikáciu chýb), analýza zmlúv a právnych dokumentov alebo medicínske zobrazovanie ako podporný nástroj pre diagnostiku. Google tiež spustil platformu Google Antigravity — nové vývojové prostredie postavené špeciálne na Gemini 3, ktoré umožňuje AI agentom samostatne plánovať a vykonávať viacstupňové softvérové úlohy vrátane prístupu k editoru kódu, terminálu aj prehliadaču. To otvára dvere pre firmy, ktoré chcú automatizovať opakujúce sa IT procesy bez potreby veľkého tímu programátorov. Deep Think režim — určený pre naozaj náročné analytické úlohy — zatiaľ dostanú predplatitelia Google AI Ultra, no Google avizoval jeho širšie sprístupnenie v blízkej budúcnosti. Aktuálne si Gemini 3 Pro zadarmo (s obmedzeným počtom dotazov) môžete vyskúšať priamo v Google AI Studio.

Google predstavil Gemini 3: prvý model v histórii s Elo skóre nad 1 500

Čo je LMArena a prečo je výsledok historický?

Prečo je najväčší skok práve v obrázkoch a videu?

Čo to znamená pre vaše podnikanie?

Zdroje

Read more

OpenAI aktualizovalo Agents SDK: sandbox, podpora 100+ modelov a plánované subagenty

Anthropic spustil Claude Managed Agents: AI agenti pre firmy bez vlastnej infraštruktúry

Koniec Sory: Prečo OpenAI vypína svoj AI video nástroj a čo ho nahradí

AI agenti v praxi: čo to znamená pre firmy na Slovensku