NVIDIA Vera Rubin NVL72: desaťnásobne lacnejšia AI inferencia a čo to znamená pre vás

NVIDIA predstavila Vera Rubin NVL72 — nástupcu platformy Blackwell s desaťnásobne lacnejšou AI inferenciou. Čo táto technológia znamená pre firmy na Slovensku?

Share

NVIDIA 25. februára 2026 predstavila médiám svoju novú generáciu AI infraštruktúry s názvom Vera Rubin NVL72 — nástupcu súčasnej platformy Blackwell. Jeden celý stojanový systém (rack) by mal stáť okolo 3,5 až 4 miliónov dolárov, no kľúčovým sľubom je desaťnásobné zníženie nákladov na generovanie AI odpovedí oproti predchodcovi. V rade na dodávky stoja Microsoft, Google, Amazon aj ďalší technologickí giganti.

Kto bola Vera Rubin a prečo nesie čip jej meno?

NVIDIA dlhodobo pomenúva svoje čipové architektúry po slávnych vedkyniach a vedcoch. Vera Rubin bola americká astronomička, ktorej výskum rotácie galaxií priniesol presvedčivé dôkazy o existencii tzv. tmavej hmoty — neviditeľnej látky, ktorá tvorí väčšinu hmoty vo vesmíre (okolo 85 % všetkej hmoty). Zomrela v roku 2016 a jej meno dnes nesie aj observatórium v Čile. NVIDIA sa rozhodla pomenovať po nej celú novú generáciu AI akcelerátorov: procesor (CPU) dostal meno Vera a grafický čip (GPU) meno Rubin.

Názov teda nie je náhodný — rovnako ako Vera Rubin odhalila skrytú hmotu vo vesmíre, nová platforma má podľa NVIDIA odkryť skrytý výkonnostný potenciál umelej inteligencie pri oveľa nižších nákladoch.

Čo je Vera Rubin NVL72 a prečo je to veľká vec?

Vera Rubin NVL72 nie je len jeden čip — je to celý stojanový superpočítač (rack) pozostávajúci zo 72 grafických čipov Rubin a 36 procesorov Vera, prepojených vysokorýchlostnou sieťou NVLink 6. Architektúra Vera Rubin Superchip bola prvýkrát predstavená na GTC v marci 2025. Na CES v januári 2026 NVIDIA formálne spustila celú NVL72 platformu a podrobnejšie ju odprezentovala na GTC v marci 2026. Dodávky zákazníkom sú naplánované na druhú polovicu roka 2026.

Najdôležitejší prísľub je ekonomický: inferencia (teda samotné generovanie AI odpovedí) by mala stáť desaťnásobne menej ako pri súčasnom systéme Blackwell GB200. Inferencia je proces, pri ktorom AI model spracuje váš dotaz a vygeneruje odpoveď — práve za to platíte, keď používate ChatGPT, Copilot či iné AI nástroje. Ak dnes stojí milión vygenerovaných tokenov (zhruba 750 000 slov) okolo 5 centov, na Rubine by to malo byť okolo 0,5 centu. To otvára priestor pre AI aplikácie, ktoré sú dnes cenovo neúnosné.

Systém tiež prináša ďalšie výhody: je 100 % chladený kvapalinou, čo zvyšuje hustotu výkonu a energetickú efektivitu oproti vzduchovému chladeniu — kvapalinové chladenie v dátových centrách však spotrebu vody neznižuje, naopak, zvyčajne ju zvyšuje. Jeho modulárny dizajn bez káblov umožňuje inštaláciu za niekoľko minút namiesto hodín pri predchádzajúcej generácii.

Cena celého systému podľa odhadov analytickej skupiny Futurum Group dosiahne zhruba 3,5 až 4 milióny dolárov za rack. Novšie trhové odhady (Tom's Hardware, apríl 2026) však uvádzajú 5 až 7 miliónov dolárov — ceny sa líšia podľa konfigurácie a zdroja. Napriek tomu sú hyperscaleri (veľkí poskytovatelia cloudových služieb) ochotní platiť za vyšší výkon.

Kto to kúpi a čo to znamená pre slovenské firmy?

Medzi prvými zákazníkmi, ktorí dostanú prístup k systémom Vera Rubin v druhej polovici 2026, sú AWS (Amazon), Google Cloud, Microsoft Azure a Oracle Cloud, ako aj špecializovaní poskytovatelia výpočtových kapacít CoreWeave, Lambda, Nebius a Nscale. Microsoft plánuje zabudovať NVL72 do svojich nových AI suprafabrik nazývaných Fairwater.

Pre slovenské firmy a organizácie to v praxi znamená jediné: prístup k tejto technológii bude cez cloudové služby — teda cez Azure, Google Cloud alebo AWS, prípadne cez špecializovaných poskytovateľov ako CoreWeave. Nikto na Slovensku si nekúpi vlastný rack za 4 milióny dolárov. Dobrou správou je, že lacnejšia inferencia sa priamo pretaví do nižších cien za AI API volania, z ktorých sú postavené moderné AI nástroje a aplikácie. Ak dnes váš tím platí za AI asistenta 50 eur mesačne, v horizonte 1–2 rokov môže podobná služba na nových čipoch stáť zlomok tejto sumy — alebo za rovnaké peniaze dostanete oveľa výkonnejší model.

Lokálni poskytovatelia IT infraštruktúry (napríklad Alef, Orange Business alebo ESET) sa pri AI zameriavajú skôr na inferenciu (prevádzku hotových AI modelov) ako na tréning nových modelov od nuly — čo je práve oblasť, kde Vera Rubin prináša najväčší cenový skok dopredu.

Prečo sú herné grafické karty drahšie? HBM a problém s pamäťou

Za technickým úspechom Vera Rubin sa skrýva aj vedľajší efekt, ktorý pocíti každý, kto si chce kúpiť novú hernú grafickú kartu. Výkonné AI čipy ako Blackwell a Rubin využívajú špeciálny typ pamäte s názvom HBM (High Bandwidth Memory — pamäť s vysokou priepustnosťou). Jej výroba je mimoriadne náročná: podľa analytikov z Bernstein Research si vyžaduje až štyrikrát viac kremíkových plátov ako bežná pamäť DRAM.

Výsledok? Celosvetový nedostatok pamäťových komponentov pre grafické karty. Podľa správ z odvetvia plánuje NVIDIA znížiť výrobu herných grafických kariet až o 40 % (niektoré zdroje uvádzajú 30–40 %), aby uvoľnila kapacitu pre výrobu AI čipov. Herné karty pritom trpia najmä nedostatkom pamäte GDDR7. Analytici predpovedajú, že tento nedostatok pamäte potrvá niekoľko rokov.

Záverom: Vera Rubin NVL72 je technologický míľnik, ktorý predznamenáva výrazné zlacnenie AI služieb v horizonte najbližších dvoch rokov. Pre bežného používateľa to znamená dostupnejšie a výkonnejšie AI nástroje v cloudových aplikáciách. Pre firmy to otvára priestor na automatizáciu procesov, ktoré sú dnes cenovo nevýhodné. A pre IT oddelenia — sledujte ceníky cloudových AI API služieb koncom roka 2026 a začiatkom roka 2027.

Zdroje

Článok bol vytvorený s pomocou umelej inteligencie.