AI a energia

AI a energia

Medzi mýtami a fyzikou

Energetická stopa umelej inteligencie (AI) je legitímna téma. Často však stojí buď na strašiakoch bez metodiky, alebo na úzkych číslach vytrhnutých z kontextu. „Reálne čísla“ nevzniknú z jedinej hodnoty – vyžadujú jasne definované hranice systému, transparentné predpoklady a porovnateľné metriky. Tento článok ponúka rámec, ako AI merať, na čo si dať pozor a kde sa čísla v praxi najčastejšie prekrúcajú.

Čo presne meriame? Hranice systému rozhodujú

  • Fáza tréningu vs. inferencie: tréning (učenie modelu) je epizodicky energeticky intenzívny; inferencia (používanie modelu) je dlhodobý „prevádzkový“ náklad rozložený na počet požiadaviek.
  • IT vs. celý dátový centrum: surový príkon GPU/CPU a pamätí nie je to isté ako spotreba vrátane chladenia, UPS, rozvodov. Korekcia sa robí cez PUE (Power Usage Effectiveness).
  • Životný cyklus (LCA): okrem elektriny je tu aj vložená energia vo výrobe čipov, serverov, batérií a budov. Pre niektoré rozhodnutia (dizajn infraštruktúry) je LCA kľúčové, pre operatívu menej.

Metriky: z wattov na emisie a porovnania

  • Energia (kWh): základná veličina. Prepočet: E = priemerný príkon (kW) × čas (h).
  • PUE: PUE = (energia dátového centra) / (energia IT záťaže). Moderné zariadenia dosahujú ~1,1–1,3; staršie 1,5+.
  • Emisný faktor siete: EF v gCO2e/kWh. Závisí od mixu (uhlí vs. OZE). Rovnica: Emisie = E × EF.
  • Intenzita na jednotku služby: na tréning (kWh/tréning), na požiadavku (Wh/požiadavka), na token/obrázok atď. Umožňuje férové porovnania.

Príklad 1: odhad tréningu stredne veľkého modelu

Ilustratívny, konzervatívny výpočet s transparentnými krokmi (nie univerzálne platné číslo):

  1. Hardvér a výkon: 8 GPU, každý 350 W pri tréningu → IT príkon ~2,8 kW (nezahŕňa CPU, RAM, sieť). Pridajme 30 % na zvyšok servera → ~3,64 kW.
  2. Čas: 1 000 hodín tréningu → EIT ≈ 3,64 kW × 1 000 h = 3 640 kWh.
  3. PUE 1,2: EDC = 3 640 × 1,2 = 4 368 kWh.
  4. Emisie (mix 400 gCO2e/kWh): ≈ 4 368 × 0,4 = 1,75 t CO2e.

Interpretácia: rovnaký model na čistejšom mixe (napr. 100 gCO2e/kWh) klesne na ~0,44 t CO2e. Naopak, pri PUE 1,6 a uhle 700 gCO2e/kWh môžeme skončiť nad 4 t CO2e. Fyzika je jednoduchá; rozdiel robí infraštruktúra a mix.

Príklad 2: per-požiadavka pri inferencii

Opäť ilustrácia, nie univerzálne číslo – závisí od modelu, kvantity tokenov, zdieľania GPU a batchovania:

  1. IT príkon: GPU/akcelerátor ~200–400 W; pri zdieľaní viacerými požiadavkami je priemerný príkon na požiadavku nízky.
  2. Čas: interaktívna odpoveď 1–3 s generácie + réžia. Povedzme 2 s pri 250 W → energia = 250 W × 2 s = 500 J ≈ 0,139 Wh.
  3. PUE 1,2: ≈ 0,167 Wh/požiadavka. Pri čistejšom mixe sú emisie rádovo desiatky mg CO2e.

Kontext: takáto požiadavka je energeticky porovnateľná s niekoľkými sekundami videostreamingu v HD alebo s nabitím smartfónu o zlomok percenta. Pri veľkých dávkach (generovanie dlhých textov, obrázkov, video) je číslo vyššie; pri malých modeloch nižšie.

Kde sa čísla najviac skresľujú

  • Ignorovanie PUE: uviesť iba GPU spotrebu podhodnocuje realitu; naopak zámenu PUE za „koeficient hrôzy“ bez merania je rovnako zlé.
  • Miešanie tréningu a inferencie: jednorazový tréning zrátať na jednu otázku používateľa nedáva zmysel; tréning sa musí amortizovať cez celý životný cyklus modelu.
  • Fixné emisie/kWh: elektrina nie je rovnako „špinavá“ všade ani po celý deň. Časová a regionálna granularita (hodinové EF) mení výsledok.
  • Bez LCA alebo s „preťaženým“ LCA: niekedy sa LCA používa, inokedy ignoruje – metodika musí byť jasná a konzistentná pre porovnanie.

Praktické „real-world“ porovnania (orientačné)

  • Tréning stredného modelu (príklad vyššie): rádovo MWh → emisne porovnateľné s desiatkami až nízkymi stovkami litrov paliva, podľa mixu.
  • Jedna krátka textová požiadavka: desatiny Wh → rádovo zlomky gramu CO2e pri nízkouhlíkovom mixe; porovnateľné s niekoľkými sekundami videa.
  • Generovanie obrázkov alebo dlhých textov: jednotky Wh; u obrazov s difúziou závisí od počtu krokov a rozlíšenia.

Najväčší páky efektivity na strane prevádzkovateľov

  • Architektúra modelov: menšie, špecializované modely alebo mixture-of-experts znižujú priemerný počet aktívnych parametrov pri inferencii.
  • Optimalizácie a kvantizácia: INT8/FP8, sparsita, kompilátory (graph fusion), batchovanie – často úspory 2–5× bez straty kvality.
  • Efektívne tréningové recepty: reuse kontrolných bodov, curriculum learning, low-rank adaptation (LoRA) namiesto full fine-tune.
  • PUE a chladenie: free cooling, imerzné chladenie, optimalizácia prietokov môže znížiť PUE na ~1,1–1,2.
  • Umiesťovanie a načasovanie: kolokácia pri OZE, zmluvy PPA a time-shifting tréningov do hodín s nízkymi emisiami siete.

Najväčšie páky efektivity na strane používateľov a produktov

  • Správny nástroj na úlohu: malé lokálne modely (vyhľadávanie, klasifikácia) namiesto veľkého všeobecného modelu, ak stačia.
  • Prompt a rozumná dĺžka: zbytočne dlhé výstupy zvyšujú energiu liniárne s tokenmi; pri generovaní obrázkov pohľadajte nižšie rozlíšenie či menej krokov, ak účel dovoľuje.
  • Cache a opakované využitie: pri interných aplikáciách obmedzujú duplicitu výpočtov.

Voda, teplo a „skryté“ toky

Okrem elektriny sledujeme aj spotrebu vody (chladiace okruhy, odpar) a odpadové teplo. Tie sú silno regionálne – závisia od klímy a technológie chladenia. Recyklácia tepla (napr. vykurovanie budov) mení environmentálnu bilanciu v prospech dátového centra.

Životný cyklus zariadení (LCA) – čo s ním v praxi

  • Výroba čipov a serverov: energeticky náročná; zmysel má vyššia využiteľnosť počas životnosti (viac práce na ten istý kus HW).
  • Repas a sekundárny trh: opätovné využitie GPU/CPU pre menej náročné úlohy znižuje potrebu novovýroby.
  • Modulárny dizajn: možnosť výmeny komponentov (napr. SSD, RAM, napájanie) predlžuje životný cyklus servera.

Transparentné reportovanie: ako spísať „reálne čísla“

  1. Definujte hranice: IT vs. celé DC; len elektrina, alebo LCA; tréning, inferencia, alebo oboje.
  2. Uveďte parametre: príkon, čas, PUE, emisný faktor (regionálne/hodinové), batchovanie, dĺžky výstupov.
  3. Rozdeľte výsledok: kWh, CO2e a intenzity (Wh/požiadavka, Wh/1 000 tokenov, Wh/obrázok).
  4. Citlivosť a intervaly: ukážte, ako sa čísla menia pri PUE ±0,1 či EF ±100 g/kWh. Intervaly často hovoria viac než jedno „presné“ číslo.

Férové porovnania: AI vs. alternatívy

Reálna voľba nebýva medzi „AI vs. nič“, ale medzi AI vs. alternatívny spôsob (manuálna práca, menší model, heuristiky). Pri porovnávaní sledujte:

  • Funkčne ekvivalentný výsledok: rovnaká kvalita výstupu/úspešnosť úlohy.
  • Škálovanie: ak sa výsledok používa miliónkrát denne, per-požiadavka dominuje; ak ide o jednorazový model na špecifickú misiu, dominuje tréning.
  • Spolunáklady: prenos dát, predspracovanie, závislosti na iných službách (úložiská, CDN).

Politiky a regulácia: čo skutočne pomáha

  • Štandardy merania a zverejňovania: minimálne polia (PUE, kWh, EF, metodika) pre cloudové AI služby – umožnia porovnateľnosť.
  • Cenové signály a čistá elektrina: nízkouhlíkový mix + flexibilné tarify motivujú načasovať tréning do „zelených“ hodín.
  • Podpora efektívnych modelov a výskumu: granty a obstarávanie uprednostňujúce účinnosť (Wh/úloha), nie len surový výkon.

Nepohodlná pravda: AI nie je „zadarmo“, ale panika nepomáha

AI má špecifickú energetickú stopu, ktorá rastie s dopytom. Zároveň má veľký manévrovací priestor na znižovanie intenzity – od modelovej architektúry cez optimalizácie, PUE, až po načasovanie práce a nákup čistej energie. Rozdiel medzi „strašiakom“ a „realitou“ je v transparentnom účtovaní, nie v ignorovaní nákladov.

Kontrolný zoznam pre „reálne čísla“ vo vašom projekte

  • Uveďte hardvér, čas, PUE, EF a či ide o tréning alebo inferenciu.
  • Reportujte kWh aj intenzity (Wh/úloha), nie len „% úspory“.
  • Pridajte scenáre citlivosti (PUE ±0,1; EF podľa hodiny/miesta).
  • Zahrňte opatrenia: kvantizácia, batchovanie, menší model, „green window“ tréningy.

Z fyziky k rozhodnutiam

Keď čísla dávajú zmysel – majú jasné hranice, metodiku a kontext – prestáva byť AI „energetickým strašiakom“ a stáva sa optimalizačnou úlohou. Riešením nie je ani popieranie nákladov, ani apokalyptické titulky. Riešením je presné meranie, efektívne navrhovanie a chytré umiestnenie v čase a priestore. Takto sa AI vie rozvíjať s rastúcou produktivitou a klesajúcou intenzitou na jednotku služby – čo je jediné „reálne číslo“, na ktorom dlhodobo záleží.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *