Neurónové siete na edge – Ekonomická encyklopédia

Prečo on-board neurónové siete na UAV

Autonómia dronov sa opiera o lokálne spracovanie vnímania, lokalizácie a rozhodovania s nízkou latenciou a vysokou spoľahlivosťou. Prenos surových dát do cloudu nie je pri BVLOS a v rušenom RF prostredí udržateľný. On-board neurónové siete (NN) na edge hardvéri preto kombinujú prísne energetické, hmotnostné a tepelné limity s požiadavkami na deterministickú odozvu. Kľúčom je kvantizácia a urýchľovanie – techniky, ktoré umožňujú bežať moderné modely v rozsahu 1–10 W a pri latenciách pod 10–50 ms v slučke riadenia.

Obmedzenia UAV: energetika, latencia a spoľahlivosť

Energetický rozpočet: 1–15 W pre vnímanie (kamera/LiDAR + NN), pri typických batériách 4–8S LiPo.
Latencia: 10–30 ms pre vizuálne servo, 50–150 ms pre globálne plánovanie; jitter musí byť nízky.
Hmotnosť a termika: chladiče a ventilácia zvyšujú hmotnosť; TDP obmedzuje takt a frekvenciu inferencie.
EMI/EMC: výkonné SoC a spínané zdroje môžu rušiť GNSS/RC; vyžadujú sa filtračné a layout opatrenia.

Kvantizácia: princípy a voľby presnosti

Kvantizácia mapuje FP32/FP16 tenzory na nižšie bitové šírky s cieľom znížiť pamäť, šírku pásma aj spotrebu. Dobre navrhnutá kvantizácia má minimálny vplyv na presnosť pri veľkom zisku v rýchlosti.

Post-Training Quantization (PTQ): rýchla, bez preučenia. Vhodná pre 8-bit (INT8) s reprezentatívnou kalibráciou.
Quantization-Aware Training (QAT): simuluje kvantizačný šum počas tréningu; umožňuje 8-bit a často aj 4-bit.
Bitové režimy: INT8 je „sweet spot“; INT4/FP4 pre extrémny edge; binárne/ternárne siete pre špecifické úlohy.
Per-tensor vs. per-channel: per-channel škály znižujú kvantizačný error najmä v konvolúciách.
Symetrická vs. asymetrická: symetrická (signed) zjednodušuje MAC; asymetrická lepšie pokrýva posunuté rozdelenia aktivácií.
Kalibrácia: klipovanie (MSE, KL) a zbierka reprezentatívnych vzoriek z letových dát minimalizujú straty presnosti.

Komplementárne kompresné techniky

Prerezávanie (pruning): štruktúrované (kanály/filtre) pre HW efekt; neštruktúrované + sparsity ~50–70 % s podporou akcelerátorov.
Destilácia znalostí: študent napodobňuje učiteľa; znižuje veľkosť pri zachovaní presnosti.
Zdieľanie váh a low-rank faktorizácia: dekompozícia konvolúcií a projekcií v Transformeroch.

Architektúry modelov vhodné pre edge

Konvolučné siete: depthwise separable a group conv (MobileNet, ShuffleNet) minimalizujú MAC.
Transformery pre víziu: lite/linear attention, windowed self-attention, token pruning a dynamic sparsity.
Viacsenzorové fúzie: kamerové RGB + IMU + prípadne ToF/LiDAR s ľahkou pozornosťou.
Graph/Spiking: pre plánovanie trajektórií a extrémne nízku spotrebu (SNN) tam, kde je to vhodné.

Urýchľovanie: akceleračné backends a kompilátory

NPU/DLA: vysoká efektivita INT8/INT4, obmedzený set opov; ideálne pre štandardné CNN a postprocessing.
GPU: flexibilné, FP16/INT8 tensor core; vyššia spotreba, ale najuniverzálnejšie.
DSP: výborné pre 1D/2D filtračné operácie a malé siete; deterministické latencie.
FPGA: presná kontrola dátových tokov, pipeline a sparsity; vyššie náklady na vývoj, no top efektivita/W.
Kompilátory: TVM, TensorRT, OpenVINO, Glow/XLA – fúzia opov, layout transformácie (NCHW↔NHWC), kernel autotuning.

Optimalizácia dátových tokov a pamäťovej prevádzky

Operátorová fúzia: Conv+BN+ReLU, Q/DQ folding; znižuje prístup do DRAM.
Prefetch/tiling: blokovanie do L2/SRAM; minimalizácia cache miss a DMA prestojov.
Pipeline: overlapy IO (kamera) – pre/postprocessing – inferencia – riadenie v rámci jedného rámca.
Mixovaná presnosť: FP16 pre citlivé vrstvy (napr. attention projekcie), INT8 pre zvyšok.

Realtime plánovanie: deterministický runtime

Rozdelenie grafu: kritická slučka (perception→control) s pevnou deadlinou, sekundárne úlohy (mapovanie) v „best-effort“ režime.
Prioritné fronty: RT planovač (SCHED_FIFO) pre inferenciu; rozpočet GPU času.
Jitter control: pinovanie jadier, izolácia IRQ, locknutie frekvencií, NUMA/affinity.

Meranie výkonu: metriky a profilácia

Presnosť: mAP/mIoU/F1 pre úlohy vnímania; success rate pre plánovanie/avoidance.
Latencia a jitter: P50/P95/P99; end-to-end od expozície po aktuátor.
Energia: J/inferencia, Wh/misia; teplotné profily a throttling.
Robustnosť: oklúzie, zmena osvetlenia, pohybová rozmazanosť, RF interferencie, výpadky snímačov.
Profilácia: per-op štatistiky (MAC, BW), roofline analýza, „hot kernels“ a pamäťové úzke hrdlá.

Robustná kvantizácia v praxi

Reprezentatívny dataset: zahrnúť typické letové výšky, uhly, denné/nočné scény, poveternostné podmienky.
QAT stratégiá: fake quant, straight-through estimator; postupné sťahovanie bitov (8→6→4).
Layer sensitivity: prvá a posledná vrstva často vyžadujú vyššiu presnosť; per-layer overrides.
Dynamic range tracking: EMA štatistiky, percentile clipping, log-domenové škály pre outliery.

Spracovanie obrazových dát na palube

ISP pipeline: denoise/debayer v HW; prísne limitovať CPU postprocessing.
Downsampling a cropping: dynamické škálovanie vstupu podľa dostupného TDP a požadovanej latencie.
Time-synchronization: PTP/PPS medzi kamerou, IMU a SoC; minimalizácia časovej neistoty pre fúziu.

Bezpečnostné aspekty a fail-safe

Sandbox inferencie: obmedzenie privilégii, integrity check modelov (hashy, podpisy).
Watchdogy: pre ML runtime aj pre senzorové drivery; detekcia deadlockov.
Degradované režimy: prepnúť na jednoduchší model/nižšie rozlíšenie pri prehriatí alebo nízkej batérii.

Integrácia do riadiacej slučky

Vizuálne servo: konverzia výstupov NN (napr. kľúčové body, detekcie) na veličiny riadenia s filtráciou a limitérmi.
Prediktívne filtrovanie: EKF/UKF pri oneskorených a kvantizovaných meraniach.
Confidence gating: ak je dôvera NN pod prahom, spustiť redundanciu (IMU-only, GNSS-only, mapové odhady).

MLOps na okraji: nasadzovanie a správa modelov

Formáty: ONNX, TFLite, proprietárne blobs pre NPU; verzovanie modelov a kompilátormi generovaných artefaktov.
A/B nasadzovanie: tieňové hodnotenie (shadow mode) a postupné rozbaľovanie na flotilu.
OT(A) aktualizácie: robustné, atómové; rollback a kompatibilita s firmware.
Telemetria: anonymizované metriky latencie/energetiky/chýb pre dlhodobé ladenie.

Validácia: HIL/SIL a terénne testy

SIL: simulácia snímačov a prostredia so záznamami reálnych scén; zisťovanie numerickej stability po kvantizácii.
HIL: reálny edge HW v slučke; záznam P50/P99 latencií a tepelných profilov počas typických misií.
Letové skúšky: AB testy modelov, metriky úspešnosti úloh (napr. percento správnych pristátí, preletov brán).

Príklady úloh a odporúčané konfigurácie

Úloha	Model/architektúra	Presnosť	Kvantizácia	HW backend
Detekcia prekážok	MobileNet-SSD / YOLO-Nano	mAP 30–40 @ COCO-lite	INT8 PTQ/QAT, per-channel	NPU alebo GPU FP16/INT8
Slam/VO pomoc	Lightweight SuperPoint + SuperGlue-lite	Stabilná lokalizácia	INT8 mix, citlivé vrstvy FP16	GPU/DSP mix
Trasa v koridore	Tiny-Transformer s windowed attention	F1 > 0.9 (dataset domény)	QAT INT8, projekcie FP16	GPU/NPU hybrid

Checklist pre inžiniersku realizáciu

Definovať KPI: presnosť, P95 latencia, spotreba, teplotné limity.
Zvoliť architektúru modelu s ohľadom na MAC/BW a podporované opy akcelerátora.
Pripraviť reprezentatívny kalibračný set pre PTQ/QAT.
Vykonať kompresiu: pruning → kvantizácia → distilácia → compiler autotuning.
Nastaviť runtime: izolácia jadier, frekvencie, DMA, pipeline.
Overiť v SIL/HIL: presnosť vs. latencia vs. energia, P99 jitter, termika.
Nasadiť s A/B a telemetriou; pripraviť rollback a degradované režimy.

Najčastejšie úskalia a ako im predísť

Strata presnosti po PTQ: prejsť na QAT, použiť per-channel škály a lepší klip.
Nekompatibilné opy na NPU: reautorovať graf (nahradiť ops), použiť fúziu alebo fallback len mimo kritickej slučky.
Skryté úzke hrdlá: postprocessing na CPU; presunúť NMS, resize a normalizáciu na akcelerátor.
Throttling: predimenzovať chladič, zaviesť power governor a adaptívne zníženie rozlíšenia.

On-board neurónové siete umožňujú dronom bezpečne a autonómne fungovať aj v náročných podmienkach. Kombinácia kvantizácie, kompresie a špecializovaných akcelerátorov prináša rádové zlepšenie latencie a energetickej efektivity bez zásadnej straty presnosti. Systematický prístup – od voľby architektúry, cez QAT a kompiláciu, až po RT integráciu a validáciu – je rozhodujúci pre nasadenie, ktoré spĺňa prísne požiadavky UAV misií.

Samuel Salaj komentoval SCRUM
Filip Sichman komentoval Parcela
Šajno komentoval Odvolateľný akreditív
Šajto komentoval AVV
DawnBreaker komentoval Spoločnosť s ručením obmedzeným
Ellen komentoval Úverová kalkulačka
Julius Simsky komentoval Priemysel
Dwaewiel komentoval IOST (IOST)
Veronika B. komentoval Finančný trh
Peter Trnka komentoval Počítačový vírus