Detekcia a vyhýbanie
Detekcia a vyhýbanie (Detect and Avoid, DAA) je kľúčová schopnosť autonómnych bezpilotných lietadiel (UAS), ktorá umožňuje včas rozpoznať prekážky a kooperatívne aj nekooperatívne účastníky vzdušného priestoru a bezpečne upraviť trajektóriu. V posledných rokoch došlo k zásadnému posunu od ručne navrhnutých pravidiel k dátovo riadeným prístupom: učeniu s učiteľom (supervised) a bez učiteľa (unsupervised), prípadne k ich hybridom (semi-supervised, self-supervised). Cieľom článku je systematicky popísať architektúry, senzorické modality, trénovacie a validačné procesy, metriky, aj nasadzovanie DAA na palubných výpočtových platformách s ohľadom na bezpečnosť, latenciu a regulácie.
Problémová formulácia DAA
DAA môžeme formulovať ako kombináciu úloh počítačového videnia a riadenia: (1) percepcia (detekcia objektov, odhad vzdialenosti a relatívnej rýchlosti, sledovanie cieľov), (2) predikcia (odhad budúcich trajektórií), (3) rozhodovanie (voľba vyhýbacej manévre v súlade s obmedzeniami dynamiky a pravidlami vzdušného priestoru). Pri učení s učiteľom sa modely učia priamo z označených dát (detekčné rámiky, triedy, vzdialenosti), pri učení bez učiteľa sa využívajú latentné reprezentácie, anomálie, alebo konzistencia medzi senzormi a časom, aby sa vydolovali signály bez nutnosti rozsiahleho ručného označovania.
Senzorické modality a fúzia
- RGB/IR kamery: vysoká rozlišovacia schopnosť, nízka hmotnosť; citlivosť na osvetlenie a počasie. IR rozširuje použiteľnosť v noci.
- Stereo/šírkové kamery: hustá parallax informácia, okamžitý odhad hĺbky na krátke a stredné vzdialenosti.
- Lidar: presná 3D geometria, robustná voči osvetleniu; hmotnosť, spotreba a cena sú kompromisy.
- Radar/FMCW: dlhý dosah a priamo odhadnutá radiálna rýchlosť, dobrá priechodnosť nepriaznivým počasím.
- ADS-B/kooperatívne zdroje: identifikácia a poloha kooperatívnych lietadiel; nepokrýva malé/nekoperatívne objekty (vtáky, drony).
- IMU/GNSS: vlastný stav nosiča pre relatívne odhady a stabilizáciu vizuálnych metód.
Fúzia môže byť early (spojenie surových dát), mid-level (spojenie hlavných príznakov) alebo late (spojenie rozhodnutí). Pri učených modeloch je efektívna mid-level fúzia s priestorovo-časovými modulmi (3D konvolúcie, attention nad sekvenciami, transformerové enkódery) a s extenziou o fyzikálne obmedzenia (konečná dynamika vlastného UAV).
Učenie s učiteľom: detekcia, segmentácia a metrikuje hĺbky
Pri učení s učiteľom sú kľúčové kvalitné anotácie a reprezentatívnosť scenárov. Typické podproblémy:
- Detekcia objektov: modely jednorazového priechodu (anchor-free detektory) poskytujú nízku latenciu pre malé objekty v diaľke. Dôležitá je tréningová stratégia s focal loss a ťažbou ťažkých negatívov, keďže triedna nerovnováha je extrémna.
- Inštančná/semantická segmentácia: presné obrysy pre prekážky (káble, stromy) umožňujú jemné vyhýbacie manévre. Kombinácie encoder-decoder architektúr s priestorovo-časovou rekurenciou znižujú chvenie masiek.
- Monokulárna/stereo hĺbka: pri monokulárnej hĺbke sa učí regresia vzdialenosti; pri stereo je k dispozícii dohľad z disparity. Pre DAA je kritická metricky škálovaná hĺbka a spoľahlivostné mapy (uncertainty).
- Viackanálová fúzia (kamera+radar/lidar): pri trénovaní sa využíva teacher-student paradigmu (lidar ako učiteľ, kamera ako študent) na prenos geometrie do lacnejšej modality.
Učenie bez učiteľa: anomálie, konzistencia a self-supervised
Učenie bez učiteľa zmierňuje závislosť od anotácií a zlepšuje generalizáciu:
- Detekcia anomálií: autoenkodéry a normalizing flows sa učia model normálnych vizuálnych stavov; odchýlky (pretečenie rekonštrukčnej chyby) indikujú neznáme prekážky alebo nečakané situácie.
- Kontrastívne učenie: vytvára reprezentácie invariantné voči osvetleniu, šumu, perspektíve; znižuje potrebu anotácií a zlepšuje prenos do nových podmienok.
- Self-supervised hĺbka a ego-motion: ukladá sa fotometrická konzistencia medzi po sebe idúcimi snímkami a maskami pohybu; výstupom je hustá hĺbka a odhad pohybu bez GT hĺbky.
- Clustering a pseudo-labels: neoznačené dáta sa zhlukujú v priestore príznakov a následne sa iteratívne dotvárajú pseudo-štítky pre ďalší supervised tréning.
Sledovanie a odhad relatívneho stavu
Percepciu dopĺňa multiobjektové sledovanie (MOT) a odhad relatívnej polohy a rýchlosti cieľa. Kombinuje sa učený detektor s filtrami (Kalman/IMM/UKF) a tracking-by-detection paradigmou. Pre rýchle ciele sú vhodné asociačné metódy s appearance embeddings (reidentifikácia) a s konzistenciou optického toku. Pre senzory s priamym odhadom rýchlosti (radar) sa využíva pravdepodobnostná fúzia (Bayes, factor graphs) s kamerou.
Predikcia trajektórií a interakčné modely
Predikcia budúcich stavov objektov zohľadňuje interakcie a obmedzenia manévrovateľnosti. Učené graph neural networks a transformerové sekvenčné modely dokážu extrapolovať kooperatívne aj nekooperatívne správanie. V praxi sa viažu fyzikálne limity (max. zrýchlenie/otáčanie) a „sociálne“ pravidlá (bezpečné odstupy) formou loss penalizácií alebo ako hard constraints na výstupe.
Rozhodovanie a plánovanie vyhýbacej manévre
Výstup percepcie a predikcie vstupuje do plánovača. Pre bezpečnosť sa typicky volí dvojstupňový prístup: (1) rýchla reaktívna vrstva (velocity obstacles, dynamic window), (2) vyššia optimalizačná vrstva (MPC, sampling-based planners), ktorá rešpektuje dynamiku a pravidlá. Učené politiky (napr. imitácia expertov) môžu generovať inicializácie alebo priestor kandidátov, zatiaľ čo finálnu voľbu validuje bezpečnostný shield s garantovanými invarantami (napr. Control Barrier Functions).
Neistota, kalibrácia a runtime assurance
Kritická nie je len presnosť, ale aj správna kalibrácia pravdepodobností. Používa sa Monte Carlo dropout, ensembling, evidenčné hlboké učenie a temperature scaling na úroveň dôvery. V prevádzke runtime assurance (RTA) monitoruje, či riziko kolízie prekročilo prah alebo či sa systém nachádza mimo tréningovej distribúcie (OOD). Pri prekročení limitov sa aktivuje konzervatívna politika (spomalenie, stúpanie, núdzové zastavenie) alebo prechod na pravidlové zálohy.
Dáta, syntetika a doménová adaptácia
Reálne kolízne situácie sú zriedkavé, preto je nutná syntetika a domain randomization (počasie, textúry, osvetlenie, pohybové profily). Prechod do reality rieši unsupervised domain adaptation (adverzariálne prispôsobenie príznakov, štýlový transfer) a test-time adaptation (jemné doladenie štatistík BN). Kľúčové je dopĺňať syntetiku reálnymi hard case datasetmi: malé drony na pozadí oblohy, vtáky, káble, zrkadlenia, protisvetlo, dážď, hmla.
Metriky a hodnotenie výkonu DAA
- Percepcia: mAP/mAR pre malé objekty (špecifické pre vzdialené pixely), Average Localization Error, presnosť hĺbky (RMSE, δ-metriky), MOT (MOTA/MOTP/HOTA).
- Predikcia: ADE/FDE (priemerné a koncové chyby trajektórie), pravdepodobnostné metriky (NLL, CRPS) a kalibrácia predikčných kužeľov.
- Bezpečnosť: Minimum Miss Distance (MMD), Time to Closest Point of Approach (TCPA), Probability of Collision (PoC) pod spoľahlivosťou senzoriky.
- Prevádzkové: latencia end-to-end (kamera→manéver), využitie energie, dostupnosť (>99.9%), miera plan-abort vs. falošné poplachy (FAR).
Realtime implementácia a optimalizácia
Palubné platformy (SoC s GPU/NPU) vyžadujú optimalizácie: kvantizácia, prerezávanie (pruning), knowledge distillation, fúzia operácií a pipelining (súbežné získavanie snímkov, inferencia a plánovanie). Kritická je deterministická latencia: fixné veľkosti dávok, predalokovaná pamäť, rozdelenie jadier pre ROS2 exekútor, prahovanie FPS podľa rýchlosti letu a rizika. Pre výpadky senzorov sa udržiava minimálne funkčný profil (napr. vizuálny tok + IMU) s degradovaným, ale bezpečným správaním.
Bezpečnostné argumenty a overovanie
DAA s učenými modelmi musí byť doplnené formálnymi a štruktúrovanými dôkazmi bezpečnosti: Requirements-to-Evidence trasovanie, nezávislé testy, oddelené datasety (train/val/test s časoprostorovou segregáciou), adversarial testy (oslnenie, šum, zámerné maskovanie), HIL/SIL kampane so simuláciou kolízií a blízkych preletov. Runtime monitors s simplex architektúrou nechávajú učenému modulu generovať návrhy, ktoré sú validované pravidlovým bezpečnostným jadrom.
Supervised vs. unsupervised: komparatívne výhody
- Učenie s učiteľom: vysoká presnosť pre známe triedy a situácie, predvídateľný výkon; náročné na anotácie, riziko dataset bias.
- Učenie bez učiteľa: odhaľuje neočakávané objekty a stavy, škáluje s veľkými neoznačenými datasetmi; potrebuje opatrnú interpretáciu (anomália ≠ hrozba) a dobrú integráciu s rozhodovaním.
V praxi víťazí hybrid: supervised percepcia pre známe hrozby (lietadlá, helikoptéry, drony), unsupervised OOD detekcia a anomálie ako watchdog, semi-supervised jemné doladenie na nových oblastiach nasadenia.
Integrácia s pravidlami vzdušného priestoru a autonómiou
DAA rozhodovanie musí rešpektovať koridory, no-fly zóny, minimálne výšky, priority a pravidlá right-of-way. Percepčno-plánovacia slučka má rozhranie k vyššiemu plánovaču misie (trajektórie, body záujmu) a ku komunikačnej vrstve pre kooperáciu v rojových scenároch (zdieľanie zistení, distribuovaná fúzia, vyhýbanie sa kolíziám medzi členmi roju).
Kooperatívne DAA v rojoch
V rojových operáciách DAA získava systémový rozmer: zdieľanie lokálnych máp obsadenia, odhady trajektórií a koordinované manévre. Učené graph-based modely s komunikujúcimi uzlami (message passing) dokážu škalovať, ak sa obmedzí šírka pásma cez kompresiu príznakov a prioritizáciu hrozieb. Konflikty rieši arbitráž s globálnymi pravidlami a lokálnymi safety bubbles.
Okrajové prípady, robustnosť a fail-operational
Medzi ťažké prípady patria malé, rýchle ciele proti preexponovanému nebu, drifty kamery pri vibráciách, dážď/hmla, reflexie na skle, veľmi tenké prekážky (laná). Robustnosť sa zvyšuje dátovou augmentáciou (simulované oslnenie, kvapky, motýľový šum), fyzikálnymi filtrami (vibračné odizolovanie), redundantnými modalitami (radar+kamera) a logikou eskalácie (ak je neistota vysoká, zníž rýchlosť, zvýš separáciu).
Praktická vývojová a validačná pipeline
- Požiadavky a hazardy: definuj MMD/TCPA limity, latencie, triedy cieľov; vytvor hazard log a bezpečnostné ciele.
- Dáta: zozbieraj reálne sekvencie a syntetiku; priprav scenario library so štandardizovanými skriptmi.
- Modely: navrhni supervised detekciu a self-supervised hĺbku; pridaj anomálne detektory a kalibráciu neistoty.
- Tréning: stratégiu triednej nerovnováhy, curriculum podľa vzdialenosti objektu, mixed precision, validácia na OOD setoch.
- Integrácia: ROS2 graf, časové značky, synchronizácia senzorov, hard-real-time pre plánovanie.
- HIL/SIL: v slučke s autopilotom, injekcie zlyhaní senzorov a komunikačných výpadkov.
- Letové skúšky: stupňovité nasadzovanie (static track→captive carry→pomalejší let→reálne scenáre), telemetria a post-mortem analýzy.
Energetika a termika
Výpočtová náročnosť DAA významne vplýva na výdrž letu. Optimalizuj pipeline (zníženie rozlíšenia pri nízkej rýchlosti, adaptívne FPS podľa rizika, prerušované radarové dávky), používaj jadra NPU/DSP na nízkej úrovni a zabezpeč termické riadenie (heat-spreaders, prúdenie vzduchu), aby sa predišlo throttlingu.
Etické a zodpovedné AI aspekty
Transparentnosť rozhodovania (saliency mapy, vysvetliteľné príznaky) zvyšuje dôveru. Minimalizuj dataset bias (rôzne regióny, ročné obdobia, typy objektov) a zavádzaj human-in-the-loop pre kritické kroky validácie. Loguj dôvody manévrov a dovoľ post-hoc audit.
Budúce smerovania
Očakáva sa väčšie využitie vizuálno-inertnej SLAM hĺbky so self-supervised dohľadom, multimodálnych transformerov (kamera-radar-IMU) s kalibrovanou neistotou a formálnych learning-enabled garancií (kombinácia učenia a bariérových funkcií). V rojových aplikáciách porastie význam distribuovanej predikcie a komunikačne-efektívnych reprezentácií hrozieb.
DAA založené na učení s učiteľom a bez učiteľa umožňuje výrazne prekročiť limity tradičných heuristík. Supervised metódy ponúkajú presnú percepciu známych hrozieb, unsupervised vrstva stráži neznáme a mení systém na self-aware modul schopný signalizovať neistotu a anomálie. V spojení s validovaným plánovaním, runtime assurance a disciplinovanou verifikáciou je možné dosiahnuť bezpečnú autonómiu v komplexných a dynamických podmienkach skutočného sveta.