LQR/MPC vs. PID riadenie

LQR/MPC vs. PID riadenie

Prehľad: prečo porovnávať PID, LQR a MPC na multirotoroch

Riadenie multirotorov (kvadrokoptér, hexa-, oktokoptér) musí zabezpečiť rýchlu stabilizáciu, presné sledovanie trajektórie a odolnosť voči poruchám (vietor, zmeny hmotnosti, saturácie ťahu). Tradičné PID regulátory dominujú v priemysle pre jednoduchosť a vysokú spoľahlivosť. LQR (Linear Quadratic Regulator) ponúka systematické nastavenie ziskov pre lineárne modely a MPC (Model Predictive Control) navyše dokáže pracovať s obmedzeniami (ťah, rýchlosti, náklony) a optimalizovať budúci priebeh. V praxi sa často používa hybridná architektúra: PID/LQR na vnútorných slučkách (attitude, rate) a MPC/LQR/PID na vonkajších slučkách (pozícia, rýchlosť, výška) podľa výpočtových možností a požiadaviek misie.

Dynamika multirotora a vrstvy riadenia

  • Vnútorná slučka (Body rates, attitude): Riadi uhly a uhlové rýchlosti (p, q, r; roll φ, pitch θ, yaw ψ). Má najvyššiu šírku pásma (typicky 200–1000 Hz).
  • Stredná slučka (výška / vertikálny ťah): Regulácia ťahu a vznosu; 100–400 Hz.
  • Vonkajšia slučka (rýchlosť/pozícia): Navigačné riadenie v inercialnom rámci; 50–200 Hz.
  • Plánovanie trajektórie: Generovanie referencií (jerk-limited, snap-optimal), 10–50 Hz.

Lineárne modely sa bežne získavajú okolo pracovného bodu (hover). Pre malé odchýlky platí \dot{x} = A x + B u, výstupy y = C x, kde x zahŕňa polohy, rýchlosti, attitude a uhlové rýchlosti, u sú prírastky ťahov rotorov.

PID: sila v jednoduchosti a dobrej implementácii

Výhody: minimálne nároky na procesor, jednoduché ladenie (Ziegler–Nichols, relay autotune, frekvenčné metódy), robustnosť voči miernym neistotám modelu. Nevýhody: ťažšie riešenie saturácií a multivariantných väzieb (roll–pitch–z–yaw sú spojené cez obmedzené ťahy), žiadna predikcia budúcich obmedzení.

  • Anti-windup: back-calculation alebo clamping pri saturácii motorov.
  • Feedforward: odľahčenie PI vetvy znalosťou modelu (napr. gravitačná kompenzácia a krížové väzby medzi osami).
  • Gain scheduling: prepínanie KP, KI, KD podľa režimu (payload, rýchlosť, uhol náklonu).
  • Frekvenčná robustnosť: filtry (notch, low-pass) na potlačenie vibrácií od vrtúľ; dôsledné nastavenie D-členu s derivative-on-measurement.

LQR: optimálne lineárne riadenie pre decouplované aj MIMO osi

LQR minimalizuje kvadratické kritérium J = ∫ (xᵀQx + uᵀRu) dt a poskytne spätnoväzbový zákon u = −Kx. V praxi:

  • Výber Q a R: Q penalizuje odchýlku stavov (uhly, rýchlosti), R penalizuje prácu motorov a príkazy. Pomôcka: škálovať stavy na rovnaké poriadky a voliť R tak, aby sa predišlo saturácii ťahov.
  • Decentralizácia: LQR pre (φ, p), (θ, q), (ψ, r) osobitne alebo plný MIMO dizajn pre krížové väzby (užitočné pri vysokých uhloch či asymetrickej geometrii).
  • Referencie: pridať integrátory (LQI) pre nulovú ustálenú odchýlku rýchlostí/uhlov alebo používať state augmentation.
  • Robustnosť: LQR implicitne poskytuje istú odolnosť (loop shaping v kvadratickej norme), no pre veľké neistoty je vhodné doplniť gain scheduling alebo μ-syntézu.

Vnútorné slučky LQR dosahujú vyššiu šírku pásma pri rovnakom alebo menšom šume na výstupe než PID, a lepšie zvládajú krížové väzby bez heuristík.

MPC: prediktívne riadenie s obmedzeniami

MPC rieši na horizonte N optimalizačnú úlohu s modelom (lineárnym alebo lineárne-parameter dependent, LPV) a explicitne uvažuje obmedzenia:

  • Kritérium: min ∑ (xᵢ−xref)ᵀQ(xᵢ−xref) + ∑ ΔuᵢᵀRΔuᵢ, s terminálnou penalizáciou a/alebo terminálnou množinou.
  • Obmedzenia: u ∈ [umin, umax] (ťahy), |φ|, |θ| ≤ φmax, rýchlosti a zrýchlenia (jerk, snap) podľa platformy a gimbalu.
  • Model: diskretizovaný xk+1 = A xk + B uk (hover) alebo LPV podľa náklonu a ťahu; prípadne NMPC s diferenciálnymi rovnicami a CasADi/ACADO na generovanie kódu.
  • Riešič: QP (quad. program) pre lineárny MPC; SQP/IPM pre nelineárny. Dôležitý je deterministický čas výpočtu na embedded HW.

Prínosy MPC: jemné riešenie saturácií a koordinácia osí, menej „clippingu“ motorov, stabilné RTH pri bočnom vetre, bezpečné držanie limitov náklonu pre kvalitu videa/mapovania. Nevýhody: vyššie nároky na výpočty, závislosť od kvality modelu a latencie estimátora.

Estimácia stavov: EKF/UKF vs. komplementárne filtre

Bez kvalitnej estimácie sa ani najlepší regulátor nepresadí. Štandardom je EKF nad IMU, magnetometrom, barometrom a GNSS/vision (VIO). Pre vnútorné slučky často stačí komplementárny filter (gyro + akcelerometer) s latenciou < 1 ms. V MPC/LQR je dôležité mať odhad rýchlosti a náklonov s nízkym šumom; pri VIO/optickom toku treba kompenzovať oneskorenie (time offset) a použiť predictor (zero-order hold alebo model-based forward prediction).

Implementačná architektúra: kde ktorý regulátor použiť

Vrstva Preferovaný regulátor Dôvod Frekvencia
Body-rate PID alebo LQR Najvyššie nároky na rýchlosť, stabilizácia šumu; LQR zvláda väzby 250–1 000 Hz
Attitude PID/LQR Rýchle sledovanie referenčných uhlov 200–500 Hz
Rýchlosť/pozícia MPC alebo PID+feedforward/LQR Obmedzenia náklonu, ťahu, jerk; trajektórie 50–200 Hz
Výška PID s feedforward (T≈mg) alebo MPC (pri obmedzeniach) Presné stúpania/klesania v rámci limitov 100–400 Hz

Robustnosť a saturácie: kľúčové rozdiely v praxi

  • PID: potrebuje anti-windup; v hraničných náklonoch a silných poryvoch môže dôjsť k dlhším saturáciám motorov a zhoršeniu ovládateľnosti (yaw drift).
  • LQR: lepší loop-shaping, ale bez explicitných obmedzení. Pri saturácii stráca optimálnosť – vhodné je doplniť reference governor alebo command limiting.
  • MPC: explicitne pracuje s limitmi, minimalizuje chattering a clipping; dokáže „odmietnuť“ nereálne referencie (safe infeasibility handling).

Ladenie a postup zavedenia

  1. Model a identifikácia: získať A, B matice z linearizácie (hover) alebo subspace ID; určiť oneskorenia a frekvenčné charakteristiky rámu.
  2. Vnútorné slučky: začať PID (rate) → overiť stabilitu a šírku pásma; pre LQR navrhnúť Q/R tak, aby výstupy kopírovali PID výkon, následne zvýšiť výkon podľa potreby.
  3. Vonkajšie slučky: zaviesť MPC najprv v simulácii (SIL/HIL), nastaviť horizont N (8–20 krokov) a čas kroku podľa senzora; pridať limity náklonu, rýchlosti, ťahu.
  4. Bezpečnostné obaly: saturácie príkazov, rate limiter, jerk limiter, geofence, failsafe pre stratou GNSS/VIO; watchdog pre solver MPC (time-out → fallback).
  5. Validácia: step testy (5–10° attitude, 1–2 m/s rýchlosť), nárazové poryvy (ventilátor), klasická škatuľa testov (hover, kružnice, osmičky, RTH proti vetru) a metriky (ISE, ITAE, % saturácie, spotreba Wh/km).

Výpočtové nároky a hardvérové možnosti

  • PID/LQR bežia komfortne na MCU triedy STM32F4/F7/H7 (100–400 MHz) pri 1 kHz slučkách.
  • Lineárny MPC (QP): s N≈10, stavmi < 12 a vstupmi < 4 je možné dosiahnuť 100–200 Hz na H7 pri využití real-time QP (osqp, qpOASES s partial condensing). Pre zložitejšie úlohy je vhodný companion computer (Raspberry Pi 4/5, NVIDIA Jetson) a slučka 50–100 Hz.
  • NMPC vyžaduje generovanie kódu a starostlivé determinovanie výpočtového času; na embedded je praktický iba s krátkym horizontom a dobrým teplým štartom.

Vplyv modelových chýb a adaptivita

Mení sa hmotnosť, CG a aerodynamické straty (napr. gimbal, payload). Stratégie:

  • Gain scheduling: tabuľka ziskov podľa hmotnosti/polohy CG a napätia batérie.
  • Online identifikácia: odhad kT a kQ (ťah/krútiaci moment) z telemetrie prúdov a uhlových odoziev.
  • Disturbance observer (DOB) alebo integrátor poruchy v MPC ako rozšírený stav pre vietor/slabé nepresnosti.

Trajektórie, komfort kamery a kvalita dát

Pre film/inspekčné misie sú kritické obmedzenia jerk/snap kvôli gimbalu a kvalite obrazu. MPC prirodzene rešpektuje tieto limity a minimalizuje náklonové preťaženia, kým PID/LQR vyžadujú dodatočné profily referencií (S-krivky, minimum jerk) a command filters.

Hluk, energetika a teplota

Mäkké riadiace profily (MPC s penalizáciou Δu, LQR s vyšším R) redukujú prúdové špičky → menší hluk a zahrievanie ESC/motorov, lepšia energetická bilancia. PID s príliš agresívnym D môže zvyšovať šum a tonálne píky. V praxi sledujte % času v saturácii a RMS prúd ako proxy pre tepelný stres.

Integrácia s autopilotmi a softvérový stack

  • PX4/ArduPilot: PID vnútri; LQR je možné vložiť ako alternatívne regulátory rate/attitude; MPC pre pozíciu na companion počítači cez offboard rozhranie (uPX4/MAVSDK, ROS 2).
  • ROS 2 pipeline: Estimácia (VIO/EKF), MPC uzol (qp solver), generátor trajektórií (polynómy 7. rádu / minimum snap), synchronizácia časov cez time synchronization.
  • Bezpečnostné vrstvy: health monitor (IMU saturácia, GPS quality), fallback strom (MPC→LQR→PID→land), logging (uLog/ROSbag) pre analýzu.

Benchmark: ako spravodlivo porovnať PID, LQR a MPC

  1. Scenáre: step v pozícii (1 m), kružnica (r = 5 m, v = 2 m/s), náraz vetra (simulátor/ventilátor), limit ťahu (záťaž).
  2. Metriky: ITAE/ISE, overshoot, čas ustálenia, priemerná/špičková spotreba, % saturácie motorov, RMS prúd, maximum náklonu, kvalita videa (std. dev. gyra na gimbale), porušovanie limitov.
  3. Latencia: end-to-end (senzor→riadič→motor) a jitter; pre MPC zmerať čas riešenia a výpadky > 1 % cyklov.
  4. Robustnosť: variácie hmotnosti (±20 %), posun CG (±1–2 cm), degradované senzory (mag dropout, GNSS multipath).

Odporúčané vzorové nastavenia

Platforma Vnútorné slučky Vonkajšie slučky Poznámky
Racing/FPV 5 palcový PID (rate/attitude) PID (rýchlosť/pozícia off) Priorita latencie, vysoká šírka pásma; MPC zbytočné
Cinewhoop/filmový 7–10 palcový LQR (rate), PID (attitude) MPC (pozícia/rýchlosť) Limity náklonu ±15–20°, minimalizácia jerk
Mapovací VTOL/multirotor LQR MPC alebo LQR s ref. governorom Limit jerk/snap pre fotogrametriu, silný vietor
Ťažký lift (kamera/payload) LQR MPC Explicitné obmedzenia ťahu a teploty

Časté chyby a ako sa im vyhnúť

  • Nesprávna škála stavov v LQR/MPC: vedie k chabým prioritám; normalizujte stavy (m, m/s, rad, rad/s) pred voľbou Q/R.
  • Ignorovanie latencie estimátora: kompenzujte oneskorenie (Smith predictor, state preview), inak sa vytratí prínos LQR/MPC.
  • Bez anti-windup/command limiting: pri akýchkoľvek saturáciách musíte chrániť integrátory a solver.
  • Príliš krátky horizont MPC: vedie k myopickému správaniu; radšej menší model a N≥8, než komplikovaný model s N=3.

Zhrnutie: praktická voľba regulátora

Ak prioritou je minimálna latencia a jednoduchosť, ostáva PID osvedčenou voľbou. Pre vyššiu výkonnosť vnútorných slučiek a lepšie zvládanie väzieb siahnite po LQR (alebo LQI). Ak misia vyžaduje striktné dodržiavanie obmedzení, plynulé trajektórie a dobrú spotrebu pri náročných podmienkach, MPC na vonkajších slučkách prináša citeľný zisk – za cenu výpočtovej náročnosti a komplexity. Najlepšie výsledky v praxi prináša kombinácia: rýchly PID/LQR vnútri, MPC vonku, kvalitná estimácia a dôsledná bezpečnostná nadstavba.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *