Predictive Policing: Bezpečnosť vs. spravodlivosť

Čo je predictive policing a prečo je téma kontroverzná

Predictive policing (prediktívne policajné analýzy) je súbor dátovo-analytických metód, ktoré odhadujú pravdepodobnosť výskytu kriminality v čase a priestore alebo riziko recidívy u jednotlivcov. Cieľom je efektívnejšia alokácia zdrojov (patrolné trasy, prevencia, komunitné aktivity) a skrátenie reakčného času. Zároveň však ide o oblasť s vysokým etickým, právnym a spoločenským rizikom: algoritmy môžu reprodukovať historické nerovnosti, generovať perverzné stimuly a vytvárať samosplňujúce sa slučky spätnej väzby.

Typológia prístupov

Place-based (hot-spot) modely: predikujú riziko incidentu pre geografické jednotky (mriezka, ulica, parcelácia) v časových oknách (hodiny, dni). Vhodné na plánovanie hliadok a situačné opatrenia.
Person-based modely: skóre rizika pre jednotlivcov (napr. recidíva, viktimizácia). Najrizikovejšie z pohľadu ochrany práv a spravodlivosti – vyžadujú mimoriadne prísne garancie a často sa odporúčajú nenasadzovať.
Event-based modely: odhady pravdepodobnosti konkrétnych typov udalostí (napr. krádeže áut vs. vlámania) s rozdielnymi prediktormi a sezonalitou.

Dátový ekosystém a kvalita údajov

Primárne zdroje: hlásenia incidentov (čas, GPS, typ), záznamy zásahov, volania na tiesňovú linku, dopravné a environmentálne senzory.
Sekundárne zdroje: demografia na úrovni štvrtí, urbanistické dáta (osvetlenie, dopravné uzly), ekonomické indikátory, udalosti (festivaly, zápasy), počasie.
Problémy kvality: underreporting (nie všetky delikty sú hlásené), selekčné skreslenie (viac hliadok → viac zistení), nehomogénne kategórie skutkov, zmeny v kódovaní.
Governance: jasné dátové zmluvy, auditná stopa, verzovanie kategórií skutkov, evidovanie zberovej intenzity (patrol hours, stops) pre korekciu skreslení.

Modelové prístupy a štatistická logika

Intenzitné (poisson/negbin) a bodové procesy: Hawkesove self-exciting modely zachytávajú priestorovo-časovú difúziu (napr. near-repeat efekt pri vlámaniach).
Strojové učenie: gradient boosting, náhodné lesy, regularizovaná logistická regresia; pre obrazové mriežky aj konvolučné neurónové siete.
Kauzálne a robustné odhady: uplift modely pre vyhodnotenie efektu zásahu, bayesovské hierarchické modely pre malé oblasti, domain adaptation pri zmene podmienok.
Kalibrácia: nevyhnutná pre použiteľnosť; používa sa reliabilitná krivka, Brier skóre a izotonická regresia.

Architektúra riešenia (referenčný model)

Ingest & staging: ETL/ELT z policajných systémov, anonymizácia/pseudonymizácia, geokódovanie, časové normalizácie.
Feature store: priestorovo-časové agregácie (rolling windows), udalostné lagy, hustoty objektov záujmu, exogénne signály.
Model serving: plánovač batch/stream predikcií, verziovanie modelov, shadow a canary režimy.
Decisioning & UX: mapové heatmapy s intervalmi neistoty, odporúčania s kontextom (prečo), zásady použitia (Do/Don’t), human-in-the-loop.
Observabilita: monitorovanie driftu, fairness metrík, logging zásahov, spätná väzba pre tréning s kontrolou slučky.

Meranie výkonu: metriky, ktoré dávajú zmysel

Kategória	Metrika	Poznámka
Presnosť	Precision@K (plocha K % mesta)	užitočnejšia než AUROC pri extrémnej nerovnováhe tried
Kalibrácia	Brier skóre, reliabilitné krivky	pravdepodobnosti musia zodpovedať frekvenciám
Dopad	Uplift vs. kontrola	AB/stepped-wedge experimenty, nie len korelácie
Robustnosť	Stabilita pri back-testing v rôznych oknách	citlivosť na sezónnosť a exogénne šoky
Fairness	Disparate impact, EO gap, false-positive rate parity	merané na agregovaných geografických a demografických úrovniach

Slučky spätnej väzby a ako im predchádzať

Ak model odporučí viac hliadok v oblasti A, zistí sa tam viac priestupkov (najmä tých závislých od policajnej prítomnosti), čo posilní rizikovosť oblasti v tréningových dátach. Výsledkom je algoritmické zosilnenie. Mitigácie:

vážiť incidenty podľa zdroja (nahlásenia vs. proaktívne odhalenia),
explicitne modelovať expozíciu (patrol hours, stops) ako kovariátu,
zahrnúť randomizované a kontrolné zóny pre korekciu zaujatosti,
nevyužívať výkonnostné metriky, ktoré sú samy funkciou zvýšenej prítomnosti (napr. počet zastavení).

Spravodlivosť a práva: rámec hodnotenia

Účel a proporcionalita: jasne vymedzený cieľ (napr. zníženie viktimizácie) a test menej invazívnych alternatív.
Transparentnosť: zverejnené metodiky, opis dát, model cards, vysvetlenia na úrovni zóny (nie jednotlivcov).
Fairness metriky: porovnávať zaťaženie zón a komunít; sledovať equalized odds a predictive parity v relevantných skupinách.
Etické limity: zákaz person-based blacklistov, zákaz použitia citlivých atribútov a proxí, zákaz skórovania pravdepodobnosti spáchania pre jednotlivcov.

Právne a regulačné zásady (všeobecný pohľad)

Ochrana osobných údajov: zákonný základ, minimalizácia, pseudonymizácia, prístupové kontroly, účelové viazanie a retenčné lehoty.
Vyššie riziko AI: predbežné posúdenie dopadov (DPIA/ALTA), register použitia, nezávislé audity a možnosť opt-out pre formy, ktoré ovplyvňujú práva jednotlivcov.
Zásada zodpovednosti: dokumentácia rozhodovacích pravidiel, dohľad ľudí, možnosť sťažnosti a nápravy.

Bezpečnosť: útoky a obrana

Data poisoning: manipulatívne hlásenia alebo geotagging môžu skresliť mapy rizika – nutná validácia a detekcia anomálií.
Model evasion: adaptívne správanie páchateľov – dôležité je kombinovať predikcie s situačnými opatreniami a komunitnou prácou.
Distribučný drift: udalosti (pandémie, migračné vlny, ekonomické šoky) – vyžadujú online monitoring a retraining s kontrolou stability.

Proces zavádzania: od pilotu po prevádzku

Definícia problému: typ deliktu, mierka priestoru, cieľové KPI (nie viac zásahov, ale menej viktimizácie).
DPIA/etický prehľad: identifikácia rizík, plán mitigácií, participácia komunity a nezávislých expertov.
Datasety a kvalita: baseline audit, protokoly čistenia, záznamy o expozícii.
Pilot s experimentom: randomizované alokácie, stepped-wedge dizajn, kontrolné pasy, predregistované hypotézy.
Governance: etická rada, model registry, schvaľovanie verzií, incident response, pravidelné verejné reporty.

Human-in-the-loop a dizajn rozhodovania

Odporúčanie ≠ pokyn: výstupy majú formu návrhov s neistotou a odôvodnením; konečné rozhodnutie je na veliteľovi služieb.
Vysvetliteľnosť v kontexte: top faktory na úrovni zóny (čas, blízkosť dopravných uzlov), nie atribúty ľudí.
Pravidlá použitia: explicitné Do/Don’t (napr. Don’t: zastavovanie ľudí len na základe mapy rizika; Do: upraviť trasu hliadky, koordinovať osvety a osvetlenie).

Fairness techniky a obmedzenia

Re-weighting a re-sampling: korigujú nerovnomerne zbierané dáta; pozor na zvýšenie rozptylu.
Proxy detection: testy na koreláty citlivých znakov (napr. jemná geografia môže byť proxí pre etnicitu) a ich odstránenie/agregácia.
Constrained optimization: trénovanie s fairness obmedzeniami; kompromis výkon ↔ rovnosť dopadu.
Counterfactual evaluation: odhad, ako by dopadli oblasti bez zvýšenej prítomnosti; vyžaduje kauzálne modely a experimenty.

KPI programu (nie len presnosť modelu)

KPI	Definícia	Interpretácia
Zmena viktimizácie	Δ počtu hlásených trestných činov na 1 000 obyv.	hlavný cieľ – zníženie škôd, nie zvýšenie výkonu
Konverzia odporúčaní	% odporúčaní, ktoré viedli k opatreniu	operatívne prijatie bez nátlaku
Fairness gap	rozdiel zaťaženia medzi komunitami	alarm pri prekročení prahov
Transparency index	dostupnosť dokumentácie, logov, reportov	predpoklad dôvery a zodpovednosti
Complaint & remedy rate	podania vs. uznané pochybenia a nápravy	funkčnosť mechanizmov spätnej väzby

Syntetické prípadové scenáre

Hot-spot patroling pre vlámania do áut: 500×500 m mriežka, 24-hodinové okná, Hawkes + gradient boosting. AB test s rotáciou zón: −14 % incidentov v intervenčných zónach pri nezvýšenom počte kontrol osôb; fairness gap < 5 % medzi štvrťami po re-weightingu.

Komunitná prevencia vandalizmu: model rizika používaný na plánovanie osvetlenia, čistenia a spoločenských akcií, nie na zásahy. Výsledok: −22 % škôd na majetku, pozitívny NPS obyvateľov, nulové sťažnosti na profilovanie.

Limity použitia a červené línie

nepoužívať na individuálne skórovanie viny alebo rozhodovanie o vine/treste,
nepodmieňovať zákonné zásahy samotným rizikovým heatmapom,
nezahrnúť citlivé znaky ani proxí atribúty; minimalizovať jemnú geolokáciu, ak nie je nevyhnutná,
nezavádzať bez nezávislého auditu, experimentálneho dôkazu prínosu a mechanizmu nápravy.

Roadmapa implementácie (0–12 mesiacov)

0–90 dní: problémové vyhlásenie, DPIA/etické posúdenie, dátový audit, dizajn experimentu a governance.
90–180 dní: MVP place-based model, kalibrácia, fairness baseline, tréning operatívnych tímov, shadow prevádzka.
180–270 dní: randomizovaný pilot, pravidelné verejné reporty, iterácie mitigácií (re-weighting, exposure modeling).
270–365 dní: rozhodnutie o škálovaní alebo ukončení; ak škálovať, tak len s pevnými guardrails, auditmi a komunitným dohľadom.

Zhrnutie

Prediktívne policajné analýzy môžu v špecifických, prísne regulovaných prípadoch prispieť k lepšej prevencii a ochrane obetí. Podmienkou je však proporcionálnosť, transparentnosť, dôkaz o kauzálnom prínose a spravodlivosť. Bez nich hrozí posilňovanie nerovností a erózia dôvery. Ak sa organizácia rozhodne pre place-based analytiku, mala by ju vnímať ako podporný nástroj pre komunitne ukotvenú policajnú prácu, nie ako autonómny mechanizmus rozhodovania.

Samuel Salaj komentoval SCRUM
Filip Sichman komentoval Parcela
Šajno komentoval Odvolateľný akreditív
Šajto komentoval AVV
DawnBreaker komentoval Spoločnosť s ručením obmedzeným
Ellen komentoval Úverová kalkulačka
Julius Simsky komentoval Priemysel
Dwaewiel komentoval IOST (IOST)
Veronika B. komentoval Finančný trh
Peter Trnka komentoval Počítačový vírus