Strojové učenie v odporúčaniach – Ekonomická encyklopédia

Strojové učenie ako motor prediktívnych odporúčaní

Prediktívne odporúčacie algoritmy premieňajú surové interakčné dáta na personalizované návrhy produktov, článkov, videí či služieb. Strojové učenie tu funguje ako „výrobník pravdepodobností“ – odhaduje, s akou pravdepodobnosťou používateľ vykoná akciu (zobrazenie → klik → nákup → opakovaný nákup). Kvalita odporúčaní je výsledkom troch vrstiev: dátového základu (eventy, kontext, obsah), modelovej vrstvy (embeddings, ranking) a operačnej aktivácie (serving s nízkou latenciou, spätná väzba, experimenty).

Charakter dát v odporúčacích systémoch

Explicitná spätná väzba: hodnotenia, recenzie, palce hore/dole. Hlasnejšia, ale zriedkavejšia.
Implicitná spätná väzba: kliky, zobrazenia, dwell-time, pridania do košíka, nákupy. Bohatá, no šumová.
Sparsita a long-tail: väčšina položiek má málo interakcií; vyžaduje dobré generalizačné reprezentácie.
Kontext: čas, zariadenie, umiestnenie slotu, zdroj návštevy, lokalita – významné pre relevanciu.
Multimodálnosť: text (názvy, popisy), obrázky, audio/video signály, meta-dáta katalógu.

Paragidmy učenia: od deskriptívneho k kauzálnemu

Supervidované učenie: predikcia pravdepodobnosti kliknutia/konverzie (CTR/CVR) alebo skóre preferencie.
Učenie bez dozoru a self-supervised: učenie reprezentácií (embeddings) z ko-objavení a sekvencií.
Učenie na poradie (LTR): optimalizácia top-K zoznamu pomocou pointwise/pairwise/listwise stratégií.
Kauzálne učenie: odhad efektu prezentácie (uplift), korekcie na bias v logoch (IPS, DR).
Reinforcement learning: optimalizácia dlhodobých odmien (retencia, LTV) v opakovaných interakciách.

Základné algoritmy: od heuristík k matricovej faktorizácii

Heuristiky a asociačné pravidlá: „ľudia kupujúci A často kupujú aj B“, košíková analýza; rýchle, no limitované.
Kolaboratívne filtrovanie (CF) – user-user / item-item: podobnosť na základe interakčných vektorov (kosínus, Jaccard); dobré pre studený katalóg so silnými vzormi.
Matricová faktorizácia: rozklad interakčnej matice na latentné faktory; trénovanie SGD/ALS; pre implicitné dáta často s váhami a regularizáciou.
BPR (Bayesian Personalized Ranking): párová optimalizácia pre implicitné preferencie (pozreté > nepozreté).

Obsahové a hybridné prístupy

Obsahové modely: porovnávajú vektory položiek (TF-IDF, word/graph embeddings, vizuálne embeddings) s profilom používateľa.
Hybridy: kombinujú CF a obsah (napr. lineárna kombinácia skóre, meta-learner, dvojvežové siete s viaczdrojovými vstupmi).
Výhoda: lepšia odolnosť na cold-start položiek a interpretovateľnejšie odporúčania.

Sekvenčné modely a kontext: keď poradie záleží

RNN/CNN pre sekvencie: modelovanie posledných N interakcií; krátkodobé trendy a „session-based“ signály.
Transformery (napr. SASRec, BERT-štýl): self-attention na dlhšie závislosti a viacnásobné úlohy (maskovanie, predikcia ďalšieho kroku).
Kontextové featury: čas dňa, deň týždňa, zariadenie, zdroj; zlepšujú relevance v reálnom čase.

Grafové odporúčania

Používateľ-položka interakcie tvoria bipartitný graf s bohatou štruktúrou. Grafové neurónové siete (napr. GCN/GraphSAGE) agregujú signály zo susedstva a propagujú ich cez hrany; škálujú sa cez vzorkovanie a mini-batche. Výsledné embeddings dobre zachytia komunitné a dlhé chvosty.

Učenie na poradie: pointwise, pairwise, listwise

Pointwise: predikcia p(klik), optimalizácia log-loss; jednoduché, no neoptimalizuje priamo top-K.
Pairwise (BPR, hinge): maximalizuje, aby preferované položky mali vyššie skóre než nepreferované.
Listwise (LambdaRank, softmax loss): optimalizácia celého zoznamu; lepší súlad s NDCG/MAP.

Bandity a posilňované učenie pre odporúčania

Kontextové bandity (LinUCB, Thompson Sampling): balans prieskum/využívanie (exploration/exploitation) pre slot-level rozhodnutia.
RL pre „slate“ odporúčania: optimalizuje celú zostavu naraz, berie do úvahy interakcie položiek (diverzita, kanibalizácia).
Reward shaping: kombinácia krátkodobých (klik) a dlhodobých (retencia, LTV) odmien.

Feature a embedding engineering

Používateľské featury: demografia (ak legálna), história, periodicita, preferované kanály, citlivosť na cenu.
Featury položiek: kategórie, cena, popularita, multimédia (textové, vizuálne, akustické embeddings).
Interakčné featury: krížové termy (user×item×context), recency/novelty, pozícia slotu.
Embeddings: učené end-to-end (dvojvežové siete) alebo zo self-supervised úloh (contrastive learning).

Riešenie cold-startu

Nové položky: obsahové embeddings, podobnosť k existujúcim položkám, seed traffic s kontrolovaným prieskumom.
Noví používatelia: onboardingové otázky, implicitné signály z prvých interakcií, priemerné/segmentové priory.
Nové trhy: transfer learning a adaptácia na lokálne preferencie.

Tréningové postupy a tvorba dátových sád

Negatívne vzorkovanie: sampling neinteragovaných položiek pre párové/listwise trénovanie.
Okno označovania: definujte predikčný horizont (napr. klik do 24 h) a „čisté“ pozorovanie bez únikov informácií.
Regularizácia a kalibrácia: L2, dropout, focal loss pre riešenie nerovnováhy; kalibrácia pravdepodobností (Platt, isotonic).

Metodiky hodnotenia: offline, online a kauzálne

Offline metriky sú rýchle, online metriky pravdivé a kauzálne metriky spravodlivé k biasom logov. Je vhodné ich kombinovať.

Metrika	Čo meria	Použitie	Poznámka
Precision@K / Recall@K	Relevancia v top-K	Rýchly screening modelov	Citlivé na popularitu
MAP / MRR / NDCG	Poradie a zisk zo stupňov	Rankingové ciele	NDCG váži pozície
AUC	Rozlišovaciu schopnosť	Pointwise modely	Nie top-K priamo
Diverzita/Novosť/Serendipita	Šírka a prekvapenie	„Zdravie“ katalógu	Vyhnúť sa filt. bubline
Coverage	Podiel obslúžených položiek	Long-tail podpora	Trade-off s CTR
Calibration	Presnosť pravdepodobností	Plánovanie a bidding	Nutná pre multi-cieľe

Online A/B testy: primárne ciele (CTR/CVR/ARPU) + guardrails (latencia, reklamné zásady, sťažnosti).
Interleaving: jemné porovnanie dvoch rankerov v jednom slote s menšou expozíciou.
Kauzálne hodnotenie: inverse propensity scoring (IPS), doubly robust (DR), counterfactual replay s propensiami.

Etika, férovosť a znižovanie biasu

Position/popularity bias: korekcie v off-policy hodnotení a trénovaní (propensity, randomized exposure).
Férovosť voči tvorcom/položkám: minimálne pokrytie, penalizácia nadmernej koncentrácie, multi-objective rankovanie.
Transparentnosť a vysvetliteľnosť: lokálne vysvetlenia (SHAP), kontrafaktuálne dôvody „prečo odporúčané“.
Súkromie a compliance: minimalizácia atribútov, pseudonymizácia, federované učenie a diferenciálne súkromie tam, kde je potrebné.

Optimalizácia viacerých cieľov (multi-objective)

Reálne systémy optimalizujú súčasne engagement, výnos, diverzitu a spokojnosť. Používajú sa vážené sumy, obmedzenia (constraints) alebo multi-objective RL. Pri zostavovaní „slate“ sa uplatňuje diverzifikačný penalty (MMR, xQuAD), aby sa znížila redundancia v top-K.

Architektúra systému: od featur po serving

Event tracking a katalóg: schéma udalostí, dôsledné ID používateľa/položky, deduplikácia a late-arrival handling.
Feature store: konzistentné featury pre tréning aj produkčné predikcie; historické „as-of“ pohľady.
Candiate generation → scoring → re-ranking: viacstupňová architektúra pre rýchlosť a kvalitu.
ANN vyhľadávanie: aproximované najbližšie susedstvo (vektorové indexy) pre rýchle kandidáty.
Latencia a škálovanie: SLO (napr. p95 < 100 ms), horizontálne škálovanie, cache s rozumnou expiráciou.
Feedback loop: logovanie exponovaných položiek s propensiou, aby bolo možné korektne trénovať ďalšie iterácie.

MLOps pre odporúčania

Verzionovanie: dáta, featury, modely, pipeline; reprodukovateľné tréningy.
CI/CD modelov: automatické tréningy, validácie, kanárske releasy a rollback.
Monitoring: výkon (CTR/CVR), distribučný drift, feature drift, latencia, chybovosť, anomálie.
Governance: dokumentácia dátových tokov, audit experimentov, bezpečnostné a etické review.

Príklady modelových architektúr a použitia

Algoritmus	Vstupy	Výstup	Typický use-case
Item-Item CF	Ko-sledovania, ko-nákupy	Podobné položky	„Podobné produkty“ na produkte
MF/BPR	Implicitné interakcie	Latentné embeddings	Personalizované top-K
Dvojvežová sieť	User & item featury	Skóre kompatibility	Candidate generation v škále
Transformer sekvenčný	História klikov	Predikcia ďalšieho	„Pokračovať v sledovaní/čítaní“
Kontextový bandita	User+slot+čas	Výber armu	Experimentálny prieskum
Graph GNN	Bipartitný graf	Grafové embeddings	Komunitné a long-tail odkrytie

Typické úskalia a ako sa im vyhnúť

Optimalizácia na proxy (CTR) bez obchodného dopadu: zaviesť multi-cieľe a offline-online alignment (NDCG vs. ARPU).
Filter bubble a homogenita: re-ranking s diverzitou, pravidlá pokrytia, riadený prieskum.
Datové úniky medzi tréningom a validáciou: striktné časové delenie, zákaz „future“ featur.
Overfitting na populárne položky: váhovanie strát, sampling, popularity-aware tréning.
Ignorovanie latencie a kapacity: návrh viacstupňovej pipeline, vektorové indexy, kvóty na featury.

Implementačný plán (12 mesiacov)

0–3 mesiace: definícia schémy eventov, základný CF/MF baseline, offline metriky a dashboardy, jednoduchý A/B rámec.
4–6 mesiacov: dvojvežová architektúra s feature store, ANN index, re-ranking s diverzitou, propensitné logovanie.
7–9 mesiacov: sekvenčný model (Transformer) pre session, bandit na prieskum slotu, kalibrácia pravdepodobností.
10–12 mesiacov: grafové embeddings, multi-objective rankovanie, kauzálne hodnotenie (IPS/DR), plný MLOps.

Checklist pred nasadením do produkcie

Sú definované primárne metriky a guardrails (latencia, kvalita, férovosť)?
Existuje „as-of“ konzistencia featur medzi tréningom a servingom?
Je zabezpečené propensitné logovanie a identifikácia exponovaných položiek?
Máte plán prieskumu (bandit) a obmedzenia na diverzitu/coverage?
Je nastavený monitoring driftu a automatický rollback?
Sú splnené požiadavky privacy a transparentnosti vysvetlení?

Zhrnutie

Moderné odporúčacie systémy spájajú robustné reprezentácie (embeddings), ranking optimalizovaný pre top-K, kauzálne hodnotenie a operačnú excelenciu. Kľúčom je harmonizovať ciele používateľa (relevancia a objavovanie) s cieľmi biznisu (výnos, retencia), a to v architektúre, ktorá je spoľahlivá, škálovateľná a eticky zodpovedná. Správna kombinácia dát, modelov a MLOps procesov pretvára odporúčania z „nápovedy“ na strategický motor rastu.

Samuel Salaj komentoval SCRUM
Filip Sichman komentoval Parcela
Šajno komentoval Odvolateľný akreditív
Šajto komentoval AVV
DawnBreaker komentoval Spoločnosť s ručením obmedzeným
Ellen komentoval Úverová kalkulačka
Julius Simsky komentoval Priemysel
Dwaewiel komentoval IOST (IOST)
Veronika B. komentoval Finančný trh
Peter Trnka komentoval Počítačový vírus