Algoritmy doplnkových produktov

Algoritmy doplnkových produktov

Prečo odporúčať doplnkové produkty a aké sú ciele

Odporúčanie doplnkových produktov (cross-sell) zvyšuje priemernú hodnotu objednávky (AOV), maržu a spokojnosť zákazníka tým, že navrhuje kompatibilné položky k práve prezeranému alebo nakupovanému produktu. Na rozdiel od „podobných“ produktov (substitúty) ide o komplementy – príslušenstvo, spotrebný materiál, rozšírenia a služby. Algoritmy musia rešpektovať kompatibilitu, kontext, zásoby, cenu a zámer. Optimálna stratégia kombinuje rýchlu kandidátovú generáciu a presné rankingové modely s obchodnými pravidlami a experimentovaním.

Architektúra: od dát k rozhodnutiu

  • Zdrojové dáta: transakcie (košíky, sekvencie), prehliadanie (session events), katalóg (atribúty, kompatibilita), ceny a promo, marže, sklad, dodacie časy, recenzie.
  • Feature store: agregáty (co-occurrence, RFM), sekvenčné znaky (posledné n interakcií), kontext (kanál, zariadenie, lokalita, čas), signály kompatibility.
  • Servírovacia vrstva: candidate generation (ms latencia) → ranking (model s plnými znakmi) → re-ranking (biznis pravidlá: zásoby, marža, diverzita, brand safety).
  • Meranie: offline (Precision@k, NDCG@k) + online (A/B, uplift konverzie, AOV, marža), s trvalými holdout skupinami.

Heuristiky a pravidlá: baseline pre rýchly štart

  • Manuálne páry: kurátorované mapovania „produkt → príslušenstvo“. Výhoda: 100 % kompatibilita. Nevýhoda: nízka škálovateľnosť, rýchla zastaranosť.
  • Top sellers per category: najpredávanejšie doplnky v danej kategórii. Výhoda: jednoduché. Nevýhoda: ignoruje personalizáciu a kompatibilitu.
  • Podobnosť atribútov: párovanie podľa značky/modelu/rozmerov. Výhoda: interpretovateľnosť. Nevýhoda: slabšie pri bohatých katalógoch.

Asociačné pravidlá a ko-výskyt

Tradičný prístup pre „kupované spolu“. Vstup: transakčné košíky.

  • Apriori, FP-Growth: hľadanie pravidiel typu {A} → {B} s metrikami support, confidence, lift. Lift > 1 signalizuje komplementaritu nad náhodu.
  • Pointwise Mutual Information (PMI): PMI(A,B) = log [ P(A,B) / (P(A)P(B)) ]; robustné skóre ko-výskytu s penalizáciou častých samostatných položiek.
  • Normalizácie a sezónnosť: časovo vážené počítanie (exponenciálny rozpad), filtrácia sezónnych šumov a promo efekty.
  • Výhody: jednoduchosť, transparentnosť, dobré pre „PDP → doplnky“.
  • Limity: studený štart noviniek, ignorovanie používateľského kontextu, citlivosť na sparsity.

Kolaboratívne filtrovanie (CF)

  • Item-Item CF: podobnosť medzi položkami podľa spoločných kupujúcich/pozerajúcich. Vhodné pre doplnky, ak podobnosť počítame na ko-nákupoch, nie len ko-prehliadaní.
  • User-User CF: nájde „podobných“ používateľov a odporučí ich doplnky. Menej stabilné pri vysokom sparsity.
  • Implicitné feedbacky: nákupy, zobrazenia, kliky s váhami (nákup > pridanie do košíka > zobrazenie). Modely ako Implicit ALS pracujú s binárnymi a váženými signálmi.
  • Výhody: personalizácia bez potreby atribútov.
  • Limity: škálovanie, studený štart, zameranie na populárne položky.

Faktorizačné a embeddingové modely

  • Matrix factorization (ALS/BPR): naučí vektory pre používateľov a položky; BPR optimalizuje párové poradie (zakúpené > nezakúpené) – vhodné pre ranking doplnkov.
  • Word2Vec pre produkty („prod2vec“): okenný kontext v košíkoch/sesiách → vektory položiek; komplementy majú vysokú kosínusovú podobnosť.
  • Hybridné embeddings: kombinácia ko-výskytu a textových/obrázkových embeddingov (popis, obrázky) na pokrytie long tailu.

Sekvenčné a session-based modely

  • Markovské reťazce: pravdepodobnosti prechodov medzi typmi položiek (napr. „telefón → puzdro“).
  • RNN/GRU a Transformers: predikcia ďalšej položky v relácii; doplnkovosť sa učí z poradia akcií. Výhoda: citlivé na krátkodobý zámer.
  • Next-Basket Recommendation: predpovedá košík ako množinu (Set Transformers, Deep Sets); vhodné pre plánované doplnenie spotrebného materiálu.

Grafové metódy a znalostné grafy

  • Product graph: uzly = produkty, hrany = ko-nákup, kompatibilita, substitúcia; techniky Node2Vec, GraphSAGE pre šírenie signálu.
  • Znalostný graf: uzly = produkt, značka, konektor, zariadenie; logické obmedzenia „kompatibilita“ zabezpečia presnosť (napr. sockety žiaroviek).
  • Výhoda: explicitné pravidlá kompatibility, lepšia interpretácia a kontrola.

Kandidátová generácia vs. ranking: dvojstupňová stratégia

  • Generácia kandidátov (1–5 ms): co-occurrence, prod2vec, item-item CF. Cieľ: znížiť z 106 položiek na ~100–500 kandidátov.
  • Ranking (10–50 ms): gradient boosting / neurónové siete s featurami: cena, marža, zľava, popularita, kompatibilita, podobnosť, kontext, používateľská história, expedičný čas.
  • Re-ranking: diverzita, limit na počet rovnakých značiek, skladovosť, pravidlá kampaní, “do not recommend” zoznam.

Optimalizácia na podnikové ciele

  • Maržovo uvedomelé odporúčanie: v rankeri optimalizujte expected margin = P(konverzie) × marža − náklady (zľava, logistika).
  • Inventár a SLA: penalizácia nízkej skladovosti a dlhých dodacích časov; preferencie lokálneho skladu.
  • Udržateľnosť: preferovať doplnky s nižšou návratovosťou a ekologickým balením.

Kauzalita, bandity a reinforcement learning

  • Uplift modely: odhad inkrementálneho efektu odporúčania na konverziu/AOV vs. pasívne zobrazenie.
  • Kontextové bandity: online učenie výberu widgetu/pozície/počtu položiek s minimalizáciou regretu.
  • RL v košíku: sekvenčné rozhodovanie (koľko slotov, ktoré kategórie) s odmenou CLV a penalizáciami za rušivosť.

Správa kompatibility a doménové pravidlá

  • Kompatibilitná matica: tabuľka „base SKU → compatible SKU“ generovaná z katalógu a obohatená o logy vrátení (inkompatibilita).
  • Kontraindikácie: vylúčenie substitútov v doplnkovom slote (napr. dve konkurenčné základné položky).
  • Regulácie: vekové obmedzenia, regionálne zákazy, bezpečnostné normy.

Evaluácia: offline a online metriky

  • Offline: Precision@k, Recall@k, MAP, NDCG, Coverage, Novelty, Diversity, Serendipity.
  • Online: CTR → Add-to-Cart Rate → Conversion Rate, AOV, marža/relácia, attach rate doplnku, návratovosť, complaint rate.
  • Kauzálne: uplift (Δ medzi test a kontrolou), CUPED pre redukciu variance, dlhodobý CLV efekt.

Tabuľka: porovnanie prístupov

Metóda Silné stránky Slabiny Použitie
Asociačné pravidlá / PMI Transparentné, rýchle Žiadna personalizácia, sezónnosť PDP, kategórie s jasnou kompatibilitou
Item-Item CF Dobrá presnosť, jednoduché kandidáty Sparsity, popularita bias Košík, podobné relácie
Prod2vec / embeddings Pokrytie long tailu, rýchly nearest-neighbor Interpretácia, citlivosť na okno Generácia kandidátov
Seq. modely (RNN/Transformer) Citlivosť na zámer Komplexita, latencia Session widgety, real-time
Grafové metódy Kompatibilita, interpretácia Údržba grafu Technické príslušenstvo
Bandity / RL Online optimalizácia Exploration riziko Výber slotov a layoutov

Miesta umiestnenia odporúčaní a špecifiká

  • PDP (produktová stránka): primárne doplnky viazané na SKU; vysoká potreba kompatibility.
  • Košík: nízky počet položiek (1–3), rýchle rozhodnutie, dôraz na dostupnosť a doručenie spolu s objednávkou.
  • Checkout: iba neinvazívne, nízkorizikové doplnky (záruky, balenie); pozor na rušivosť.
  • Post-purchase / e-mail: spotrebný materiál, doplnenie, inštalačné služby; časovanie podľa životnosti.

Diverzita, novost a serendipita

  • Diverzita: maximalizovať pokrytie kategórií v top-k; penalizácia redundancie (x podobných puzdier).
  • Novost: uprednostniť relevantné novinky s váhovanou popularitou; kontrola rizika výkonu cez bandity.
  • Serendipita: pridať 1 „prekvapivý“ doplnok s logickou väzbou a vysokou spokojnosťou (napr. inštalačný kit).

Etika, férovosť a súlad

  • Transparentnosť: označenie „Odporúčané podľa vašej aktivity“ vs. „Sponzorované“.
  • Férovosť: kontrola biasu voči menším značkám (share of shelf), limity promo zásahov.
  • Súkromie: minimalizácia osobných údajov, agregácia a anonymizácia, správa súhlasov.

MLOps a prevádzka

  • Verzionovanie: dáta, featury, modely a pravidlá ako kód; auditovateľné releasy.
  • Monitoring: online metriky (CTR, ATC, AOV), výstrahy na drift, latencia p99, pokrytie inventory.
  • Retréning: plánovaný (týždenne/mesačne) + event-driven (nové kolekcie, sezóna, promo).
  • Canary a rollback: postupné vypúšťanie modelu; bezpečnostné guardrails (fallback na heuristiky).

Praktický rankingový model: príklad vstupov

  • Používateľ: frekvencia nákupov, citlivosť na cenu (história zliav), preferované značky, RFM skóre.
  • Položka (base SKU): typ, značka, generácia, kompatibilitná trieda, priemerné ko-nákupy.
  • Kandidát (add-on): marža, zľava, sklad, promo, hodnotenie, návratovosť.
  • Kontext: zariadenie, zdroj návštevy, čas, krajina, logistické SLA.

Špecifiká domén

  • Elektronika: tvrdé kompatibility (konektory, modely); znalostné grafy a kurátorované mapy.
  • Móda: stylingové doplnky; vizuálne embeddings (CLIP) a outfitové grafy.
  • DIY/Auto: diely podľa VIN/rozmerov; striktné filtrácie a validácie.
  • FMCG: dopĺňanie spotreby; sekvenčné modely a predikcia replenishmentu.

Experimentovanie a rollout

  1. Hypotézy: napr. „prod2vec kandidáty + GBM ranker zvýšia attach rate o 8 %“.
  2. Testovací dizajn: A/B s CUPED, stratifikácia podľa trafficu a zariadenia; minimálna vzorka pre 95 % CI.
  3. Guardrails: stabilita AOV, complaint rate, latencia, out-of-stock rate.
  4. Dokumentácia: výsledky do znalostnej bázy a dizajn systému „recommendation components“.

Roadmap zavedenia na 12 týždňov

  1. Týždeň 1–2: zber a čistenie transakcií, katalógové obohatenie (kompatibilita), definícia KPI a slotov.
  2. Týždeň 3–5: kandidáty (PMI/prod2vec), základný ranker (GBM) s maržou a skladom; widgety pre PDP a košík.
  3. Týždeň 6–8: online A/B, re-ranking pravidlá (diverzita, brand caps), monitoring a alerty.
  4. Týždeň 9–10: sekvenčný model pre košík, znalostný graf pre kritické kompatibility.
  5. Týždeň 11–12: bandit pre výber layoutu/počtu slotov, rollout a post-mortem.

Hybridný prístup ako štandard

Najvyšší výkon pri odporúčaní doplnkov vzniká spojením: ko-výskyt + embeddings pre rýchlu generáciu kandidátov, kontextový ranker optimalizovaný na maržu a SLA, a pravidlový re-ranking pre kompatibilitu, diverzitu a súlad. Priebežné experimentovanie a MLOps zaručia udržateľný prínos – vyšší AOV, spokojnosť i dlhodobý CLV.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *