SI Unit

SI Unit

Video
Název projektu / produktu: Eshop Matcher
Team leader: Ondřej Švanda
Výzva: č. 2: Umělá inteligence chrání spotřebitele
Problém: Problém napárovat na sebe produkty z různých eshopů podle strukturovaných dat, ovšem tato struktura byla nekonzistentní napříč různými eshopy. Problém rozpoznání klíčových slov a kontextu.
Řešení: Navrhli jsme algoritmus využívající full-textové vyhledávání a spoooooustu heuristiky a sanitizaci a konverzi dat. Úspěšnost párování je relativně vysoká, ukazují na to statistiky, kde až 50% produktů z jednoho eshopu bylo nalezeno ve druhém. Je nasnadě poznamenat, že 100% shoda není možná z důvodu diverzity produktů napříč eshopy.
Dopad: Spotřebitel si může jednoduše porovnat stejný produkt na více eshopech, které dříve nebyly možné nijak spojit. Díky Apify se není nutné spoléhat na data poskytovaná samotnými eshopy.
Proveditelnost: Věříme, že rozšířením stávajícího algoritmu by bylo více než možné dosáhnout produkční verze. Při automatickém určení důležitosti určitých klíčových slov by mohl být systém relativně robustní.
Co jste udělali během hackathonu - popište textově + uveřejněte kód (např. GitHub link): Navrhli a implementovali jsme algoritmus založený na fulltextovém vyhledávání pro propojení nabídek produktů na eshopů. Přišli jsme téměř bez zkušeností, nespali jsme, jedli jsme nezdravě, spálili jsme pizzu (kterou jsme taky snědli, protože nic jiného nebylo), ale stihli jsme to. Odkaz na naše špagety: https://github.com/holyduke/robothon-si-unit.git
Co jste měli před hackathonem? Použili jste open source?: Duševní zdraví a velké ambice. Použili jsme python a fulltextovou knihovnu Whoosh, Vue.js a taky jsme postahovali spoustu nástrojů, které jsme zavrhli. Byla to švanda.
Co následuje? Jaká je vize a čeho konkrétního byste rádi dosáhli?: Oběd a pak 2 dny refactoring kódu a unit testy. V pondělí releasujem do produkce.