Módszer az üzleti mutatók anonimizálására implicit visszajelzési adatkészletek közzétételére

Gunosy Inc., Japán

implicit

Gunosy Inc., Japán

RIKEN Advanced Intelligence Project Center, Japán

RIKEN Advanced Intelligence Project Center, Japán

Új hivatkozási figyelmeztetés hozzáadva!

Ezt a riasztást sikeresen hozzáadtuk, és elküldjük a következő címre:

Értesítést kapunk, ha az Ön által kiválasztott rekordot idézik.

A riasztási beállítások kezeléséhez kattintson az alábbi gombra.

Új idézőjelzés!

Mentés a Binder-be
RecSys '20: Tizennegyedik ACM konferencia az ajánló rendszerekről

ABSZTRAKT

Ez a cikk bemutatja az adatkészletek kereskedelmi szolgáltatások létrehozásának és közzétételének módszerét. Az adatkészletek hozzájárulnak a gépi tanulás és az ajánló rendszerek kutatásának fejlesztéséhez. Különösen azért, mert az ajánló rendszerek központi szerepet játszanak számos kereskedelmi szolgáltatásban, a szolgáltatások adatkészleteinek közzététele iránt nagy az igény az ajánló rendszer közösség számára. Az adatkészletek kereskedelmi szolgáltatások általi közzététele azonban üzleti kockázatokkal járhat e vállalatok számára. Adatkészlet közzétételéhez ezt a szolgáltatás üzleti vezetőjének jóvá kell hagynia. Mivel sok üzleti vezető nem szakember a gépi tanulásban vagy az ajánló rendszerekben, a kutatók feladata elmagyarázni nekik a kockázatokat és előnyöket.

Először három kihívást foglalunk össze a kereskedelmi szolgáltatások adatkészleteinek felépítésével: (1) anonimizáljuk az üzleti mutatókat, (2) fenntartjuk a tisztességet és (3) csökkentjük a népszerűség torzítását. Ezután optimalizálási problémaként fogalmazzuk meg az adatkészletek elkészítésének és közzétételének problémáját, amely a felhasználók mintavételi súlyát keresi, ahol a kihívásokat megfelelő veszteségfüggvényekként kódolják. Módszerünket arra használtuk, hogy a valós mobil hírszolgáltatásunk nyers adataiból adatkészleteket állítsunk össze. A nyers adatoknak több mint 1.000.000 felhasználója van, 100.000.000 interakcióval. Minden adatkészlet kevesebb, mint 10 perc alatt készült el. Módszerünk tulajdonságait megvizsgáltuk az adatkészletek statisztikáinak és a tipikus ajánló rendszer algoritmusok teljesítményének ellenőrzésével.