Ranking recommendations via online learning
Διατεταγμένες συστάσεις μέσω άμεσης μάθησης
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Online learning ; Ranked recommendations ; Multi-armed bandit problemΠερίληψη
Στη σημερινή εποχή, που χαρακτηρίζεται από υψηλούς ρυθμούς μετάδοσης της πληροφορίας και της ολοένα αυξανόμενης χρήσης του παγκόσμιου ιστού, υπάρχουν πολλές εφαρμογές και ιστοσελίδες που χειρίζονται συστήματα συστάσεων, προκειμένου να παρέχουν στους χρήστες τους τις καλύτερες δυνατές προτάσεις. Η λύση για τέτοιου είδους συστήματα δίνεται από την «Άμεση Μάθηση», η οποία απαιτεί χαμηλούς υπολογιστικούς πόρους και προσφέρει βέλτιστα αποτελέσματα. Στην παρούσα διπλωματική εργασία, εξετάζουμε την «Άμεση Μάθηση» και ειδικά το πρόβλημα των «Πολλαπλών Κουλοχέρηδων», που αποτελεί μία από τις διαστάσεις της. Σε επόμενα τμήματα, θα παρουσιάσουμε ορισμένους από τους πιο γνωστούς αλγόριθμους άμεσης μάθησης, που αναφέρονται στο προαναφερθέν πρόβλημα.
Συγκεκριμένα, μας ενδιαφέρουν οι «διατεταγμένες συστάσεις» και η χρήση του μετα-αλγορίθμου «Αλγόριθμος Διατεταγμένων Κουλοχέρηδων» (RBA) στα πειράματά μας, ο οποίος χειρίζεται εκδοχές άλλων αλγορίθμων άμεσης μάθησης. Μελετάμε τη σύγκλιση του RBA μέσω των «επιχορηγούμενων συστάσεων», στις οποίες κάθε άρθρο είναι συσχετισμένο με ένα έσοδο, ενώ κάθε χρήστης είναι ένα υποσύνολο των άρθρων που τον ενδιαφέρουν και προέρχεται τυχαία από ένα σύνολο διαφορετικών πληθυσμών.