Federated learning for recommender systems
Συνεργατικές τεχνικές μάθησης σε συστήματα συστάσεων

Master Thesis
Συγγραφέας
Karagounis, George
Καραγκούνης, Γεώργιος
Ημερομηνία
2025-06Επιβλέπων
Halkidi, MariaΧαλκίδη, Μαρία
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Federated learning ; Recommender systems ; Personalized recommendations ; Privacy-preserving machine learningΠερίληψη
Τα συστήματα συστάσεων αποτελούν βασικό στοιχείο πολλών ψηφιακών πλατφορμών, διευκολύνοντας την παροχή εξατομικευμένου περιεχομένου σε τομείς όπως το ηλεκτρονικό εμπόριο, οι υπηρεσίες streaming και τα μέσα κοινωνικής δικτύωσης. Ωστόσο, τα συμβατικά μοντέλα συστάσεων απαιτούν συχνά κεντρική πρόσβαση σε δεδομένα χρηστών, γεγονός που εγείρει σημαντικά ζητήματα ιδιωτικότητας και ασφάλειας, ιδιαίτερα υπό το πρίσμα σύγχρονων κανονισμών προστασίας δεδομένων όπως ο Γενικός Κανονισμός για την Προστασία Δεδομένων (GDPR). Η Συνεργατική Μάθηση (Federated Learning - FL), ένα συνεργατικό εκπαιδευτικό παράδειγμα που διαφυλάσσει την ιδιωτικότητα, αντιμετωπίζει αυτά τα ζητήματα διατηρώντας τα δεδομένα του χρήστη τοπικά στις συσκευές-πελάτες, ενώ στον κεντρικό διακομιστή συγκεντρώνονται μόνο ενημερώσεις του μοντέλου. Αυτό καθιστά την FL ιδιαίτερα κατάλληλη για εργασίες εξατομικευμένων συστάσεων, αποτελώντας τη βάση των Ομοσπονδιακών Συστημάτων Συστάσεων (Federated Recommendation Systems – FedRS). Η παρούσα εργασία εξετάζει την εφαρμογή προηγμένων μοντέλων βαθιάς μάθησης σε συνεργατικό πλαίσιο για την εξατομικευμένη σύσταση αντικειμένων. Αξιολογούνται πολλοί αλγόριθμοι συνεργατικής μάθησης, όπως ο βασικός Federated Averaging (FedAvg), ο Σταθμισμένος Federated Averaging (WFedRec) και η προτεινόμενη μέθοδος με ενίσχυση μέσω ομαδοποίησης, CWFedRec. Η προτεινόμενη μέθοδος CWFedRec εισάγει ομαδοποίηση των πελατών με βάση τις σημασιολογικές προτιμήσεις των χρηστών και ενσωματώνει εξατομικευμένους διανυσματικούς όρους προκατάληψης (bias vectors), οι οποίοι παράγονται μέσω sentence transformers. Αυτοί οι αλγόριθμοι αποσκοπούν στην αντιμετώπιση προκλήσεων που είναι ιδιαίτερες για τα FedRS, όπως η ετερογένεια των δεδομένων, οι περιορισμοί στο εύρος ζώνης επικοινωνίας και η κατάρα της διαστασιμότητας σε χώρους ενσωμάτωσης υψηλών διαστάσεων.

