Συστήματα συστάσεων στην επιστήμη των δεδομένων : τεχνικές και εφαρμογές
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Συστήματα συστάσεων ; Μηχανική μάθηση ; Στατιστικές τεχνικές ; Recommender systemsΠερίληψη
Τα Συστήματα Συστάσεων (RS) είναι εξαιρετικά δημοφιλή στη σύγχρονη εποχή. Ίσως δεν είναι υπερβολή να τα χαρακτηρίσουμε ως ένα από τα πιο ισχυρά εργαλεία της Μηχανικής Μάθησης, αφού εφαρμόζονται σήμερα σε ευρεία κλίμακα και πληθώρα τομέων. Ένας από τους χαρακτηριστικότερους τομείς είναι το ηλεκτρονικό εμπόριο, όπου τα Συστήματα Συστάσεων χρησιμοποιούνται με σκοπό να προωθήσουν και να αυξήσουν τις πωλήσεις των ηλεκτρονικών καταστημάτων. Τα Συστήματα Συστάσεων στοχεύουν στην πρόβλεψη των ενδιαφερόντων των χρηστών και στη δημιουργία προτάσεων που είναι πιθανό να επιλέξει ο χρήστης. Τα δεδομένα που απαιτούνται για τη λειτουργία ενός τέτοιου συστήματος πηγάζουν συνήθως από αναζητήσεις στις μηχανές αναζήτησης καθώς και το ιστορικό αγορών ή από άλλες πληροφορίες σχετικά με τους ίδιους τους χρήστες και τα προϊόντα που αυτοί έχουν επιλέξει στο παρελθόν. Ιστότοποι όπως το Google, το Netflix, το Spotify, η Amazon κτλ χρησιμοποιούν τέτοια δεδομένα για τη δημιουργία συστάσεων, οι οποίες δεν είναι κοινές σε όλους τους χρήστες, αλλά εξατομικευμένες, βασιζόμενες στις προτιμήσεις του κάθε χρήστη.
Στόχος αυτής της εργασίας είναι η θεωρητική περιγραφή των Συστημάτων Συστάσεων και η εφαρμογή, στη συνέχεια, της μεθοδολογίας που θα περιγραφεί σε ένα σύνολο πραγματικών δεδομένων ταινιών. Έτσι, στα πλαίσια της παρούσας διπλωματικής, αφού ολοκληρώθηκε η στατιστική ανάλυση σχετικών δεδομένων, κατασκευάστηκε ένα RS που ανήκει στην κατηγορία Content Based Recommender Systems, χρησιμοποιώντας ένα μοντέλο λογιστικής παλινδρόμησης. Στη συνέχεια, κατασκευάστηκαν δύο RSs της κατηγορίας Collaborative Filtering. Το πρώτο, με τη βοήθεια της τεχνικής Singular Value Decomposition-SVD και το δεύτερο με τη βοήθεια της τεχνικής Alternating Least Squares-ALS. Η σύγκριση και των τριών RSs έγινε με χρήση των μετρικών απόδοσης Precision, Recall και F1-Score. Το σύστημα συστάσεων με την καλύτερη απόδοση ήταν αυτό της τεχνικής Singular Value Decomposition, και ως εκ τούτου ήταν αυτό που χρησιμοποιήθηκε για να παραχθούν συστάσεις.