Εφαρμογές τεχνικών μηχανικής μάθησης σε δεδομένα γράφων
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Δεδομένα γράφων ; Μηχανική μάθηση ; Συστήματα συστάσεων ; Νευρωνικά δίκτυα ; ΠάιθονΠερίληψη
Στη σύγχρονη εποχή μας τα συστήματα συστάσεων βασίζονται σε μεγάλο βαθμό στη
μηχανική μάθηση για να μαθαίνουν αυτόματα και να βελτιώνονται με την πάροδο του
χρόνου με βάση τα δεδομένα και τα σχόλια των χρηστών. Πολλοί ιστότοποι και
εφαρμογές όπως κοινωνικά δίκτυα, υπηρεσίες περιεχομένου, πλατφόρμες ηλεκτρονικού
εμπορίου και άλλα, χρησιμοποιούν αλγόριθμους συστάσεων για να βοηθήσουν τους
χρήστες να βρουν νέα αγαθά, υπηρεσίες ή πληροφορίες που μπορεί να τους
ενδιαφέρουν. Προκειμένου να μοντελοποιήσουν τα γούστα και τα ενδιαφέροντα ενός
χρήστη τα συστήματα συστάσεων χρησιμοποιούν αλγόριθμους μηχανικής μάθησης για
την αξιολόγηση τεράστιου όγκου δεδομένων χρήστη, συμπεριλαμβανομένων
αξιολογήσεων, ερωτημάτων αναζήτησης και προηγούμενων αγορών. Στη συνέχεια, με
τη χρήση αυτού του μοντέλου παράγονται εξατομικευμένες συστάσεις με βάση τις
απαιτήσεις και τα γούστα κάθε χρήστη.
Στην παρούσα μεταπτυχιακή διπλωματική εργασία έχουμε σκοπό να μελετήσουμε τη
θεωρία των γράφων δηλαδή τους τύπους γράφων, τον τρόπο που αποτυπώνονται, που
εφαρμόζονται και τα προβλήματα κατά την εφαρμογή τους. Επίσης να εξετάσουμε στη
μηχανική μάθηση τις μορφές της, τα μοντέλα της, που εφαρμόζεται και τους
περιορισμούς της. Μετά να προχωρήσουμε σε ένα πρακτικό πείραμα. Για το πείραμα
μας μεθοδολογία μας ήταν να πάρουμε το σύνολο δεδομένων MovieLens 100K, το
εξερευνήσαμε βγάζοντας χρήσιμα συμπεράσματα ανάλυσης δεδομένων σε γράφημα,
το φέραμε στην κατάλληλη μορφή ετερογενή μη-κατευθυνόμενου γράφου τον οποίο
τελικά χρησιμοποιήσαμε για να εκπαιδεύσουμε ένα σύστημα συστάσεων αλγορίθμου
τύπου γράφου νευρωνικού δικτύου. Τελικά κάναμε δύο πειράματα αλλάζοντας τα
κριτήρια εκπαίδευσης και μετρήσαμε την απόδοση του αλγορίθμου σε κάθε περίπτωση
με τις μετρικές της απώλειας δυαδικής διασταυρούμενης εντροπίας με logits (loss) και
της περιοχής κάτω από τη καμπύλη ROC (AUC) τις οποίες οπτικοποιήσαμε σε
γραφήματα για την κάθε περίπτωση ώστε να δούμε ευκολότερα τα αποτελέσματα.
Τελικά συμπεράναμε και στις δύο περιπτώσεις πως το σύστημα μας απέδωσε
“εξαιρετικά”.