Κατηγοριοποίηση χρηστών κοινωνικών δικτύων θέσης βάσει χωρο-κειμενικών αποτυπωμάτων
Classification of users of location-based social networks based on spatio-textual footprints
![Thumbnail](/xmlui/bitstream/handle/unipi/14873/Kolasi_AM19020.pdf.jpg?sequence=4&isAllowed=y)
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Χωροχρονικά δεδομένα ; Κοινωνικά δίκτυα ; Κατηγοριοποίηση χρηστών ; Τροχιές ; Εξόρυξη τροχιώνΠερίληψη
Με την εξέλιξη της τεχνολογίας και την ολοένα και την καθημερινή χρήση συσκευών με πρόσβαση στο διαδίκτυο, δημιουργείται ένας μεγάλος όγκος χωροχρονικών δεδομένων. Αυτό το είδος δεδομένων έχουν απασχολήσει ιδιαίτερα την επιστημονική κοινότητα τα τελευταία χρόνια. Τα δεδομένα κίνησης καταγράφουν την θέση ενός κινούμενου αντικειμένου κάθε χρονική στιγμή και αποτελούν αντικείμενο μελέτης της συμπεριφοράς όχι μόνο των ζώων και ανθρώπων αλλά και επίλυσης προβλημάτων όπως είναι η πρόβλεψη τροχιάς ενός ανεμοστρόβιλου και η επίλυση κυκλοφοριακών προβλημάτων.
Στην παρούσα εργασία επιχειρείται η ταξινόμηση χρηστών Twitter μέσα από τις τροχιές που δημιουργούν, κάνοντας χρήση αλγορίθμων Μηχανικής Μάθησης. Η προεπεξεργασία των δεδομένων βασίστηκε στην μέθοδο MasterMovelets (Ferrero et al., 2020) που ανακαλύπτει σχετικές υποτροχιές με διαφορετικές και ετερογενείς διαστάσεις και ποικίλου μήκους. Το αποτέλεσμα της μεθόδου είναι ένα σύνολο δεδομένων το οποίο χρησιμοποιείται στη συνέχεια ως δεδομένα εισόδου για τους αλγορίθμους ταξινόμησης. Τα δεδομένα που χρησιμοποιήθηκαν προέρχονται από tweets που πραγματοποιήθηκαν στην Σαντορίνη την περίοδο 2018-2019. Η ανάλυση έδειξε ότι ίσως η μέθοδος MasterMovelets να μην ταιριάζει στα δεδομένα μας καθώς οι ταξινομητές έδιναν χειρότερα αποτελέσματα από αυτά της εργασίας των Ferrero et al (2020). Στη συνέχεια επιχειρήθηκε η ταξινόμηση των χρηστών χωρίς να προηγηθεί κάποια περίπλοκη προεπεξεργασία η οποία όμως δεν έχει στόχο την σύγκριση με την μέθοδο MasterMovelets καθώς στην βάση τους διαφέρουν, η μία πραγματοποιεί εξόρυξη τροχιών πάνω στις οποίες γίνεται στη συνέχεια κατηγοριοποίηση ενώ η άλλη περνάει αμέσως στην κατηγοριοποίηση των σημείων.