Συσταδοποίηση δεδομένων κίνησης με αλγορίθμους διανυσματικών δεδομένων
Trajectory data clustering with vector – based algorithms

View/ Open
Keywords
Δεδομένα κίνησης ; Συσταδοποίηση τροχιών ; Διανυσματοποίηση ; Clustering ; VectorizationAbstract
Η ραγδαία ανάπτυξη των τεχνολογιών εντοπισμού, όπως τα συστήματα GPS και οι αισθητήρες IoT, έχει οδηγήσει στη συστηματική συλλογή μεγάλου όγκου χωροχρονικών δεδομένων που αποτυπώνουν τις τροχιές κινητών αντικειμένων. Τα δεδομένα αυτά προσφέρουν σημαντικές δυνατότητες για την κατανόηση χωρικών και χρονικών μοτίβων, τη βελτιστοποίηση μεταφορικών συστημάτων και τη λήψη αποφάσεων βασισμένων σε πραγματικά δεδομένα. Ωστόσο, η μη διανυσματική φύση των τροχιών καθιστούν δύσκολη την άμεση εφαρμογή αλγορίθμων μηχανικής μάθησης. Για τον σκοπό αυτό, καθίσταται απαραίτητη η διανυσματοποίηση των τροχιών, δηλαδή ο μετασχηματισμός τους σε κατάλληλη διανυσματική μορφή. Η διαδικασία αυτή επιτρέπει την αξιοποίηση αλγορίθμων συσταδοποίησης, οι οποίοι επιδιώκουν την ομαδοποίηση παρόμοιων δεδομένων με στόχο την αναγνώριση προτύπων, ανωμαλιών ή περιοχών αυξημένης δραστηριότητας. Υπάρχει πληθώρα μεθόδων συσταδοποίησης, από απλές στατιστικές έως και πιο σύνθετες προσεγγίσεις βασισμένες σε νευρωνικά δίκτυα. Η παρούσα εργασία εστιάζει στη μελέτη της διανυσματοποίησης δεδομένων κίνησης και στη διερεύνηση της επίδρασής της στην αποτελεσματικότητα της συσταδοποίησης. Πραγματοποιείται πειραματική αξιολόγηση τριών αλγορίθμων συσταδοποίησης σε τρία διαφορετικά σύνολα δεδομένων, με χρήση της γλώσσας Python και βιβλιοθηκών όπως οι Pandas, NumPy και Scikit-learn. Τέλος, παρουσιάζονται τα αποτελέσματα, οι προκλήσεις και τα πλεονεκτήματα κάθε προσέγγισης, καθώς και προτάσεις για βέλτιστες πρακτικές στην ανάλυση διανυσματικοποιημένων τροχιών.


