Traffic prediction on road networks
Πρόβλεψη κυκλοφορίας σε οδικά δίκτυα
Master Thesis
Συγγραφέας
Karatrantou, Afroditi
Καρατράντου, Αφροδίτη
Ημερομηνία
2024-11Επιβλέπων
Pelekis, NikolaosΠελέκης, Νικόλαος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Python ; Urban transit systems ; Machine learning ; Estimated Time of Arrival (ETA) ; Random Forest (RF)Περίληψη
Η ακριβής πρόβλεψη του Εκτιμώμενου Χρόνου Άφιξης (ETA) είναι απαραίτητη για τη βελτιστοποίηση των αστικών συστημάτων μετακίνησης και την βελτίωση της εμπειρίας των χρηστών. Αυτή η διατριβή εξετάζει προηγμένες τεχνικές μηχανικής μάθησης, όπως τα Νευρωνικά Δίκτυα (NN), Random Forest (RF), το XGBoost, τα δίκτυα Long Short-Term Memory (LSTM) και τα Graph Convolutional Networks (GCNs), για την πρόβλεψη της άφιξης μέσων μεταφοράς χρησιμοποιώντας δεδομένα GPS σε πραγματικό χρόνο. Αναπτύχθηκε ένας ολοκληρωμένος αλγόριθμος προεπεξεργασίας δεδομένων για την αντιμετώπιση των σφαλμάτων στα δεδομένα μετακίνησης, περιλαμβάνοντας βήματα όπως η κανονικοποίηση, η συμπλήρωση ελλιπών τιμών και η k-fold Cross Validation. Τα αποτελέσματα δείχνουν ότι το μοντέλο Random Forest, ιδιαίτερα όταν βελτιστοποιείται με τη χρήση PSO, προσφέρει ανώτερη ακρίβεια όσον αφορά το Μέσο Τετραγωνικό Σφάλμα (MSE) και το Μέσο Απόλυτο Σφάλμα (MAE), εξισορροπώντας την ακρίβεια πρόβλεψης με την υπολογιστική αποδοτικότητα. Το LSTM έχει επίσης υποσχόμενα αποτελέσματα. Εν αντιθέσει τα GCNs και XGBOOST δεν παρήγαγαν τόσο καλά αποτελέσματα με χαμηλότερη ακρίβεια, παρά του ότι το μοντέλο XGBOOST ήταν υπολογιστικά αποδοτικό. Το απλό μοντέλο είχε καλή απόδοση παρά την απλότητα του, με τον υψηλό αριθμό νευρώνων να συμβάλλουν στην αποτελεσματικότητα του. Πραγματοποιήθηκε ανάλυση SHAP (SHapley Additive exPlanations) για τον εντοπισμό των βασικών χαρακτηριστικών που επηρεάζουν τις προβλέψεις ETA. Τα χρονικά χαρακτηριστικά όπως Unix ώρα είναι τα πιο ισχυρά. Αυτή η διατριβή συμβάλει παρέχοντας μία ευέλικτη και εύκολη στην κατανόηση μέθοδο για την πρόβλεψη ΕΤΑ σε αστικά μέσα μεταφοράς. Μελλοντική εργασία θα μπορούσε να περιλαμβάνει την αύξηση του συνόλου δεδομένων, και την ενσωμάτωση επιπρόσθετων χαρακτηριστικών, όπως τα επίπεδα κυκλοφοριακής συμφόρησης και οι καιρικές συνθήκες, για τη βελτίωση της απόδοσης του μοντέλου.