dc.contributor.advisor | Pelekis, Nikolaos | |
dc.contributor.advisor | Πελέκης, Νικόλαος | |
dc.contributor.author | Karatrantou, Afroditi | |
dc.contributor.author | Καρατράντου, Αφροδίτη | |
dc.date.accessioned | 2024-12-17T11:17:57Z | |
dc.date.available | 2024-12-17T11:17:57Z | |
dc.date.issued | 2024-11 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17262 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/4685 | |
dc.description.abstract | Η ακριβής πρόβλεψη του Εκτιμώμενου Χρόνου Άφιξης (ETA) είναι απαραίτητη για τη βελτιστοποίηση των αστικών συστημάτων μετακίνησης και την βελτίωση της εμπειρίας των χρηστών. Αυτή η διατριβή εξετάζει προηγμένες τεχνικές μηχανικής μάθησης, όπως τα Νευρωνικά Δίκτυα (NN), Random Forest (RF), το XGBoost, τα δίκτυα Long Short-Term Memory (LSTM) και τα Graph Convolutional Networks (GCNs), για την πρόβλεψη της άφιξης μέσων μεταφοράς χρησιμοποιώντας δεδομένα GPS σε πραγματικό χρόνο. Αναπτύχθηκε ένας ολοκληρωμένος αλγόριθμος προεπεξεργασίας δεδομένων για την αντιμετώπιση των σφαλμάτων στα δεδομένα μετακίνησης, περιλαμβάνοντας βήματα όπως η κανονικοποίηση, η συμπλήρωση ελλιπών τιμών και η k-fold Cross Validation. Τα αποτελέσματα δείχνουν ότι το μοντέλο Random Forest, ιδιαίτερα όταν βελτιστοποιείται με τη χρήση PSO, προσφέρει ανώτερη ακρίβεια όσον αφορά το Μέσο Τετραγωνικό Σφάλμα (MSE) και το Μέσο Απόλυτο Σφάλμα (MAE), εξισορροπώντας την ακρίβεια πρόβλεψης με την υπολογιστική αποδοτικότητα. Το LSTM έχει επίσης υποσχόμενα αποτελέσματα. Εν αντιθέσει τα GCNs και XGBOOST δεν παρήγαγαν τόσο καλά αποτελέσματα με χαμηλότερη ακρίβεια, παρά του ότι το μοντέλο XGBOOST ήταν υπολογιστικά αποδοτικό. Το απλό μοντέλο είχε καλή απόδοση παρά την απλότητα του, με τον υψηλό αριθμό νευρώνων να συμβάλλουν στην αποτελεσματικότητα του. Πραγματοποιήθηκε ανάλυση SHAP (SHapley Additive exPlanations) για τον εντοπισμό των βασικών χαρακτηριστικών που επηρεάζουν τις προβλέψεις ETA. Τα χρονικά χαρακτηριστικά όπως Unix ώρα είναι τα πιο ισχυρά. Αυτή η διατριβή συμβάλει παρέχοντας μία ευέλικτη και εύκολη στην κατανόηση μέθοδο για την πρόβλεψη ΕΤΑ σε αστικά μέσα μεταφοράς. Μελλοντική εργασία θα μπορούσε να περιλαμβάνει την αύξηση του συνόλου δεδομένων, και την ενσωμάτωση επιπρόσθετων χαρακτηριστικών, όπως τα επίπεδα κυκλοφοριακής συμφόρησης και οι καιρικές συνθήκες, για τη βελτίωση της απόδοσης του μοντέλου. | el |
dc.format.extent | 51 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Traffic prediction on road networks | el |
dc.title.alternative | Πρόβλεψη κυκλοφορίας σε οδικά δίκτυα | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | Accurate Estimated Time of Arrival (ETA) prediction is essential for optimizing urban transit systems and enhancing user experience. This thesis examines advanced machine learning techniques, including Neural Network (NN), Random Forest (RF), XGBoost, Long Short-Term Memory (LSTM) networks, and Graph Convolutional Networks (GCNs), for predicting ETAs of urban transit vehicles using real-time GPS data. A comprehensive data preprocessing pipeline was developed to handle noise and inconsistencies in transit data, involving steps like normalization, imputation of missing values, and k-fold Cross Validation. The results show that the Random Forest model, especially when optimized with k-fold Cross Validation, provides superior accuracy in terms of Mean Squared Error (MSE) and Mean Absolute Error (MAE), balancing prediction accuracy with computational efficiency. The LSTM model also produced promising results, effectively capturing temporal dependencies. In contrast, both GCNs and XGBoost models, produced poorer results with significantly lower accuracy, despite XGBoost being computationally efficient. The Simple Model (NN) performed well despite its simplicity, with the high number of neurons contributing to its strong predictive accuracy. Additionally, a SHAP (SHapley Additive exPlanations) analysis was performed to highlight the most important features influencing ETA predictions. Temporal features such as the unix time are the most influential. This thesis contributes to the field by providing an easy-to-understand method for predicting ETAs in urban transit. Future work could involve expanding the dataset and integrating additional features like traffic congestion and weather conditions to enhance model performance. | el |
dc.contributor.master | Κυβερνοασφάλεια και Επιστήμη Δεδομένων | el |
dc.subject.keyword | Python | el |
dc.subject.keyword | Urban transit systems | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Estimated Time of Arrival (ETA) | el |
dc.subject.keyword | Random Forest (RF) | el |
dc.date.defense | 2024-11-27 | |