Temporal graph neural networks for migration flow prediction in Europe
Χρονικά γράφο-νευρωνικά δίκτυα για την πρόβλεψη μεταναστευτικών ροών στην Ευρώπη

Master Thesis
Συγγραφέας
Christatos, Konstantinos
Χρηστάτος, Κωνσταντίνος
Ημερομηνία
2026-05Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Χρονικά γράφο-νευρωνικά δίκτυα ; Πρόβλεψη μεταναστευτικών ροών ; Μηχανική μάθηση σε γράφους ; Ανάλυση κοινοτήτωνΠερίληψη
Η παρούσα μεταπτυχιακή διατριβή εξετάζει κατά πόσο η μακροπρόθεσμη δομή των διεθνών μεταναστευτικών δικτύων μπορεί να προβλεφθεί με τη χρήση μεθόδων μηχανικής μάθησης βασισμένων σε γράφους. Βασιζόμενη σε μια προηγούμενη περιγραφική μελέτη μεταναστευτικών δικτύων, η διατριβή αναδιατυπώνει το πρόβλημα ως μια διαδικασία άμεσης πρόβλεψης δυαδικής γειτνίασης ενός βήματος, όπου ο πίνακας γειτνίασης μετανάστευσης για το έτος t+1 προβλέπεται από την προηγούμενη δομή του δικτύου. Για την επίτευξη αυτού του στόχου, αραιές μεταναστευτικές παρατηρήσεις μετασχηματίστηκαν σε μια συνεχή ετήσια αλληλουχία γράφων που καλύπτει την περίοδο 1990-2024, και κατασκευάστηκαν ετήσιοι σταθμισμένοι καθώς και δυαδικοί πίνακες γειτνίασης. Το πλαίσιο πρόβλεψης υλοποιήθηκε ως μια αναπαραγώγιμη ροή εργασίας (pipeline) σε Python, η οποία ενσωματώνει την προεπεξεργασία, την κατασκευή των γράφων, τη συγκριτική αξιολόγηση των μοντέλων και τη δομική ανάλυση.
Στο πλαίσιο αυτό, η πρόβλεψη των μεταναστευτικών ροών προσεγγίζεται ως πρόβλεψη της συνδεσιμότητας των ροών μετανάστευσης (ύπαρξη ή όχι δεσμού) και όχι ως πρόβλεψη του ακριβούς μεγέθους της σταθμισμένης ροής. Οι σταθμισμένοι πίνακες παραμένουν σημαντικοί για την κατασκευή των γράφων και τη δομική ερμηνεία, ενώ η παλινδρόμηση για την εύρεση των ακριβών σταθμισμένων ροών αντιμετωπίζεται ως το φυσικό επόμενο βήμα μοντελοποίησης.
Η μελέτη συγκρίνει δύο ιστορικά μοντέλα βάσης (baselines), το Persistence και το RollingAverage, έναντι τριών εκπαιδευμένων μοντέλων βασισμένων σε γράφους: ενός Συνελικτικού Δικτύου Γράφων (GCN), ενός Δικτύου Προσοχής Γράφων (GAT) και ενός χρονικού μοντέλου γράφων. Η αξιολόγηση πραγματοποιήθηκε με χρονολογικό διαχωρισμό των δεδομένων σε σύνολα εκπαίδευσης, επικύρωσης και δοκιμής, χρησιμοποιώντας τις μετρικές PR-AUC, ROC-AUC, F1-score, precision και recall. Το κύριο αποτέλεσμα δείχνει ότι το μοντέλο βάσης RollingAverage πέτυχε την ισχυρότερη συνολική προγνωστική απόδοση, ακολουθούμενο στενά από το μοντέλο Persistence, ενώ τα εκπαιδευμένα νευρωνικά μοντέλα γράφων δεν κατάφεραν να ξεπεράσουν σταθερά τα μοντέλα βάσης. Μεταξύ των προσεγγίσεων μηχανικής μάθησης, το GCN πέτυχε την καλύτερη συνολική απόδοση, ενώ το GAT συνεισέφερε ένα επίπεδο ερμηνευτικότητας μέσω της ανάλυσης των συντελεστών προσοχής, παρά τα ασθενέστερα προγνωστικά του αποτελέσματα.
Επιπλέον της πρόβλεψης, η διατριβή εξετάζει τη δομική εξέλιξη των μεταναστευτικών δικτύων μέσω χαρτών κοινοτήτων, μετρικών μετάβασης και κατανομών κεντρικότητας. Τα αποτελέσματα αυτά δείχνουν ότι το μεταναστευτικό δίκτυο συνδυάζει τη συνέχεια με τη δομική αναδιοργάνωση, με την ισχυρότερη δομική αλλαγή (structural break) να εμφανίζεται μεταξύ των ετών 2020 και 2024. Συνολικά, η διατριβή συνεισφέρει ένα συγκριτικό και αναπαραγώγιμο πλαίσιο για την πρόβλεψη μεταναστευτικών δικτύων και αποδεικνύει ότι, υπό την παρούσα διατύπωση και σχεδιασμό αξιολόγησης, η πρόσφατη ιστορική συνέχεια παραμένει πιο προγνωστική από τις δοκιμασμένες νευρωνικές προσεγγίσεις γράφων.

