dc.contributor.advisor | Βούρος, Γεώργιος | |
dc.contributor.advisor | Vouros, George | |
dc.contributor.author | Παπαδόπουλος, Γεώργιος | |
dc.contributor.author | Papadopoulos, Georgios | |
dc.date.accessioned | 2022-05-20T10:33:17Z | |
dc.date.available | 2022-05-20T10:33:17Z | |
dc.date.issued | 2022-04 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/14367 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/1790 | |
dc.description | Not available until 01/06/2023 | en |
dc.description.abstract | Ο στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας Κυκλοφορίας. Αντιπροσωπεύοντας κάθε πτήση ως πράκτορα, στοχεύουμε στη διατήρηση ένός ελάχιστου διαχωρισμού μεταξύ των πτήσεων παρέχοντας ενέργειες επίλυσης, όπως πλευρικούς ελιγμούς, αλλαγές ταχύτητας και αλλαγές επιπέδου πτήσης. Με αυτόν τον τρόπο, μπορούμε να συμβάλουμε στο εξαιρετικά πολύπλοκο έργο των ανθρώπων-Ελεγκτών Εναέριας Κυκλοφορίας, επιλύοντας πιθανές συγκρούσεις μεταξύ ζευγών πτήσεων. Το πρόβλημα διατυπώνεται ως μια Αποκεντρωμένη Μερικώς Παρατηρήσιμη Μαρκοβιανή Διαδικασία Απόφασης, η οποία επιτρέπει την εκμετάλλευση του μοντέλου που βασίζεται στο μηχανισμό προσοχής εφαρμοσμένο σε γράφους, που ονομάζεται DGN και παρουσιάζεται στο [1], αφού το επεκτείναμε και το βελτιώσαμε κατάλληλα με τη χρήση ακμών του γ΄ραφου. Με βάση το [2], παρουσιάζονται δύο διαφορετικές εκδόσεις, που διερευνούν τόσο στατικές όσο και δυναμικές ακμές. Τα πειράματα που παρέχονται υποδηλώνουν ότι το τελευταίο αποφέρει τα αξιοσημείωτα αποτελέσματα της επίλυσης του 90% των πραγματικών σεναρίων που χρησιμοποιήθηκαν αποκλειστικά στην αποτίμηση και που σχετίζονται με πτήσεις που εκτελούνται στον ισπανικό εναέριο χώρο. | el |
dc.format.extent | 115 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Deep reinforcement learning method in centralized multi-agent air traffic control | el |
dc.title.alternative | Βαθιά ενισχυτική μάθηση για τον κεντρικό πολυπρακτορικό έλεγχο εναέριας κυκλοφορίας | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | The objective of this thesis is to design multi-agent Deep Reinforcement Learning methods and explore their effectiveness in optimizing and automating the Air Traffic Control task. Representing each flight as an agent, we aim to maintain a minimum separation among the flights by providing resolution actions, such as lateral manoeuvres, speed changes and flight level changes. In this way, we can contribute to the highly complex work of the human Air Traffic Controllers, by resolving potential conflicts between pairs of flights. The problem is formulated as a Decentralized Partially Observable Markov Decision Process, which enables the exploitation of the graph-attention-based model, called DGN, presented in [1], after we have extended and enhanced it appropriately with the use of graph edges. Relying on [2], two different versions are presented, investigating both static and dynamic edges. The experiments provided suggest that the latter yields the notable results of resolving 90% of the testing real-world scenarios relating to flights operating in Spanish airspace. | el |
dc.corporate.name | Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος» | el |
dc.contributor.master | Τεχνητή Νοημοσύνη - Artificial Intelligence | el |
dc.subject.keyword | Deep reinforcement learning | el |
dc.subject.keyword | Multi agent reinforcement learning | el |
dc.subject.keyword | Multi-head attention | el |
dc.subject.keyword | Graph-based method | el |
dc.subject.keyword | Air traffic control | el |
dc.date.defense | 2022-04-08 | |