Show simple item record

Deep reinforcement learning method in centralized multi-agent air traffic control

dc.contributor.advisorΒούρος, Γεώργιος
dc.contributor.advisorVouros, George
dc.contributor.authorΠαπαδόπουλος, Γεώργιος
dc.contributor.authorPapadopoulos, Georgios
dc.date.accessioned2022-05-20T10:33:17Z
dc.date.available2022-05-20T10:33:17Z
dc.date.issued2022-04
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/14367
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1790
dc.descriptionNot available until 01/06/2023en
dc.description.abstractΟ στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας Κυκλοφορίας. Αντιπροσωπεύοντας κάθε πτήση ως πράκτορα, στοχεύουμε στη διατήρηση ένός ελάχιστου διαχωρισμού μεταξύ των πτήσεων παρέχοντας ενέργειες επίλυσης, όπως πλευρικούς ελιγμούς, αλλαγές ταχύτητας και αλλαγές επιπέδου πτήσης. Με αυτόν τον τρόπο, μπορούμε να συμβάλουμε στο εξαιρετικά πολύπλοκο έργο των ανθρώπων-Ελεγκτών Εναέριας Κυκλοφορίας, επιλύοντας πιθανές συγκρούσεις μεταξύ ζευγών πτήσεων. Το πρόβλημα διατυπώνεται ως μια Αποκεντρωμένη Μερικώς Παρατηρήσιμη Μαρκοβιανή Διαδικασία Απόφασης, η οποία επιτρέπει την εκμετάλλευση του μοντέλου που βασίζεται στο μηχανισμό προσοχής εφαρμοσμένο σε γράφους, που ονομάζεται DGN και παρουσιάζεται στο [1], αφού το επεκτείναμε και το βελτιώσαμε κατάλληλα με τη χρήση ακμών του γ΄ραφου. Με βάση το [2], παρουσιάζονται δύο διαφορετικές εκδόσεις, που διερευνούν τόσο στατικές όσο και δυναμικές ακμές. Τα πειράματα που παρέχονται υποδηλώνουν ότι το τελευταίο αποφέρει τα αξιοσημείωτα αποτελέσματα της επίλυσης του 90% των πραγματικών σεναρίων που χρησιμοποιήθηκαν αποκλειστικά στην αποτίμηση και που σχετίζονται με πτήσεις που εκτελούνται στον ισπανικό εναέριο χώρο.el
dc.format.extent115el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.titleDeep reinforcement learning method in centralized multi-agent air traffic controlel
dc.title.alternativeΒαθιά ενισχυτική μάθηση για τον κεντρικό πολυπρακτορικό έλεγχο εναέριας κυκλοφορίαςel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENThe objective of this thesis is to design multi-agent Deep Reinforcement Learning methods and explore their effectiveness in optimizing and automating the Air Traffic Control task. Representing each flight as an agent, we aim to maintain a minimum separation among the flights by providing resolution actions, such as lateral manoeuvres, speed changes and flight level changes. In this way, we can contribute to the highly complex work of the human Air Traffic Controllers, by resolving potential conflicts between pairs of flights. The problem is formulated as a Decentralized Partially Observable Markov Decision Process, which enables the exploitation of the graph-attention-based model, called DGN, presented in [1], after we have extended and enhanced it appropriately with the use of graph edges. Relying on [2], two different versions are presented, investigating both static and dynamic edges. The experiments provided suggest that the latter yields the notable results of resolving 90% of the testing real-world scenarios relating to flights operating in Spanish airspace.el
dc.corporate.nameΕθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»el
dc.contributor.masterΤεχνητή Νοημοσύνη - Artificial Intelligenceel
dc.subject.keywordDeep reinforcement learningel
dc.subject.keywordMulti agent reinforcement learningel
dc.subject.keywordMulti-head attentionel
dc.subject.keywordGraph-based methodel
dc.subject.keywordAir traffic controlel
dc.date.defense2022-04-08


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record


Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»