Deep reinforcement learning method in centralized multi-agent air traffic control

Παπαδόπουλος, Γεώργιος; Papadopoulos, Georgios

dc.contributor.advisor	Βούρος, Γεώργιος
dc.contributor.advisor	Vouros, George
dc.contributor.author	Παπαδόπουλος, Γεώργιος
dc.contributor.author	Papadopoulos, Georgios
dc.date.accessioned	2022-05-20T10:33:17Z
dc.date.available	2022-05-20T10:33:17Z
dc.date.issued	2022-04
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/14367
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/1790
dc.description	Not available until 01/06/2023	en
dc.description.abstract	Ο στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας Κυκλοφορίας. Αντιπροσωπεύοντας κάθε πτήση ως πράκτορα, στοχεύουμε στη διατήρηση ένός ελάχιστου διαχωρισμού μεταξύ των πτήσεων παρέχοντας ενέργειες επίλυσης, όπως πλευρικούς ελιγμούς, αλλαγές ταχύτητας και αλλαγές επιπέδου πτήσης. Με αυτόν τον τρόπο, μπορούμε να συμβάλουμε στο εξαιρετικά πολύπλοκο έργο των ανθρώπων-Ελεγκτών Εναέριας Κυκλοφορίας, επιλύοντας πιθανές συγκρούσεις μεταξύ ζευγών πτήσεων. Το πρόβλημα διατυπώνεται ως μια Αποκεντρωμένη Μερικώς Παρατηρήσιμη Μαρκοβιανή Διαδικασία Απόφασης, η οποία επιτρέπει την εκμετάλλευση του μοντέλου που βασίζεται στο μηχανισμό προσοχής εφαρμοσμένο σε γράφους, που ονομάζεται DGN και παρουσιάζεται στο [1], αφού το επεκτείναμε και το βελτιώσαμε κατάλληλα με τη χρήση ακμών του γ΄ραφου. Με βάση το [2], παρουσιάζονται δύο διαφορετικές εκδόσεις, που διερευνούν τόσο στατικές όσο και δυναμικές ακμές. Τα πειράματα που παρέχονται υποδηλώνουν ότι το τελευταίο αποφέρει τα αξιοσημείωτα αποτελέσματα της επίλυσης του 90% των πραγματικών σεναρίων που χρησιμοποιήθηκαν αποκλειστικά στην αποτίμηση και που σχετίζονται με πτήσεις που εκτελούνται στον ισπανικό εναέριο χώρο.	el
dc.format.extent	115	el
dc.language.iso	en	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.title	Deep reinforcement learning method in centralized multi-agent air traffic control	el
dc.title.alternative	Βαθιά ενισχυτική μάθηση για τον κεντρικό πολυπρακτορικό έλεγχο εναέριας κυκλοφορίας	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	The objective of this thesis is to design multi-agent Deep Reinforcement Learning methods and explore their effectiveness in optimizing and automating the Air Traffic Control task. Representing each flight as an agent, we aim to maintain a minimum separation among the flights by providing resolution actions, such as lateral manoeuvres, speed changes and flight level changes. In this way, we can contribute to the highly complex work of the human Air Traffic Controllers, by resolving potential conflicts between pairs of flights. The problem is formulated as a Decentralized Partially Observable Markov Decision Process, which enables the exploitation of the graph-attention-based model, called DGN, presented in [1], after we have extended and enhanced it appropriately with the use of graph edges. Relying on [2], two different versions are presented, investigating both static and dynamic edges. The experiments provided suggest that the latter yields the notable results of resolving 90% of the testing real-world scenarios relating to flights operating in Spanish airspace.	el
dc.corporate.name	Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»	el
dc.contributor.master	Τεχνητή Νοημοσύνη - Artificial Intelligence	el
dc.subject.keyword	Deep reinforcement learning	el
dc.subject.keyword	Multi agent reinforcement learning	el
dc.subject.keyword	Multi-head attention	el
dc.subject.keyword	Graph-based method	el
dc.subject.keyword	Air traffic control	el
dc.date.defense	2022-04-08

Αρχεία σε αυτό το τεκμήριο

Αρχεία	Μέγεθος	Τύπος	Προβολή
Δεν υπάρχουν αρχεία που να σχετίζονται με αυτό το τεκμήριο.

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής