Browsing by Advisor "Vouros, George"
Now showing items 1-10 of 10
-
Deep reinforcement learning method in centralized multi-agent air traffic control
(Πανεπιστήμιο Πειραιώς, 2022-04)Ο στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας ... -
Detecting modes of behavior in marine trajectories using imitation learning
(Πανεπιστήμιο Πειραιώς, 2022-12) -
Explainable reinforcement learning using interpretable models
(Πανεπιστήμιο Πειραιώς, 2024-02)Οι μέθοδοι Βαθιάς Ενισχυτικής Μάθησης έχουν επιτύχει υψηλές επιδόσεις στον τομέα της Τεχνητής Νοημοσύνης σε διάφορους τομείς όπως τα βιντεοπαιχνίδια και την αυτόνομη οδήγηση. Αυτές οι μέθοδοι ενσωματώνουν τις δυνατότητες ... -
Hidden variables’ estimation of trajectories' states using imitation learning
(Πανεπιστήμιο Πειραιώς, 2024-02)Η πρόβλεψη της τροχιάς είναι ένα κρίσιμο πρόβλημα με βαθιές επιπτώσεις σε διάφορους τομείς, από τα αυτόνομα οχήματα και τη ρομποτική μέχρι την αεροδιαστημική και τη θαλάσσια ναυσιπλοΐα. Σε αυτή τη διπλωματική εργασία θα ... -
Inherently interpretable Q-Learning
(Πανεπιστήμιο Πειραιώς, 2022-06) -
Machine learning methods for planning conflict-free trajectories
(Πανεπιστήμιο Πειραιώς, 2024)Οι ασφαλείς και αποτελεσματικές μεταφορές, όσον αφορά το κόστος, το χρόνο και την απόσταση που καλύπτεται, στον τομέα των αερομεταφορών παρέχονται μέσω του συστήματος διαχείρισης εναέριας κυκλοφορίας, το οποίο περιλαμβάνει ... -
Predicting trajectories with Directed-Info GAIL
(Πανεπιστήμιο Πειραιώς, 2021-06-23)Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ... -
Predicting trajectories’ parameters using graph convolutional neural networks
(Πανεπιστήμιο Πειραιώς, 2023-09)Η πρόσφατη ανάπτυξη της αεροπορικής βιομηχανίας έχει αυξήσει το ενδιαφέρον στον τομέα της διαχείρισης εναέριας κυκλοφορίας. Ένα σύγχρονο - ανοιχτό - πρόβλημα στον τομέα αυτό είναι η πρόβλεψη κρυφών παραμέτρων που αφορούν ... -
Prediction of human behaviour using imitation learning
(Πανεπιστήμιο Πειραιώς, 2022-09-15)Στην παρούσα εργασία μελετάται η χρήση ενός αλγορίθμου μιμητικής μάθησης ώστε να μοντελοποιηθεί η ανθρώπινη συμπεριφορά για την επίτευξη μιας εργασίας με διαφοροποιημένους στόχους. Στόχος είναι να εξεταστεί η ικανότητα ... -
Solving long-horizon tasks via imitation and reinforcement learning
(Πανεπιστήμιο Πειραιώς, 2024-02)Αυτή η διπλωματική διερευνά τη χρήση του αλγορίθμου Relay Policy Learning (RPL) που προτείνεται από τους Gupta et al. [1], με στόχο την μοντελοποίηση της πρόβλεψης τροχιών αεροσκαφών, σε ένα αεροπορικό περιβάλλον. Ο ...