Πλοήγηση ανά Επιβλέποντα "Vouros, George"

Αποτελέσματα 1-9 από 9

Deep reinforcement learning method in centralized multi-agent air traffic control

Παπαδόπουλος, Γεώργιος; Papadopoulos, Georgios (Πανεπιστήμιο Πειραιώς, 2022-04)

Ο στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας ...
Detecting modes of behavior in marine trajectories using imitation learning

Ταπτά, Ελένη; Tapta, Eleni (Πανεπιστήμιο Πειραιώς, 2022-12)
Explainable reinforcement learning using interpretable models

Lykos, Emmanouil; Λύκος, Εμμανουήλ (Πανεπιστήμιο Πειραιώς, 2024-02)

Οι μέθοδοι Βαθιάς Ενισχυτικής Μάθησης έχουν επιτύχει υψηλές επιδόσεις στον τομέα της Τεχνητής Νοημοσύνης σε διάφορους τομείς όπως τα βιντεοπαιχνίδια και την αυτόνομη οδήγηση. Αυτές οι μέθοδοι ενσωματώνουν τις δυνατότητες ...
Hidden variables’ estimation of trajectories' states using imitation learning

Patiniotis Spyropoulos, Dimitrios; Πατηνιώτης Σπυρόπουλος, Δημήτριος (Πανεπιστήμιο Πειραιώς, 2024-02)

Η πρόβλεψη της τροχιάς είναι ένα κρίσιμο πρόβλημα με βαθιές επιπτώσεις σε διάφορους τομείς, από τα αυτόνομα οχήματα και τη ρομποτική μέχρι την αεροδιαστημική και τη θαλάσσια ναυσιπλοΐα. Σε αυτή τη διπλωματική εργασία θα ...
Inherently interpretable Q-Learning

Koumentis, Ioannis; Κουμέντης, Ιωάννης (Πανεπιστήμιο Πειραιώς, 2022-06)
Predicting trajectories with Directed-Info GAIL

Τσεβρένης, Αλέξανδρος; Tsevrenis, Alexander (Πανεπιστήμιο Πειραιώς, 2021-06-23)

Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ...
Predicting trajectories’ parameters using graph convolutional neural networks

Ιωαννίδης, Ιωάννης; Ioannidis, Ioannis (Πανεπιστήμιο Πειραιώς, 2023-09)

Η πρόσφατη ανάπτυξη της αεροπορικής βιομηχανίας έχει αυξήσει το ενδιαφέρον στον τομέα της διαχείρισης εναέριας κυκλοφορίας. Ένα σύγχρονο - ανοιχτό - πρόβλημα στον τομέα αυτό είναι η πρόβλεψη κρυφών παραμέτρων που αφορούν ...
Prediction of human behaviour using imitation learning

Zidianakis, Matthaios; Ζηδιανάκης, Ματθαίος (Πανεπιστήμιο Πειραιώς, 2022-09-15)

Στην παρούσα εργασία μελετάται η χρήση ενός αλγορίθμου μιμητικής μάθησης ώστε να μοντελοποιηθεί η ανθρώπινη συμπεριφορά για την επίτευξη μιας εργασίας με διαφοροποιημένους στόχους. Στόχος είναι να εξεταστεί η ικανότητα ...
Solving long-horizon tasks via imitation and reinforcement learning

Lappa, Athanasia; Λάππα, Αθανασία (Πανεπιστήμιο Πειραιώς, 2024-02)

Αυτή η διπλωματική διερευνά τη χρήση του αλγορίθμου Relay Policy Learning (RPL) που προτείνεται από τους Gupta et al. [1], με στόχο την μοντελοποίηση της πρόβλεψης τροχιών αεροσκαφών, σε ένα αεροπορικό περιβάλλον. Ο ...

Πλοήγηση ανά Επιβλέποντα "Vouros, George"

Deep reinforcement learning method in centralized multi-agent air traffic control ﻿

Detecting modes of behavior in marine trajectories using imitation learning ﻿

Explainable reinforcement learning using interpretable models ﻿

Hidden variables’ estimation of trajectories' states using imitation learning ﻿

Inherently interpretable Q-Learning ﻿

Predicting trajectories with Directed-Info GAIL ﻿

Predicting trajectories’ parameters using graph convolutional neural networks ﻿

Prediction of human behaviour using imitation learning ﻿

Solving long-horizon tasks via imitation and reinforcement learning ﻿

Deep reinforcement learning method in centralized multi-agent air traffic control

Detecting modes of behavior in marine trajectories using imitation learning

Explainable reinforcement learning using interpretable models

Hidden variables’ estimation of trajectories' states using imitation learning

Inherently interpretable Q-Learning

Predicting trajectories with Directed-Info GAIL

Predicting trajectories’ parameters using graph convolutional neural networks

Prediction of human behaviour using imitation learning

Solving long-horizon tasks via imitation and reinforcement learning