• Deep reinforcement learning method in centralized multi-agent air traffic control 

      Παπαδόπουλος, Γεώργιος; Papadopoulos, Georgios (Πανεπιστήμιο Πειραιώς, 2022-04)
      Ο στόχος αυτής της διατριβής είναι να σχεδιάσει πολυπρακτορικές μεθόδους Βαθιας Ενισχυτικής Μάθησης και να διερευνήσει την αποτελεσματικότητά τους στη βελτιστοποίηση και την αυτοματοποίηση της εργασίας του Ελέγχου Εναέριας ...
    • Detecting modes of behavior in marine trajectories using imitation learning 

      Ταπτά, Ελένη; Tapta, Eleni (Πανεπιστήμιο Πειραιώς, 2022-12)
    • Explainable reinforcement learning using interpretable models 

      Lykos, Emmanouil; Λύκος, Εμμανουήλ (Πανεπιστήμιο Πειραιώς, 2024-02)
      Οι μέθοδοι Βαθιάς Ενισχυτικής Μάθησης έχουν επιτύχει υψηλές επιδόσεις στον τομέα της Τεχνητής Νοημοσύνης σε διάφορους τομείς όπως τα βιντεοπαιχνίδια και την αυτόνομη οδήγηση. Αυτές οι μέθοδοι ενσωματώνουν τις δυνατότητες ...
    • Hidden variables’ estimation of trajectories' states using imitation learning 

      Patiniotis Spyropoulos, Dimitrios; Πατηνιώτης Σπυρόπουλος, Δημήτριος (Πανεπιστήμιο Πειραιώς, 2024-02)
      Η πρόβλεψη της τροχιάς είναι ένα κρίσιμο πρόβλημα με βαθιές επιπτώσεις σε διάφορους τομείς, από τα αυτόνομα οχήματα και τη ρομποτική μέχρι την αεροδιαστημική και τη θαλάσσια ναυσιπλοΐα. Σε αυτή τη διπλωματική εργασία θα ...
    • Inherently interpretable Q-Learning 

      Koumentis, Ioannis; Κουμέντης, Ιωάννης (Πανεπιστήμιο Πειραιώς, 2022-06)
    • Predicting trajectories with Directed-Info GAIL 

      Τσεβρένης, Αλέξανδρος; Tsevrenis, Alexander (Πανεπιστήμιο Πειραιώς, 2021-06-23)
      Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ...
    • Predicting trajectories’ parameters using graph convolutional neural networks 

      Ιωαννίδης, Ιωάννης; Ioannidis, Ioannis (Πανεπιστήμιο Πειραιώς, 2023-09)
      Η πρόσφατη ανάπτυξη της αεροπορικής βιομηχανίας έχει αυξήσει το ενδιαφέρον στον τομέα της διαχείρισης εναέριας κυκλοφορίας. Ένα σύγχρονο - ανοιχτό - πρόβλημα στον τομέα αυτό είναι η πρόβλεψη κρυφών παραμέτρων που αφορούν ...
    • Prediction of human behaviour using imitation learning 

      Zidianakis, Matthaios; Ζηδιανάκης, Ματθαίος (Πανεπιστήμιο Πειραιώς, 2022-09-15)
      Στην παρούσα εργασία μελετάται η χρήση ενός αλγορίθμου μιμητικής μάθησης ώστε να μοντελοποιηθεί η ανθρώπινη συμπεριφορά για την επίτευξη μιας εργασίας με διαφοροποιημένους στόχους. Στόχος είναι να εξεταστεί η ικανότητα ...
    • Solving long-horizon tasks via imitation and reinforcement learning 

      Lappa, Athanasia; Λάππα, Αθανασία (Πανεπιστήμιο Πειραιώς, 2024-02)
      Αυτή η διπλωματική διερευνά τη χρήση του αλγορίθμου Relay Policy Learning (RPL) που προτείνεται από τους Gupta et al. [1], με στόχο την μοντελοποίηση της πρόβλεψης τροχιών αεροσκαφών, σε ένα αεροπορικό περιβάλλον. Ο ...

      Βιβλιοθήκη Πανεπιστημίου Πειραιώς
      Επικοινωνήστε μαζί μας
      Στείλτε μας τα σχόλιά σας
      Created by ELiDOC
      Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»