Εμφάνιση απλής εγγραφής

dc.contributor.advisorVouros, George
dc.contributor.advisorΒούρος, Γεώργιος
dc.contributor.authorKyriazopoulos, Christos
dc.contributor.authorΚυριαζόπουλος, Χρήστος
dc.date.accessioned2025-12-18T10:25:11Z
dc.date.available2025-12-18T10:25:11Z
dc.date.issued2025-12-17
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18721
dc.format.extent59el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleDiffusion models in offline reinforcement learningel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENOffline reinforcement learning (RL) trains decision-making agents from fixed datasets, without interacting with the environment during training. This thesis investigates how diffusion models can be integrated into offline RL, leveraging their ability to capture complex, multimodal distributions and to generate action or trajectory sequences via iterative denoising. We study diffusion-based methods in a real-world airplane trajectory dataset, focusing on goal-reaching constraints and generalization across varying dataset complexity. Overall, the findings indicate that diffusion models can generate feasible trajectories while accommodating domain-specific constraints, supporting their role as a flexible and robust approach for offline RL and constrained planning.el
dc.corporate.nameNational Center of Scientific Research "Demokritos"el
dc.contributor.masterΤεχνητή Νοημοσύνη - Artificial Intelligenceel
dc.subject.keywordOffline Reinforcement Learning (Offline RL)el
dc.subject.keywordDiffusion Modelsel
dc.subject.keywordTrajectory generationel
dc.subject.keywordDiffusion policiesel
dc.subject.keywordBehavior cloningel
dc.date.defense2025-12-15


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»