dc.contributor.advisor | Βούρος, Γεώργιος | |
dc.contributor.advisor | Vouros, George | |
dc.contributor.author | Τσεβρένης, Αλέξανδρος | |
dc.contributor.author | Tsevrenis, Alexander | |
dc.date.accessioned | 2021-09-24T08:33:31Z | |
dc.date.available | 2021-09-24T08:33:31Z | |
dc.date.issued | 2021-06-23 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/13689 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/1112 | |
dc.description.abstract | Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ιεραρχική δομή μπορεί να είναι πρόκληση. Αυτή η διπλωματική έχει διευρευνήσει τη χρήση του αλγορίθμου Directed-Info GAIL, ο οποίος βασίζεται στο generative adversarial imitation learning (GAIL) framework ώστε ο πράκτορας να μαθαίνει πολιτικές για υπο-διεργασίες από μη κατατμημένες επιδείξεις τροχιών, με δεδομένο ότι οι τροχιές αυτές επιδυκνύουν πράγματι διαφορετικούς τρόπους συμπεριφοράς σε διαφορετικά τμήματα τους, εξαρτώμενους και από τα χαρακτηρηστικά του περιβάλλοντος όπου εκτελούνται οι τροχιές. Η εργασία μελετά την εφαρμογή του αλγορίθμου σε συμπεριφορές ρομπότ και αεροσκαφών. | el |
dc.format.extent | 93 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/gr/ | * |
dc.title | Predicting trajectories with Directed-Info GAIL | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | As noted in the Directed-Info GAIL paper “the use of imitation learning to learn a single policy for a complex task that has multiple modes or hierarchical structure can be challenging”. This thesis will explore the use of Directed-Info GAIL algorithm, which is
based on the generative adversarial imitation learning framework to automatically learn subtask policies from unsegmented demonstrations of robot trajectories and aircraft trajectories, given that flights and robots have indeed different modes of behaviour in different segments of trajectories, depending on tasks they fulfil and many trajectories’ contextual features. | el |
dc.corporate.name | Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος» | el |
dc.contributor.master | Τεχνητή Νοημοσύνη - Artificial Intelligence | el |
dc.subject.keyword | Imitation learning | el |
dc.subject.keyword | Directed-Info GAIL | el |
dc.subject.keyword | Variational Auto-Encoder | el |
dc.subject.keyword | Generative Adversarial Imitation Learning (GAIL) | el |
dc.date.defense | 2021-07-01 | |