Εμφάνιση απλής εγγραφής

dc.contributor.advisorΒούρος, Γεώργιος
dc.contributor.advisorVouros, George
dc.contributor.authorΤσεβρένης, Αλέξανδρος
dc.contributor.authorTsevrenis, Alexander
dc.date.accessioned2021-09-24T08:33:31Z
dc.date.available2021-09-24T08:33:31Z
dc.date.issued2021-06-23
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/13689
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1112
dc.description.abstractΌπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ιεραρχική δομή μπορεί να είναι πρόκληση. Αυτή η διπλωματική έχει διευρευνήσει τη χρήση του αλγορίθμου Directed-Info GAIL, ο οποίος βασίζεται στο generative adversarial imitation learning (GAIL) framework ώστε ο πράκτορας να μαθαίνει πολιτικές για υπο-διεργασίες από μη κατατμημένες επιδείξεις τροχιών, με δεδομένο ότι οι τροχιές αυτές επιδυκνύουν πράγματι διαφορετικούς τρόπους συμπεριφοράς σε διαφορετικά τμήματα τους, εξαρτώμενους και από τα χαρακτηρηστικά του περιβάλλοντος όπου εκτελούνται οι τροχιές. Η εργασία μελετά την εφαρμογή του αλγορίθμου σε συμπεριφορές ρομπότ και αεροσκαφών.el
dc.format.extent93el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/gr/*
dc.titlePredicting trajectories with Directed-Info GAILel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENAs noted in the Directed-Info GAIL paper “the use of imitation learning to learn a single policy for a complex task that has multiple modes or hierarchical structure can be challenging”. This thesis will explore the use of Directed-Info GAIL algorithm, which is based on the generative adversarial imitation learning framework to automatically learn subtask policies from unsegmented demonstrations of robot trajectories and aircraft trajectories, given that flights and robots have indeed different modes of behaviour in different segments of trajectories, depending on tasks they fulfil and many trajectories’ contextual features.el
dc.corporate.nameΕθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»el
dc.contributor.masterΤεχνητή Νοημοσύνη - Artificial Intelligenceel
dc.subject.keywordImitation learningel
dc.subject.keywordDirected-Info GAILel
dc.subject.keywordVariational Auto-Encoderel
dc.subject.keywordGenerative Adversarial Imitation Learning (GAIL)el
dc.date.defense2021-07-01


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»