Predicting trajectories with Directed-Info GAIL

Τσεβρένης, Αλέξανδρος; Tsevrenis, Alexander

dc.contributor.advisor	Βούρος, Γεώργιος
dc.contributor.advisor	Vouros, George
dc.contributor.author	Τσεβρένης, Αλέξανδρος
dc.contributor.author	Tsevrenis, Alexander
dc.date.accessioned	2021-09-24T08:33:31Z
dc.date.available	2021-09-24T08:33:31Z
dc.date.issued	2021-06-23
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/13689
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/1112
dc.description.abstract	Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ιεραρχική δομή μπορεί να είναι πρόκληση. Αυτή η διπλωματική έχει διευρευνήσει τη χρήση του αλγορίθμου Directed-Info GAIL, ο οποίος βασίζεται στο generative adversarial imitation learning (GAIL) framework ώστε ο πράκτορας να μαθαίνει πολιτικές για υπο-διεργασίες από μη κατατμημένες επιδείξεις τροχιών, με δεδομένο ότι οι τροχιές αυτές επιδυκνύουν πράγματι διαφορετικούς τρόπους συμπεριφοράς σε διαφορετικά τμήματα τους, εξαρτώμενους και από τα χαρακτηρηστικά του περιβάλλοντος όπου εκτελούνται οι τροχιές. Η εργασία μελετά την εφαρμογή του αλγορίθμου σε συμπεριφορές ρομπότ και αεροσκαφών.	el
dc.format.extent	93	el
dc.language.iso	en	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Αναφορά Δημιουργού 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc/3.0/gr/	*
dc.title	Predicting trajectories with Directed-Info GAIL	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	As noted in the Directed-Info GAIL paper “the use of imitation learning to learn a single policy for a complex task that has multiple modes or hierarchical structure can be challenging”. This thesis will explore the use of Directed-Info GAIL algorithm, which is based on the generative adversarial imitation learning framework to automatically learn subtask policies from unsegmented demonstrations of robot trajectories and aircraft trajectories, given that flights and robots have indeed different modes of behaviour in different segments of trajectories, depending on tasks they fulfil and many trajectories’ contextual features.	el
dc.corporate.name	Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»	el
dc.contributor.master	Τεχνητή Νοημοσύνη - Artificial Intelligence	el
dc.subject.keyword	Imitation learning	el
dc.subject.keyword	Directed-Info GAIL	el
dc.subject.keyword	Variational Auto-Encoder	el
dc.subject.keyword	Generative Adversarial Imitation Learning (GAIL)	el
dc.date.defense	2021-07-01

Αρχεία σε αυτό το τεκμήριο

Name:: Tsevrenis_MTN1914.pdf
Μέγεθος:: 11.28Mb
Τύπος:: PDF
Description:: Μεταπτυχιακή διατριβή

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού 3.0 Ελλάδα