Predicting trajectories with Directed-Info GAIL
Master Thesis
Συγγραφέας
Τσεβρένης, Αλέξανδρος
Tsevrenis, Alexander
Ημερομηνία
2021-06-23Επιβλέπων
Βούρος, ΓεώργιοςVouros, George
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Imitation learning ; Directed-Info GAIL ; Variational Auto-Encoder ; Generative Adversarial Imitation Learning (GAIL)Περίληψη
Όπως αναφέρεται στο άρθρο του Directed-Info GAIL αλγορίθμου η χρήση του imitation learning για την εκμάθηση μίας ενιαίας πολιτικής για μια σύνθετη διεργασία (task) που εμπεριέχει πολλαπλούς τρόπους συμπεριφοράς (modes) ή ιεραρχική δομή μπορεί να είναι πρόκληση. Αυτή η διπλωματική έχει διευρευνήσει τη χρήση του αλγορίθμου Directed-Info GAIL, ο οποίος βασίζεται στο generative adversarial imitation learning (GAIL) framework ώστε ο πράκτορας να μαθαίνει πολιτικές για υπο-διεργασίες από μη κατατμημένες επιδείξεις τροχιών, με δεδομένο ότι οι τροχιές αυτές επιδυκνύουν πράγματι διαφορετικούς τρόπους συμπεριφοράς σε διαφορετικά τμήματα τους, εξαρτώμενους και από τα χαρακτηρηστικά του περιβάλλοντος όπου εκτελούνται οι τροχιές. Η εργασία μελετά την εφαρμογή του αλγορίθμου σε συμπεριφορές ρομπότ και αεροσκαφών.