Εμφάνιση απλής εγγραφής

Ενισχυτική μάθηση - Ms Pacman

dc.contributor.advisorΦιλιππάκης, Μιχαήλ
dc.contributor.authorΑθανασοπούλου, Ζωή Ιωάννα
dc.date.accessioned2024-11-26T12:33:40Z
dc.date.available2024-11-26T12:33:40Z
dc.date.issued2024-06
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/17121
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/4544
dc.description.abstractΗ παρούσα διπλωματική εργασία εξετάζει την εφαρμογή της ενισχυτικής μάθησης για την εκπαίδευση πρακτόρων σε ηλεκτρονικά παιχνίδια. Σκοπός της έρευνας είναι να διερευνηθεί η απόδοση και η αποτελεσματικότητα διάφορων παραλλαγών του αλγορίθμου Deep Q-Network (DQN) σε περιβάλλοντα παιχνιδιών arcade. Στην εργασία αυτή, αρχικά παρουσιάζονται οι βασικές έννοιες της ενισχυτικής μάθησης, συμπεριλαμβανομένων των πολιτικών, των συναρτήσεων ανταμοιβής και αξίας, και των μοντέλων περιβάλλοντος. Στη συνέχεια, αναλύονται οι θεωρητικές αρχές των αλγορίθμων DQN και οι επεκτάσεις τους, όπως το DQN με batch normalization, το Duel DQN, το Noisy DQN, και το Double DQN με Prioritized Experience Buffer. Τα πειραματικά αποτελέσματα δείχνουν ότι κάθε παραλλαγή προσφέρει συγκεκριμένα πλεονεκτήματα στην εκπαίδευση των πρακτόρων. Οι πράκτορες που εκπαιδεύτηκαν με τις παραλλαγές του DQN παρουσίασαν βελτίωση στη μέση ανταμοιβή, στο σκορ και στην ταχύτητα εκπαίδευσης σε σχέση με τον βασικό αλγόριθμο DQN. Ειδικότερα, ο πράκτορας με Prioritized Experience Buffer και Double DQN εμφάνισε την καλύτερη συνολική απόδοση, επιτυγχάνοντας την υψηλότερη μέση ανταμοιβή και σκορ. Η εργασία καταλήγει στο συμπέρασμα ότι η ενισχυτική μάθηση και οι προσαρμογές των αλγορίθμων DQN μπορούν να εφαρμοστούν αποτελεσματικά για την εκπαίδευση πρακτόρων σε δυναμικά και σύνθετα περιβάλλοντα, όπως τα ηλεκτρονικά παιχνίδια. Η θεωρητική ανάλυση και τα πειραματικά αποτελέσματα υποδεικνύουν τη σημαντική συμβολή των τεχνικών βελτιστοποίησης στη βελτίωση της αποδοτικότητας και της απόδοσης των πρακτόρων.el
dc.format.extent91el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΕνισχυτική μάθηση - Ms Pacmanel
dc.title.alternativeReinforcement learning - Ms Pacmanel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENThis thesis explores the application of reinforcement learning for training agents in video games. The purpose of the research is to investigate the performance and effectiveness of various Deep Q-Net work (DQN) algorithm variations in arcade game environments. Initially, the thesis presents the basic concepts of reinforcement learning, including policies, reward functions, value functions, and environment models. Then, it analyzes the theoretical principles of DQN algorithms and their extensions, such as DQN with batch normalization, Duel DQN, Noisy DQN, and Double DQN with Prioritized Experience Buffer. Experimental results show that each variation offers specific advantages in agent training. Agents trained with the DQN variations showed improvements in average reward, score, and training speed compared to the basic DQN algorithm. Specifically, the agent with Prioritized Experience Buffer and Double DQN demonstrated the best overall performance, achieving the highest average reward and score. The thesis concludes that reinforcement learning and the adaptations of DQN algorithms can be ef fectively applied to train agents in dynamic and complex environments, such as video games. The theoretical analysis and experimental results highlight the significant contribution of optimization techniques in improving the efficiency and performance of the agents.el
dc.contributor.masterΠληροφοριακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordΕνισχυτική μάθησηel
dc.subject.keywordDeep Q-Networkel
dc.subject.keywordBatch normalizationel
dc.subject.keywordDuel DQNel
dc.subject.keywordNoisy DQNel
dc.subject.keywordPrioritized experience bufferel
dc.subject.keywordΗλεκτρονικά παιχνίδιαel
dc.subject.keywordΕκπαίδευσηel
dc.subject.keywordGoogle Colabel
dc.subject.keywordGPUel
dc.subject.keywordMsPacmanel
dc.subject.keywordPythonel
dc.subject.keywordPyTorchel
dc.subject.keywordΠαιχνίδι Arcadeel
dc.subject.keywordΠράκτοραςel
dc.subject.keywordAzureel
dc.date.defense2024-06-23


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»