Εμφάνιση απλής εγγραφής

Εξομοίωση και σύγκριση αλγορίθμων ενισχυτικής μάθησης

dc.contributor.advisorΣωτηρόπουλος, Διονύσιος
dc.contributor.authorΣπυρόπουλος, Κωνσταντίνος
dc.date.accessioned2022-10-24T06:15:55Z
dc.date.available2022-10-24T06:15:55Z
dc.date.issued2022-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/14708
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/2130
dc.description.abstractΗ Τεχνητή Νοημοσύνη στη σύγχρονη εποχή αποτελεί ένα σημαντικό εργαλείο για την υλοποίηση καινοτόμων ιδεών και την ανάπτυξη πολλών τεχνολογικών εφαρμογών. Ειδικότερα, το κομμάτι της μηχανικής μάθησης προσφέρει μια πληθώρα τεχνικών και αλγορίθμων για την επίλυση προβλημάτων που αντιμετωπίζονται δύσκολα κάνοντας χρήση του κλασσικού προγραμματισμού. Αντίστοιχο πρόβλημα παρουσιάζεται και στην παρούσα εργασία, η οποία αποτελεί μια θεωρητική και πρακτική προσέγγιση στον τομέα της μηχανικής μάθησης και στην εύρεση κατάλληλων τεχνικών για την επίλυσή σύνθετων προβλημάτων. Η δημιουργία ευφυών τεχνητών πρακτόρων (agents) για την λύση πολύπλοκων προβλημάτων που σχετίζονται με τον άνθρωπο αποτελεί μια μεγάλη πρόκληση για την κοινότητα της τεχνητής νοημοσύνης. Ιδιαίτερα σημαντική είναι η κατανόηση του δυναμικού περιβάλλοντος στο οποίο δρουν και η αλληλεπίδραση τους με αυτό όπως και ο άνθρωπος στον φυσικό κόσμο. Ο τομέας που ειδικεύεται στην δημιουργία τέτοιων agents ονομάζεται Reinforcement Learning. Με τον όρο Reinforcement Learning, αναφερόμαστε στις μεθόδους μέσω των οποίων ένα σύστημα αλγορίθμων ‘μαθαίνει’ να αλληλεπιδρά μέσα σε ένα περιβάλλον δομημένο γύρω από κάποιους ορισμένους κανόνες μετά από δοκιμές και σφάλματα. Η εκμάθηση αυτή γίνεται μέσω της εξερεύνησης του περιβάλλοντος μέσω των πρακτόρων, των ενεργειών και των αντίστοιχων επιβραβεύσεων που δίνονται από αυτό με σκοπό να επιτευχθεί ένας στόχος με την βέλτιστη προσπάθεια. Η έρευνα αυτή αναπτύχθηκε πάνω στην ιδέα του απλού παιχνιδιού κυνηγητού, με σκοπό την υλοποίηση ενός περιβάλλοντος και των πρακτόρων που θα παίζουν. Στο παιχνίδι αυτό, οι κυνηγοί καλούνται να πιάσουν τους αντίπαλους, ενώ αντίστοιχα οι κυνηγημένοι προσπαθούν να παραμείνουν ελεύθεροι. Στόχος της εργασίας είναι, πέρα από την κατανόηση των κανόνων και την λήψη των σωστών αποφάσεων για την επίτευξη της νίκης, η εύρεση νέων στρατηγικών που θα οδηγήσουν σε βέλτιστα αποτελέσματα αλλά και η σύγκριση δημοφιλών αλγορίθμων ανάλογα με το πρόβλημα. Οι προτεινόμενες προσεγγίσεις έχουν επιλεγεί μετά από ανάλυση ενός μεγάλου εύρους αλγορίθμων σε Reinforcement Learning σε ένα γραφικό περιβάλλον εξομοίωσης. Τα αποτελέσματα που επιτεύχθηκαν παρουσιάζουν την βέλτιστη τεχνική υλοποίησης, παράλληλα όμως επισημαίνονται και προοπτικές βελτίωσης όσο στον τρόπο λήψεων αποφάσεων αλλά και στην αντιμετώπιση πολυπλοκότερου περιβάλλοντος και κανονισμών του παιχνιδιού.el
dc.format.extent57el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/gr/*
dc.titleΕξομοίωση και σύγκριση αλγορίθμων ενισχυτικής μάθησηςel
dc.title.alternativeSimulation and comparison of reinforcement learning algorithmsel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENThe field of Artificial intelligence in modern era is an important tool in the implementation of modern ideas and the development of many useful applications. Machine learning provides a variety of techniques and algorithms for problem solving where classical programming is limited. A similar problem is presented in this work, which is a theoretical and practical approach in the field of machine learning aiming in finding suitable techniques for solving complex problems. Creating intelligent artificial agents to solve human-related problems is a major challenge for the artificial intelligence community. Particularly important is the understanding of the dynamic environment in which they operate and their interaction with it, just like humans do in the physical world. The field that specializes in creating such agents is called Reinforcement Learning. With the term Reinforcement Learning, we refer to the methods through which a system of algorithms 'learns' to interact within a structured environment after trial and error. This learning is done by exploring the environment through actions and rewards given by the environment to achieve a goal with optimal effort. This research was developed on the idea of the simple chase game, which aims to create an environment and the agents that play in it. In this game, hunting agents are tasked with catching opponents, while the hunted agents try to stay free. The goal of the work is, apart from understanding the rules and getting the right decisions to achieve victory, finding new strategies that will lead to optimal results and comparing the most valuable algorithms. The proposed approach has been chosen after analysing a wide range of Reinforcement Learning algorithms in a graphical emulation environment. The results achieved show the best implementation technique, but at the same time prospective improvements are also highlighted in the way of getting the right decisions but also in dealing with the more complex environment and rules of the game.el
dc.contributor.masterΠροηγμένα Συστήματα Πληροφορικής - Ανάπτυξη Λογισμικού και Τεχνητής Νοημοσύνηςel
dc.subject.keywordΕνισχυμένη Μάθησηel
dc.subject.keywordNEATel
dc.subject.keywordDeep Qel
dc.subject.keywordQ learningel
dc.subject.keywordReinforcement learningel
dc.subject.keywordPythonel
dc.date.defense2022-09-06


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»