Εμφάνιση απλής εγγραφής

dc.contributor.advisorDagioglou, Maria
dc.contributor.advisorΔαγιόγλου, Μαρία
dc.contributor.authorKalogeropoulos, Dimitris
dc.contributor.authorΚαλογερόπουλος, Δημήτρης
dc.date.accessioned2025-11-24T15:39:12Z
dc.date.available2025-11-24T15:39:12Z
dc.date.issued2025-06
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18545
dc.description.abstractΗ συνεργασία μεταξύ ανθρώπου και τεχνητής νοημοσύνης αποτελεί κρίσιμο στοιχείο των διαδραστικών συστημάτων, ιδιαίτερα σε εργασίες που απαιτούν ομαλή και προσαρμοστική ομαδική συνεργασία. Ωστόσο, η επίτευξη αποτελεσματικής συνεργασίας μεταξύ ανθρώπων και πρακτόρων για την επίτευξη ενός στόχου είναι χρονοβόρα και απαιτητική. Η μάθηση μέσω μίμησης, η οποία συχνά θεωρείται υποκατηγορία της μεταφοράς μάθησης, έχει αξιοποιηθεί για την επιτάχυνση της εκπαίδευσης των πρακτόρων μέσω επιδείξεων από ειδικούς· ωστόσο, αυτού του είδους τα δεδομένα είναι συχνά δύσκολα και κοστοβόρα στην απόκτησή τους. Η παρούσα εργασία εξετάζει την επίδραση της στρατηγικής Έμφασης στις Πρόσφατες Εμπειρίες (Emphasized Recent Experience - ERE), μιας μεθόδου χρονικής προτεραιοποίησης, στη συνεργατική δυναμική ενός πράκτορα Βαθιάς Ενισχυτικής Μάθησης (Deep Reinforcement Learning - DRL), ο οποίος εκπαιδεύεται με τον αλγόριθμο Dicrete Soft Actor-Critic (SAC), σε ένα παιχνίδι συνεργασίας ανθρώπου-πράκτορα. Στη μελέτη συμμετείχαν τρεις ομάδες, με πέντε συμμετέχοντες η καθεμία, ακολουθώντας διαφορετικές στρατηγικές εκπαίδευσης: Η Ομάδα 1 χρησιμοποίησε τον βασικό αλγόριθμο SAC, η Ομάδα 2 αλληλεπίδρασε με πράκτορα SAC με χρήση της ERE, ενώ η Ομάδα 3 εφάρμοσε Μεταφορά Μάθησης (Transfer Learning - TL) μέσω δεδομένων επίδειξης από ειδικούς. Τα αποτελέσματα δείχνουν ότι η ενσωμάτωση της ERE βελτιώνει σημαντικά τόσο την απόδοση όσο και τη συνέπεια του πράκτορα SAC, διατηρώντας παράλληλα την αποδοτικότητα χρόνου της TL μεθόδου. Ακόμη και στα μεταγενέστερα στάδια του παιχνιδιού, το ERE αποτελεί μια πολλά υποσχόμενη εναλλακτική ως προς τις επιδόσεις των άπειρων χρηστών. Επιπλέον, οι υποκειμενικές αξιολογήσεις των συμμετεχόντων υποδηλώνουν καλύτερη συνολική εμπειρία παιχνιδιού και εντονότερη αίσθηση συνεργασίας σε σύγκριση με τον βασικό SAC.el
dc.format.extent76el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.titleSupporting human-AI co-learning through emphasizing recent experiencesel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENHuman-AI collaboration is a critical aspect of interactive systems, particularly in tasks that require fluid and adaptive teamwork. However, achieving seamless collaboration between humans and agents to reach a specific goal is both time-consuming and demanding. While imitation learning , often considered a subset of transfer learning, has been used to accelerate agent training via expert demonstrations, such data is typically expensive and difficult to acquire in many domains. This thesis investigates the impact of Emphasized Recent Experience (ERE), a temporal prioritization strategy for replay buffer, on the collaborative dynamics of a Deep Reinforcement Learning (DRL) agent trained with a discrete Soft Actor-Critic (SAC) algorithm in a human-agent collaboration task. The study involved three groups, each with five participants, employing different training strategies: Group 1 used the basic SAC algorithm, Group 2 interacted with a SAC agent augmented with ERE, and Group 3 utilized Transfer Learning (TL) through expert demonstration data. The results indicate that incorporating ERE significantly improves both the performance and consistency of the SAC agent, while maintaining the time-efficiency of the TL method. Even in the later stages of the game, it provides a promising alternative to TL in terms of the scores achieved by naive users. Additionally, subjective evaluations from the participants reflect a better overall game experience and a stronger sense of collaboration compared to SAC.el
dc.corporate.nameNational Centre for Scientific Research "Demokritos"el
dc.contributor.masterΠροηγμένα Συστήματα Πληροφορικήςel
dc.subject.keywordHuman-agent collaborationel
dc.subject.keywordEmphasizing recent experiencesel
dc.date.defense2025-06-11


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής


Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»