Εμφάνιση απλής εγγραφής

Online machine learning for bilateral trading problems

dc.contributor.advisorΤελέλης, Ορέστης
dc.contributor.advisorTelelis, Orestis
dc.contributor.authorΑγγελοπούλου, Ειρήνη
dc.contributor.authorAngelopoulou, Eirini
dc.date.accessioned2022-03-16T07:18:50Z
dc.date.available2022-03-16T07:18:50Z
dc.date.issued2022
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/14225
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1648
dc.description.abstractΣτα πλαίσια της παρούσας διπλωματικής εργασίας, θα ασχοληθούμε με την θεματική του «Online Learning» και τις εφαρμογές του στις «online» δημοπρασίες με διαμελάβηση. Στις μέρες μας όλες οι συναλλαγές, στις σύγχρονες ηλεκτρονικές πλατφόρμες, πραγματοποιούνται αποκλειστικά μέσω «online» δημοπρασιών σε πραγματικό χρόνο. Ο σχεδιασμός τέτοιων δημοπρασιών αλλά και η ανάλυση των ιδιοτήτων τους έχουν δώσει κίνητρο για διεξαγωγή μεγάλου όγκου ερευνών τα τελευταία χρόνια. Εστιάζοντας κυρίως στον σχεδιασμό της βέλτιστης δημοπρασίας με στόχο την μεγιστοποίηση των εσόδων του πωλητή. Συγκεκριμένα, ερευνούμε βιβλιογραφικά το πρόβλημα του «Online Learning» και παρουσιάζουμε κάποιες βασικές ιδέες και μεθόδους. Ξεκινώντας με την κατηγορία προβλημάτων «Πλήρους Πληροφορίας» με «Συμβουλή ειδικού», και «Μερικής Πληροφορίας» προβλήματα με «Κουλοχέρηδες». Με σκοπό στην συνέχεια να εμβαθύνουμε στις «online» δημοπρασίες και τις δίπλες δημοπρασίες, τις οποίες θα χρησιμοποιήσουμε παρακάτω και στο πειραματικό κομμάτι της εργασίας. Αναλυτικά, για το πειραματικό σκέλος εξετάζουμε τους αλγόριθμους που παρουσιάσαμε στην ενότητα του «Online Learning». Αρχικά επιλέγουμε τρεις «Πλήρους Πληροφορίας» αλγορίθμους, τον «Follow the Best Price» αλγόριθμο, μια τροποποιημένη εκδοχή του πρώτου την οποία αναφέρουμε ως «Follow the Best Price with Greedy sampling», και τον «Exponential Weighted Average» αλγόριθμο. Και στην συνέχεια επιλέγουμε τον «ε-Greedy» αλγόριθμο από τις «Μερικής Πληροφορίας» μεθόδους. Πραγματοποιούμε πειράματα με την χρήση των προαναφερθέντων αλγορίθμων, σε τέσσερα διαφορετικά σύνολα τιμών αγοραστών και πωλητών. Παρατηρούμε ότι σχεδόν όλοι οι αλγόριθμοι που εξετάσαμε πέτυχαν μικρά (λογαριθμικά) «Regret». Συγκρίνοντας τους αλγορίθμους μεταξύ τους, ο «Follow the Best Price» αλγόριθμος είναι ο αλγόριθμος με την καλύτερη απόδοση για τα περισσότερα σύνολα και ο «ε-Greedy» ο αλγόριθμος με την χειρότερη. Και τέλος, ο τροποποιημένος αλγόριθμος «Follow the Best Price with Greedy sampling», ξεπερνάει σε αποτελέσματα τον αρχικό «Follow the Best Price» σε μόνο ένα από τα σύνολα που εξετάστηκαν.el
dc.format.extent56el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleOnline machine learning for bilateral trading problemsel
dc.title.alternativeΆμεση μηχανική μάθηση για προβλήματα διμερών συναλλαγώνel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENIn this work, we are studying Online Learning and its application in Online Auctions through intermediation. These days, all transactions on modern platforms are conducted exclusively through real-time online auctions. The design of such auctions and their properties have initiated a lot of research in the past years, focusing on designing the optimal auction mechanism to maximize the seller’s revenue. Specifically, throughout this study, we explore bibliographically the Online Learning and its key ideas and methods. We begin with the Full Feedback and the Expert Advice methods, followed by the Partial Feedback and the Bandit general setting. Afterwards we continue our investigation with the problem of Online Auctions and the Double Auction or Bilateral Trade setting, which we will also examine in the experimental section too. For the experiment, we explore the algorithms we presented in the section on Online Learning. Initially, we selected three Full-feedback algorithms, the Follow the Best Price algorithm, a modified Follow the Best Price with Greedy sampling, and the Exponential Weighted Average algorithm. We then continued the analysis with an ε-Greedy algorithm from the Partial-feedback category of algorithms. We compare the performance of the above algorithms in the Bilateral Trade setup, selecting four different sets for the sellers’ and the buyers’ prices. All the algorithms tested achieved small (logarithmic) regret and generally the findings verify the theoretical results. Comparing the results of the algorithms, the Follow the best price algorithm is the best performing algorithm for most of the sets while the ε-Greedy algorithm is the worst. Our modified Follow the Best Price with Greedy sample algorithm achieved the best results, actually outperforming the original Follow the Best Price algorithm, in one of the four experiments.el
dc.contributor.masterΠροηγμένα Συστήματα Πληροφορικήςel
dc.subject.keywordOnline learningel
dc.subject.keywordOnline auctionsel
dc.subject.keywordMachine learningel
dc.subject.keywordPredicting from expert adviceel
dc.subject.keywordMultiarmed bandit problemel
dc.date.defense2022-02-28


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»