dc.contributor.advisor | Τελέλης, Ορέστης | |
dc.contributor.author | Καλδερεμίδης, Αλέξανδρος - Στέφανος | |
dc.date.accessioned | 2019-10-21T09:18:44Z | |
dc.date.available | 2019-10-21T09:18:44Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/12230 | |
dc.description.abstract | Σε αυτή τη διατριβή συγκρίνουμε πειραματικά διάφορες μεθόδους άμεσης μηχανικής μάθησης (online machine learning) για κατηγοριοποίηση. O όρος "άμεση" αναφέρεται στο γεγονός ότι o κατηγοριοποιητής εξετάζει τα παραδείγματα ένα-ένα και όχι σαν ολόκληρο σετ δεδομένων, συν το ότι η απόφαση του κατηγοριοποιητή είναι μη ανακλήσιμη. Αξιολογούμε την απόδοσή τους σε τρία διαφορετικά σύνολα δεδομένων. Συγκεκριμένα, οι ηλεκτρονικές μέθοδοι μάθησης που χρησιμοποιούνται είναι το Perceptron, οι μηχανές διανύσματος στήριξης (SVM), ο Winnow, λογιστική παλινδρόμηση (LR), καθώς και μέθοδοι πυρήνα για Perceptron και SVM. Τα σύνολα δεδομένων που χρησιμοποιούνται καλύπτουν πολλά πεδία εφαρμογής στη ζωή. Το πρώτο σύνολο δεδομένων χρησιμοποιείται για την πρόβλεψη μηνυμάτων ηλεκτρονικού ταχυδρομείου ανεπιθύμητης αλληλογραφίας, το δεύτερο για την ακύρωση της αποστολής παραγγελίας και το τρίτο για τη συνεχή παρακολούθηση των ατόμων που πάσχουν από επιληψία. Μετά τη μετατροπή των συνόλων δεδομένων στην επιθυμητή μορφή, υλοποιούμε τις εν λόγω μεθόδους και αλγόριθμους από το μηδέν χρησιμοποιώντας Python, αξιολογούμε τα μοντέλα που δημιουργήσαμε και παρουσιάζουμε τα αποτελέσματά μας. Τα ευρήματά μας συνοψίζονται ως εξής. Πρώτον, οι μέθοδοι πυρήνα δεν ξεπερνούν σε απόδοση τις γραμμικές μεθόδους, λόγω έλλειψης ποσότητας παραδειγμάτων εκπαίδευσης. Δεύτερον, η απόδοση του Winnow ήταν φτωχή, πιθανώς λόγω της έλλειψης αρνητικής συσχέτισης. Τέλος, εξακριβώνουμε πως η απόκλιση μεταξύ των μοντέλων που δημιουργήσαμε, με τα αντίστοιχα στατικά μοντέλα που δημιούργησε η βιβλιοθήκη sk-learn της Python, ήταν ελάχιστη, συνεπώς αποδεικνύεται πως η επίδοση των μοντέλων μας ήταν ικανοποιητική. | el |
dc.format.extent | 45 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Experimental evaluation of online classification models | el |
dc.title.alternative | Πειραματική αποτίμηση μοντέλων άμεσης κατηγοριοποίησης | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | In this thesis we compare experimentally several online machine learning methods, for classification. The term "online" refers to the fact that the classifier examines the training examples one by one and not as a whole dataset, and additionally the classifier's decision is irrevocable. We evaluate their performance on three different datasets. Specifically, the online learning methods used are Perceptron, Support Vector Machines (SVMs), Winnow, Logistic Regression (LR), along with kernel methods for Perceptron and SVM. The datasets used cover real-life application fields. The first dataset is used to predict spam e-mails, the second for cancellation of shipment and the third for constant surveillance of people suffering epilepsy. After transforming the datasets to the desired form, we implement the said methods and algorithms from scratch using Python, evaluate the models created and present our results. Our findings are summarized as follows. First, the kernel methods do not outperform the non-kernel ones, due to the lack of quantity of training examples. Second, the Winnow performance was poor, probably due to its lack of negative correlation. Finally, we find that the deviation between the models we created, and the corresponding static models created by Python's sk-learn, was insubstantial, therefore proving our models' performance was satisfactory. | el |
dc.contributor.master | Ψηφιακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Online learning | el |
dc.subject.keyword | Experimental evaluation | el |
dc.subject.keyword | Linear methods | el |
dc.subject.keyword | Kernel methods | el |
dc.subject.keyword | SVM | el |
dc.subject.keyword | Perceptron | el |
dc.subject.keyword | Logistic regression | el |
dc.subject.keyword | Winnow | el |
dc.date.defense | 2019-07-19 | |