Experimental evaluation of online classification models

Καλδερεμίδης, Αλέξανδρος - Στέφανος

dc.contributor.advisor	Τελέλης, Ορέστης
dc.contributor.author	Καλδερεμίδης, Αλέξανδρος - Στέφανος
dc.date.accessioned	2019-10-21T09:18:44Z
dc.date.available	2019-10-21T09:18:44Z
dc.date.issued	2019
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/12230
dc.description.abstract	Σε αυτή τη διατριβή συγκρίνουμε πειραματικά διάφορες μεθόδους άμεσης μηχανικής μάθησης (online machine learning) για κατηγοριοποίηση. O όρος "άμεση" αναφέρεται στο γεγονός ότι o κατηγοριοποιητής εξετάζει τα παραδείγματα ένα-ένα και όχι σαν ολόκληρο σετ δεδομένων, συν το ότι η απόφαση του κατηγοριοποιητή είναι μη ανακλήσιμη. Αξιολογούμε την απόδοσή τους σε τρία διαφορετικά σύνολα δεδομένων. Συγκεκριμένα, οι ηλεκτρονικές μέθοδοι μάθησης που χρησιμοποιούνται είναι το Perceptron, οι μηχανές διανύσματος στήριξης (SVM), ο Winnow, λογιστική παλινδρόμηση (LR), καθώς και μέθοδοι πυρήνα για Perceptron και SVM. Τα σύνολα δεδομένων που χρησιμοποιούνται καλύπτουν πολλά πεδία εφαρμογής στη ζωή. Το πρώτο σύνολο δεδομένων χρησιμοποιείται για την πρόβλεψη μηνυμάτων ηλεκτρονικού ταχυδρομείου ανεπιθύμητης αλληλογραφίας, το δεύτερο για την ακύρωση της αποστολής παραγγελίας και το τρίτο για τη συνεχή παρακολούθηση των ατόμων που πάσχουν από επιληψία. Μετά τη μετατροπή των συνόλων δεδομένων στην επιθυμητή μορφή, υλοποιούμε τις εν λόγω μεθόδους και αλγόριθμους από το μηδέν χρησιμοποιώντας Python, αξιολογούμε τα μοντέλα που δημιουργήσαμε και παρουσιάζουμε τα αποτελέσματά μας. Τα ευρήματά μας συνοψίζονται ως εξής. Πρώτον, οι μέθοδοι πυρήνα δεν ξεπερνούν σε απόδοση τις γραμμικές μεθόδους, λόγω έλλειψης ποσότητας παραδειγμάτων εκπαίδευσης. Δεύτερον, η απόδοση του Winnow ήταν φτωχή, πιθανώς λόγω της έλλειψης αρνητικής συσχέτισης. Τέλος, εξακριβώνουμε πως η απόκλιση μεταξύ των μοντέλων που δημιουργήσαμε, με τα αντίστοιχα στατικά μοντέλα που δημιούργησε η βιβλιοθήκη sk-learn της Python, ήταν ελάχιστη, συνεπώς αποδεικνύεται πως η επίδοση των μοντέλων μας ήταν ικανοποιητική.	el
dc.format.extent	45	el
dc.language.iso	en	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.title	Experimental evaluation of online classification models	el
dc.title.alternative	Πειραματική αποτίμηση μοντέλων άμεσης κατηγοριοποίησης	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	In this thesis we compare experimentally several online machine learning methods, for classification. The term "online" refers to the fact that the classifier examines the training examples one by one and not as a whole dataset, and additionally the classifier's decision is irrevocable. We evaluate their performance on three different datasets. Specifically, the online learning methods used are Perceptron, Support Vector Machines (SVMs), Winnow, Logistic Regression (LR), along with kernel methods for Perceptron and SVM. The datasets used cover real-life application fields. The first dataset is used to predict spam e-mails, the second for cancellation of shipment and the third for constant surveillance of people suffering epilepsy. After transforming the datasets to the desired form, we implement the said methods and algorithms from scratch using Python, evaluate the models created and present our results. Our findings are summarized as follows. First, the kernel methods do not outperform the non-kernel ones, due to the lack of quantity of training examples. Second, the Winnow performance was poor, probably due to its lack of negative correlation. Finally, we find that the deviation between the models we created, and the corresponding static models created by Python's sk-learn, was insubstantial, therefore proving our models' performance was satisfactory.	el
dc.contributor.master	Ψηφιακά Συστήματα και Υπηρεσίες	el
dc.subject.keyword	Machine learning	el
dc.subject.keyword	Online learning	el
dc.subject.keyword	Experimental evaluation	el
dc.subject.keyword	Linear methods	el
dc.subject.keyword	Kernel methods	el
dc.subject.keyword	SVM	el
dc.subject.keyword	Perceptron	el
dc.subject.keyword	Logistic regression	el
dc.subject.keyword	Winnow	el
dc.date.defense	2019-07-19

Αρχεία σε αυτό το τεκμήριο

Name:: COPY2-Machine_Learning.pdf
Μέγεθος:: 1.815Mb
Τύπος:: PDF
Description:: Μεταπτυχιακή διατριβή

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής