Experimental evaluation of online classification models
Πειραματική αποτίμηση μοντέλων άμεσης κατηγοριοποίησης
Master Thesis
Συγγραφέας
Καλδερεμίδης, Αλέξανδρος - Στέφανος
Ημερομηνία
2019Επιβλέπων
Τελέλης, ΟρέστηςΠροβολή/ Άνοιγμα
Λέξεις κλειδιά
Machine learning ; Online learning ; Experimental evaluation ; Linear methods ; Kernel methods ; SVM ; Perceptron ; Logistic regression ; WinnowΠερίληψη
Σε αυτή τη διατριβή συγκρίνουμε πειραματικά διάφορες μεθόδους άμεσης μηχανικής μάθησης (online machine learning) για κατηγοριοποίηση. O όρος "άμεση" αναφέρεται στο γεγονός ότι o κατηγοριοποιητής εξετάζει τα παραδείγματα ένα-ένα και όχι σαν ολόκληρο σετ δεδομένων, συν το ότι η απόφαση του κατηγοριοποιητή είναι μη ανακλήσιμη. Αξιολογούμε την απόδοσή τους σε τρία διαφορετικά σύνολα δεδομένων. Συγκεκριμένα, οι ηλεκτρονικές μέθοδοι μάθησης που χρησιμοποιούνται είναι το Perceptron, οι μηχανές διανύσματος στήριξης (SVM), ο Winnow, λογιστική παλινδρόμηση (LR), καθώς και μέθοδοι πυρήνα για Perceptron και SVM. Τα σύνολα δεδομένων που χρησιμοποιούνται καλύπτουν πολλά πεδία εφαρμογής στη ζωή. Το πρώτο σύνολο δεδομένων χρησιμοποιείται για την πρόβλεψη μηνυμάτων ηλεκτρονικού ταχυδρομείου ανεπιθύμητης αλληλογραφίας, το δεύτερο για την ακύρωση της αποστολής παραγγελίας και το τρίτο για τη συνεχή παρακολούθηση των ατόμων που πάσχουν από επιληψία. Μετά τη μετατροπή των συνόλων δεδομένων στην επιθυμητή μορφή, υλοποιούμε τις εν λόγω μεθόδους και αλγόριθμους από το μηδέν χρησιμοποιώντας Python, αξιολογούμε τα μοντέλα που δημιουργήσαμε και παρουσιάζουμε τα αποτελέσματά μας. Τα ευρήματά μας συνοψίζονται ως εξής. Πρώτον, οι μέθοδοι πυρήνα δεν ξεπερνούν σε απόδοση τις γραμμικές μεθόδους, λόγω έλλειψης ποσότητας παραδειγμάτων εκπαίδευσης. Δεύτερον, η απόδοση του Winnow ήταν φτωχή, πιθανώς λόγω της έλλειψης αρνητικής συσχέτισης. Τέλος, εξακριβώνουμε πως η απόκλιση μεταξύ των μοντέλων που δημιουργήσαμε, με τα αντίστοιχα στατικά μοντέλα που δημιούργησε η βιβλιοθήκη sk-learn της Python, ήταν ελάχιστη, συνεπώς αποδεικνύεται πως η επίδοση των μοντέλων μας ήταν ικανοποιητική.