Υλοποίηση υπερ-ταξινομητών πολυμεσικών δεδομένων
Master Thesis
Συγγραφέας
Κάτσαρης, Δημήτριος Α.
Ημερομηνία
2012-06-13Επιβλέπων
Τσιχριντζής, ΓεώργιοςΠροβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Machine learning ; ΑλγόριθμοιΠερίληψη
Η παρούσα μεταπτυχιακή διατριβή πραγματεύεται το πρόβλημα της ταξινόμησης προτύπων τα οποία ανήκουν σε περισσότερες από δύο κλάσεις. Για το σχεδιασμό του υπέρ-ταξινομητή μελετήθηκε η μέθοδος 'one against all'. Σύμφωνα με τη μέθοδο αυτή για κάθε κλάση δεδομένων δημιουργείται ένας ταξινομητής ο οποίος εκπαιδεύεται με θετικά και αρνητικά δεδομένα. Τα θετικά δεδομένα αποτελούνται από τα στιγμιότυπα της κλάσης στην οποία αντιστοιχίζεται κάθε φορά ο ταξινομητής ενώ τα αρνητικά δεδομένα αποτελούνται από τα στιγμιότυπα όλων των υπόλοιπων κλάσεων. Αν το πλήθος των θετικών και αρνητικών στιγμιότυπων είναι ίσο τότε μιλάμε για ισοζυγισμένο ταξινομητή ενώ σε αντίθετη περίπτωση για μη-ισοζυγισμένο ταξινομητή. Μετά την εκπαίδευση όλων των επιμέρους ταξινομητών ελέγχοντας ένα δοσμένο στιγμιότυπο με όλους τους παραπάνω ταξινομητές μπορούμε να βγάλουμε συμπέρασμα σε ποια κλάση αυτό το στιγμιότυπο μπορεί να ανήκει. Στηριζόμενοι πάνω σε αυτή τη μέθοδο, δημιουργήθηκαν υβριδικά μοντέλα τα οποία βοήθησαν στην τελική σχεδίαση του υπέρ-ταξινομητή. Η προσέγγιση του προβλήματος στηρίχθηκε στην αρχή στη χρήση του ταξινομητή μηχανών διανυσμάτων στήριξης (Support Vector Machines). Προκειμένου όμως να βγουν πιο ασφαλή συμπεράσματα για τη μέθοδο 'one against all' και των υβριδικών μοντέλων που δημιουργήθηκαν χρησιμοποιήθηκαν και νευρωνικά δίκτυα τα οποία όμως κατά την αξιολόγηση έδωσαν χειρότερα αποτελέσματα. Η αξιολόγηση των παραπάνω μεθόδων σχεδίασης του υπέρ-ταξινομητή έγινε σε τρία προβλήματα ταξινόμησης. Τα δύο αναφέρονται σε προβλήματα ταξινόμησης μουσικών κομματιών για τα οποία έχουν υπολογιστεί κατάλληλα διανύσματα χαρακτηριστικών και το τρίτο αναφέρεται στην ταξινόμηση ανθρώπινων εκφράσεων προσώπου. Τα αποτελέσματα αναδεικνύουν ότι η τελική υβριδική σχεδιαστική μέθοδος του υπέρ-ταξινομητή φαίνεται να δίνει οριακά λίγο καλύτερα αποτελέσματα από αυτά της απλής μεθόδου 'one against all'. Επίσης φαίνεται ότι σημαντικό ρόλο στα τελικά αποτελέσματα παίζει η ποιότητα του συνόλου των χαρακτηριστικών που δίνονται σαν είσοδος στον ταξινομητή.