dc.contributor.advisor | Χαλκίδη, Μαρία | |
dc.contributor.author | Πικούνης, Κωνσταντίνος | |
dc.date.accessioned | 2020-05-13T10:25:59Z | |
dc.date.available | 2020-05-13T10:25:59Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/12704 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/127 | |
dc.description.abstract | Τα εργαλεία μηχανικής μάθησης που στοχεύουν στην ανάλυση του συναισθήματος κειμένων, είναι από τα πλέον καινοτόμα εργαλεία μηχανικής μάθησης. Για την εκπαίδευση τέτοιων εργαλείων, συνήθως απαιτούνται πολύ μεγάλα datasets τα οποία μπορεί να μην είναι διαθέσιμα στην πληρότητά τους από την αρχή, αλλά να δημιουργούνται σταδιακά. Μία νέα και καινοτόμα προσέγγιση των εργαλείων ανάλυσης συναισθήματος, η οποία μελετάται στην παρούσα διπλωματική εργασία, είναι αυτά που εκπαιδεύονται με αυξητικό τρόπο.
Η παρούσα διπλωματική εργασία αποτελείται από τέσσερα κεφάλαια. Στο Κεφάλαιο 1 αναφέρονται οι κυριότερες μέθοδοι για την αναπαράσταση κειμένου με αριθμούς (διανύσματα), καθώς και η μέθοδος που επιλέχθηκε. Στο Κεφάλαιο 2 παρουσιάζονται διάφοροι ταξινομητές που λειτουργούν με αυξητικό τρόπο. Αυτοί μελετήθηκαν σε βάθος, ορίστηκαν κριτήρια για την επιλογή του βέλτιστου και βάσει αυτών, βρέθηκε ο βέλτιστος ταξινομητής για την κατηγοριοποίηση μικρών κειμένων (περιβάλλον microblogging) με βάση το συναίσθημά τους, ο οποίος λειτουργεί με αυξητικό τρόπο. Στο Κεφάλαιο 3 παρουσιάζεται εις βάθος μελέτη του βέλτιστου ταξινομητή. Ο ταξινομητής αυτός υποβλήθηκε σε διάφορους ελέγχους και η απόδοση ταξινόμησής του ελέγχθηκε σε διαφορετικές περιπτώσεις. Τέλος, δημιουργήθηκε ένα ολοκληρωμένο εργαλείο για την ταξινόμηση μικρών κειμένων με βάση το συναίσθημά τους, το οποίο λειτουργεί με αυξητικό τρόπο και βασίστηκε στον επιλεγμένο ταξινομητή. Το Κεφάλαιο 4 αποτελεί μια σύνοψη και την κατακλείδα της παρούσας διπλωματικής εργασίας. | el |
dc.format.extent | 103 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Αυξητική μέθοδος ανάλυσης συναισθήματος σε περιβάλλον microblogging | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | Machine learning tools that perform sentiment analysis on texts is one of the most innovative branches of machine learning. To train such tools, large datasets are usually required. In some cases, these datasets are fully available in their entirety, but in other, more realistic cases, the data can be accessed incrementally, as they are created. In order to utilize such datasets as well as perform analyses on real data without having access to the whole dataset from the beginning, machine learning tools that can be trained incrementally are used. The focus of this thesis is this novel and innovative branch of sentiment analysis machine learning tools that can be trained incrementally.
This master thesis aims to find the optimal classifier, which can be trained incrementally, for classifying short texts based on their sentiment. The thesis is divided into four chapters. In Chapter 1 the most common methods to represent text into vectors are discussed as well as the one chosen for this analysis. In Chapter 2 various classifiers that can be trained incrementally are detailed. Five criteria are devised, and the best classifier is identified. In Chapter 3 a detailed analysis of the optimal classifier is conducted. That classifier is put through various tests and its behavior is studied. Finally, an integrated tool based on the chosen classifier, is created in order to classify short texts based in their sentiment. Chapter 4 is the conclusion of this thesis. | el |
dc.contributor.master | Ψηφιακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Short texts | el |
dc.subject.keyword | Incremental Learning | el |
dc.subject.keyword | Μηχανική μάθηση | el |
dc.subject.keyword | Μικρά κείμενα | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Sentiment analysis | el |
dc.subject.keyword | Ανάλυση συναισθήματος | el |
dc.subject.keyword | Μάθηση με αυξητικό τρόπο | el |
dc.date.defense | 2020-02-27 | |