Show simple item record

dc.contributor.advisorΘεοδωρίδης, Ιωάννης
dc.contributor.advisorΠελέκης, Νικόλαος
dc.contributor.advisorΔουλκερίδης, Χρήστος
dc.contributor.authorΜπαζιώτης, Χρήστος
dc.date.accessioned2018-03-23T08:59:26Z
dc.date.available2018-03-23T08:59:26Z
dc.date.issued2017-09
dc.identifier.urihttp://dione.lib.unipi.gr/xmlui/handle/unipi/11110
dc.description.abstractΗ εργασία ασχολείται με το πρόβλημα της πρόβλεψης του συναισθηματικού προσανατολισμού, σε μηνύματα του κοινωνικού δικτύου Twitter. Είναι ένα πρόβλημα Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ), το οποίο στα πλαίσια της εργασίας, προσεγγίζεται με την χρήση Τεχνητών Νευρωνικών Δικτύων (ΤΝΔ) αξιοποιώντας κατανεμημένες αναπαραστάσεις λέξεων (word embeddings). Αρχικά, γίνεται αναδρομή της προόδου του επιστημονικού πεδίου της Ανάλυσης Συναισθήματος (Sentiment Analysis). Στη συνέχεια καταγράφονται και συγκρίνονται οι σημαντικότερες προσεγγίσεις, οι οποίες έχουν προταθεί για την επίλυση του προβλήματος. Ιδιαίτερη σημασία δίνεται στην αναζωπύρωση της έρευνας στα ΤΝΔ και παρουσιάζονται οι σημαντικότερες αρχιτεκτονικές ΤΝΔ, οι οποίες έχουν εφαρμοστεί στην Ανάλυσης Συναισθήματος. Επιπλέον, γίνεται σύγκριση των ΤΝΔ με τις παραδοσιακές τεχνικές μηχανικής μάθησης και παρουσιάζονται επιχειρήματα υπέρ της καταλληλότητάς τους σε προβλήματα ΕΦΓ. Ακόμη, για την καλύτερη προετοιμασία των μηνυμάτων του Twitter ως είσοδο στα μοντέλα μηχανικής μάθησης, αναπτύχθηκε ένα εργαλείο προ-επεξεργασίας κειμένων. Το εργαλείο αυτό είναι ικανό να αναγνωρίσει και να επεξεργαστεί κείμενα από κοινωνικά δίκτυα, στα οποία υπάρχουν αρκετά ορθογραφικά, συντακτικά και γραμματικά λάθη, καθώς και γενικότερα “δημιουργική” γραφή. Μερικές από τις δυνατότητες του εργαλείου είναι, λεκτική ανάλυση, ορθογραφική διόρθωση και κανονικοποίηση λέξεων και φράσεων. Τέλος, στα πλαίσια της έρευνας για την εργασία, συμμετείχαμε στον διεθνή διαγωνισμό σημασιολογικής αξιολόγησης Semeval-2017. Τα μοντέλα του διαγωνισμού είναι το ουσιαστικό αποτέλεσμα της έρευνάς μου. Γίνεται αναλυτική παρουσίαση των σχετικών μοντέλων και δίνονται θεωρητικά επιχειρήματα για την καταλληλότητα της τελικής προσέγγισης. Τα μοντέλα που αναπτύχθηκαν ήταν ιδιαίτερα ανταγωνιστικά, πετυχαίνοντας την πρώτη θέση στο Task 4:“Sentiment Analysis in Twitter” και τη δεύτερη θέση στο Task 6: “#HashtagWars: Learning a Sense of Humor” του Semeval-2017.el
dc.format.extent130el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.titleΑνάλυση συναισθήματος στο twitter με βαθιά νευρωνικά δίκτυαel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENSentiment analysis is an area in Natural Language Processing (NLP), studying the identification and quantification of the sentiment expressed in text. The thesis addresses the problem of predicting the sentiment of messages from Twitter microblogging service. The task is approached using Artificial Neural Networks (ANN), utilizing distributed text representations (word embeddings). Firstly, a survey of the field of sentiment analysis is performed. Next, the most important approaches for addressing the problem are reviewed. Special focus is given to the resurgence of research in ANNs. Τhe most common ANN architectures, which have been applied to sentiment analysis, are presented. Furthermore, a comparison is being made between ANNs with the more traditional machine learning approaches, providing theoretical justifications for choosing ANNs for modeling natural language. Moreover, a text pre-processing tool was developed, for preparing the Twitter messages before passing them as inputs to the machine learning models. The tool is geared towards texts from social networks, which are very challenging to deal with, because of their informal and “creative” writing style, with improper use of grammar, figurative language, misspellings and slang. The text processing tool, is able to utilize most of the information in text, performing sentiment-aware tokenization, spell correction, word normalization, word segmentation (for splitting hashtags) and word annotation. Finally, in the context of my research, we participated in Semeval-2017, which is an international competition for semantic evaluation of computational semantic analysis systems. The models that were developed for the participation in Semeval, were essentially the result of my research. A thorough analysis of these models is given, along with the rationale behind each design decision. The models were very competitive, achieving the first place in Task 4:“Sentiment Analysis in Twitter” and the second place in Task 6: “#HashtagWars: Learning a Sense of Humor”.el
dc.contributor.masterΠροηγμένα Συστήματα Πληροφορικήςel
dc.subject.keywordΑνάλυση συναισθήματοςel
dc.subject.keywordΕξόρυξη γνώμηςel
dc.subject.keywordΕπεξεργασία φυσικής γλώσσαςel
dc.subject.keywordΚατηγοριοποίηση κειμένωνel
dc.subject.keywordΜηχανική μάθησηel
dc.subject.keywordΤεχνητά νευρωνικά δίκτυαel
dc.subject.keywordΒαθιά νευρωνικά δίκτυαel
dc.subject.keywordSentiment analysisel
dc.subject.keywordOpinion miningel
dc.subject.keywordNatural language processingel
dc.subject.keywordText classificationel
dc.subject.keywordMachine learningel
dc.subject.keywordArtificial neural networksel
dc.subject.keywordDeep neural networksel
dc.date.defense2017-09


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»