dc.contributor.advisor | Σωτηρόπουλος, Διονύσιος | |
dc.contributor.author | Καγκλή, Αικατερίνη | |
dc.date.accessioned | 2025-07-11T09:54:01Z | |
dc.date.available | 2025-07-11T09:54:01Z | |
dc.date.issued | 2025-06 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17939 | |
dc.description.abstract | Η ανάλυση συναισθημάτων στα κοινωνικά δίκτυα έχει εξελιχθεί σε ένα θεμελιώδες εργαλείο για την
παρατήρηση της κοινής γνώμης και των κοινωνικών τάσεων σε διάφορους τομείς όπως οι επιχειρήσεις, η
υγειονομική περίθαλψη και η πολιτική. Η παρούσα προπτυχιακή διατριβή εξετάζει την
αποτελεσματικότητα της βαθιάς μάθησης βασισμένη σε μετασχηματιστές(transformers) και συγκεκριμένα
εστιάζει στο μοντέλο BERT(Bidirectional Encoder Representations from Transformers), για την
ταξινόμηση συναισθημάτων σε κείμενο προερχόμενο από κοινωνικά δίκτυα. Χρησιμοποιώντας την βάση
δεδομένων GoEmotions, η οποία αποτελείται από σχόλια του κοινωνικού δικτύου Reddit ταξινομημένα σε
28 διαφορετικά συναισθήματα, αναπτύσσεται και αξιολογείται ένα ολοκληρωμένο μοντέλο ανίχνευσης
συναισθημάτων πολλαπλών ετικετών.
Η μέθοδος περιλαμβάνει αυστηρή προ-επεξεργασία δεδομένων, στρατηγικές για αντιμετώπιση της
ανισορροπίας των ετικετών και συστηματική βελτιστοποίηση υπερπαραμέτρων για την τελειοποίηση του
μοντέλου BERT για την ταξινόμηση συναισθημάτων πολλαπλών ετικετών. Τα πειραματικά αποτελέσματα
υποδεικνύουν πως η απόδοση του μοντέλου, όπως μετράται με micro και macro βαθμολογίες F1 και τη
συνολική ακρίβεια, βελτιώνεται ουσιαστικά με αυξημένα δεδομένα και εκτεταμένη διάρκεια εκπαίδευσης.
Η ανάλυση των σφαλμάτων υπογραμμίζει περεταίρω τις επίμονες προκλήσεις συμπεριλαμβανομένης της
ανισορροπίας ετικετών και του εντοπισμού διφορούμενων ή επικαλυπτόμενων συναισθηματικών
εκφράσεων.
Για την αξιολόγηση της δυνατότητας εφαρμογής στον πραγματικό κόσμο, το εκπαιδευμένο μοντέλο
δοκιμάζεται σε σύγχρονα δεδομένα από το X (πρώην Twitter), επιτρέποντας την παρακολούθηση
συναισθημάτων σε ζωντανές ροές μέσων κοινωνικής δικτύωσης. Τα ευρήματα υπογραμμίζουν τόσο τους
πιθανούς όσο και τους τρέχοντες περιορισμούς των προσεγγίσεων βαθιάς μάθησης για την ανάλυση
συναισθημάτων σε θορυβώδες κείμενο που δημιουργείται από τον χρήστη. Παρέχονται συστάσεις για
μελλοντική έρευνα, συμπεριλαμβανομένων προηγμένων τεχνικών ανισορροπίας των δεδομένων, την
ενίσχυση της προσαρμογής του τομέα και την αντιμετώπιση ηθικών ζητημάτων που σχετίζονται με την
αναγνώριση συναισθημάτων μεγάλης κλίμακας. | el |
dc.format.extent | 99 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Ανάλυση συναισθημάτων σε πλατφόρμες κοινωνικών δικτύων μέσω τεχνικών επεξεργασίας φυσικής γλώσσας | el |
dc.title.alternative | Sentiment analysis in social media platforms through NLP techniques | el |
dc.type | Bachelor Dissertation | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | The analysis of sentiment and emotion in social media content has become an essential tool for gauging
public opinion and societal trends across diverse domains such as business, healthcare, and politics. This
dissertation examines the effectiveness of transformer-based deep learning models, with a particular
focus on BERT (Bidirectional Encoder Representations from Transformers), for the task of fine-grained
emotion classification in social media text. Utilizing the GoEmotions dataset, which consists of Reddit
comments annotated with 28 distinct emotion categories, a comprehensive multi-label emotion detection
pipeline is developed and evaluated.
The methodology encompasses rigorous data preprocessing, strategies for addressing class imbalance,
and systematic hyperparameter optimization to fine-tune BERT for multi-label emotion classification.
Experimental results indicate that model performance, as measured by micro and macro F1 scores and
overall accuracy, improves substantially with increased training data and extended training duration. Error
analysis further highlights persistent challenges, including class imbalance and the detection of
ambiguous or overlapping emotional expressions.
To assess real-world applicability, the trained model is deployed on contemporary X data(previously
known as Twitter), enabling emotion monitoring within live social media streams. The findings underscore
both the potential and current limitations of deep learning approaches for emotion analysis in noisy, user
generated text. Recommendations are provided for future research, including advanced techniques for
managing data imbalance, enhancing domain adaptation, and addressing ethical considerations
associated with large-scale emotion recognition. | el |
dc.subject.keyword | Ανάλυση συναισθημάτων | el |
dc.subject.keyword | Transformers | el |
dc.subject.keyword | BERT | el |
dc.subject.keyword | Κοινωνικά δίκτυα | el |
dc.subject.keyword | Πολυετικετική ταξινόμηση | el |
dc.subject.keyword | Μηχανική μάθηση | el |
dc.subject.keyword | Βαθιά μάθηση | el |
dc.subject.keyword | Sentiment analysis | el |
dc.subject.keyword | Social media | el |
dc.subject.keyword | Multilabel classification | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Deep learning | el |
dc.subject.keyword | Επεξεργασία φυσικής γλώσσας | el |
dc.subject.keyword | Natural language processing | el |
dc.date.defense | 2025-06-20 | |