Ανάλυση συναισθημάτων σε πλατφόρμες κοινωνικών δικτύων μέσω τεχνικών επεξεργασίας φυσικής γλώσσας
Sentiment analysis in social media platforms through NLP techniques

Bachelor Dissertation
Συγγραφέας
Καγκλή, Αικατερίνη
Ημερομηνία
2025-06Επιβλέπων
Σωτηρόπουλος, ΔιονύσιοςΠροβολή/ Άνοιγμα
Λέξεις κλειδιά
Ανάλυση συναισθημάτων ; Transformers ; BERT ; Κοινωνικά δίκτυα ; Πολυετικετική ταξινόμηση ; Μηχανική μάθηση ; Βαθιά μάθηση ; Sentiment analysis ; Social media ; Multilabel classification ; Machine learning ; Deep learning ; Επεξεργασία φυσικής γλώσσας ; Natural language processingΠερίληψη
Η ανάλυση συναισθημάτων στα κοινωνικά δίκτυα έχει εξελιχθεί σε ένα θεμελιώδες εργαλείο για την
παρατήρηση της κοινής γνώμης και των κοινωνικών τάσεων σε διάφορους τομείς όπως οι επιχειρήσεις, η
υγειονομική περίθαλψη και η πολιτική. Η παρούσα προπτυχιακή διατριβή εξετάζει την
αποτελεσματικότητα της βαθιάς μάθησης βασισμένη σε μετασχηματιστές(transformers) και συγκεκριμένα
εστιάζει στο μοντέλο BERT(Bidirectional Encoder Representations from Transformers), για την
ταξινόμηση συναισθημάτων σε κείμενο προερχόμενο από κοινωνικά δίκτυα. Χρησιμοποιώντας την βάση
δεδομένων GoEmotions, η οποία αποτελείται από σχόλια του κοινωνικού δικτύου Reddit ταξινομημένα σε
28 διαφορετικά συναισθήματα, αναπτύσσεται και αξιολογείται ένα ολοκληρωμένο μοντέλο ανίχνευσης
συναισθημάτων πολλαπλών ετικετών.
Η μέθοδος περιλαμβάνει αυστηρή προ-επεξεργασία δεδομένων, στρατηγικές για αντιμετώπιση της
ανισορροπίας των ετικετών και συστηματική βελτιστοποίηση υπερπαραμέτρων για την τελειοποίηση του
μοντέλου BERT για την ταξινόμηση συναισθημάτων πολλαπλών ετικετών. Τα πειραματικά αποτελέσματα
υποδεικνύουν πως η απόδοση του μοντέλου, όπως μετράται με micro και macro βαθμολογίες F1 και τη
συνολική ακρίβεια, βελτιώνεται ουσιαστικά με αυξημένα δεδομένα και εκτεταμένη διάρκεια εκπαίδευσης.
Η ανάλυση των σφαλμάτων υπογραμμίζει περεταίρω τις επίμονες προκλήσεις συμπεριλαμβανομένης της
ανισορροπίας ετικετών και του εντοπισμού διφορούμενων ή επικαλυπτόμενων συναισθηματικών
εκφράσεων.
Για την αξιολόγηση της δυνατότητας εφαρμογής στον πραγματικό κόσμο, το εκπαιδευμένο μοντέλο
δοκιμάζεται σε σύγχρονα δεδομένα από το X (πρώην Twitter), επιτρέποντας την παρακολούθηση
συναισθημάτων σε ζωντανές ροές μέσων κοινωνικής δικτύωσης. Τα ευρήματα υπογραμμίζουν τόσο τους
πιθανούς όσο και τους τρέχοντες περιορισμούς των προσεγγίσεων βαθιάς μάθησης για την ανάλυση
συναισθημάτων σε θορυβώδες κείμενο που δημιουργείται από τον χρήστη. Παρέχονται συστάσεις για
μελλοντική έρευνα, συμπεριλαμβανομένων προηγμένων τεχνικών ανισορροπίας των δεδομένων, την
ενίσχυση της προσαρμογής του τομέα και την αντιμετώπιση ηθικών ζητημάτων που σχετίζονται με την
αναγνώριση συναισθημάτων μεγάλης κλίμακας.