dc.contributor.advisor | Σωτηρόπουλος, Διονύσιος | |
dc.contributor.author | Τσελέντης, Σπυρίδων | |
dc.date.accessioned | 2025-06-03T05:56:54Z | |
dc.date.available | 2025-06-03T05:56:54Z | |
dc.date.issued | 2025-05 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17813 | |
dc.description.abstract | Με εφαρμογές στην εταιρική πληροφόρηση, την επιτήρηση των μέσων κοινωνικής δικτύωσης, την πολιτική ανάλυση και την υγειονομική περίθαλψη, η ανάλυση συναισθήματος είναι ένα σημαντικό πεδίο μελέτης στην επεξεργασία φυσικής γλώσσας (NLP), με την παρούσα μελέτη να διερευνά την αποτελεσματικότητα της κατηγοριοποίησης συναισθήματος με βάση τη βαθιά μάθηση χρησιμοποιώντας το μοντέλο BERT, δίνοντας έμφαση σε σύνολα δεδομένων κινηματογραφικών κριτικών. Παρόλο που έχουν δείξει αξιοσέβαστες επιδόσεις, οι παραδοσιακές τεχνικές ανάλυσης συναισθήματος, όπως οι τεχνικές Naïve Bayes και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM), δυσκολεύονται να χειριστούν περίπλοκες γλωσσικές δομές και εξαρτώμενες από το πλαίσιο μετατοπίσεις στάσεων, με την ακρίβεια της ταξινόμησης κειμένου να έχει αυξηθεί σημαντικά από τις πρόσφατες εξελίξεις στις αρχιτεκτονικές που βασίζονται σε μετασχηματιστές, ιδίως το BERT, χρησιμοποιώντας μηχανισμούς αυτοπροσοχής και καταγράφει το αμφίδρομο πλαίσιο.
Στην παρούσα διατριβή παρουσιάζεται μια μέθοδος για την κατηγοριοποίηση συναισθήματος, ξεκινώντας από τη συλλογή και προετοιμασία δεδομένων, με το κύριο σύνολο δεδομένων που χρησιμοποιείται να αποτελεί το σύνολο δεδομένων IMDB, ένα δημοφιλές σημείο αναφοράς για την ανάλυση συναισθήματος. Η τοκενικοποίηση, η εξάλειψη διακοπτόμενων λέξεων και η λημματοποίηση είναι τεχνικές προεπεξεργασίας που χρησιμοποιούνται για τη βελτίωση της κειμενικής εισόδου για τα μοντέλα βαθιάς μάθησης, με την μελέτη να παρουσιάζει και να αντιπαραβάλλει διάφορες μεθοδολογίες μηχανικής μάθησης και βαθιάς μάθησης προκειμενου να καταδειχθεί η υπεροχή των μοντέλων που βασίζονται σε μετασχηματιστές έναντι των συμβατικών προσεγγίσεων.
Σύμφωνα με τα πειραματικά αποτελέσματα, το BERT υπερτερεί έναντι των επαναλαμβανόμενων νευρωνικών δικτύων και των παραδοσιακών τεχνικών μηχανικής μάθησης στην κατηγοριοποίηση συναισθημάτων, επιτυγχάνοντας εξαιρετική ακρίβεια και ανθεκτικότητα, με την αυξημένη ακρίβεια, την ανάκληση και την βαθμολογία F1 του μοντέλου να είναι αποτέλεσμα της ικανότητάς του να συλλαμβάνει σύνθετες εκφράσεις συναισθήματος, επισημαίνοντας όμως και αρκετά σημαντικά μειονεκτήματα, παρά τα πλεονεκτήματά του όπως θέματα ερμηνευσιμότητας, υπολογιστική πολυπλοκότητα και εξάρτηση από τεράστια σύνολα δεδομένων.
Τα αποτελέσματα αυτής της μελέτης αναδεικνύουν τις δυνατότητες των σχεδίων που βασίζονται σε μετασχηματιστές για εφαρμογές ανάλυσης συναισθήματος στον πραγματικό κόσμο, με την μελλοντική έρευνα να εξετάζει στρατηγικές για την υπέρβαση των σημερινών περιορισμών, όπως η ενσωμάτωση πολυτροπικής ανάλυσης συναισθήματος συνδυάζοντας δεδομένα φωνής και έκφρασης προσώπου, η βελτίωση της ερμηνευσιμότητας με προσεγγίσεις οπτικοποίησης της προσοχής και η αύξηση της ταχύτητας εξαγωγής συμπερασμάτων μέσω της απόσταξης μοντέλων, με την επίλυσή τους πιθανόν να επιτρέπει να γίνουν τα μοντέλα κατηγοριοποίησης συναισθήματος πιο αποτελεσματικά, ευέλικτα και αντιληπτά για μια σειρά χρήσεων. | el |
dc.format.extent | 55 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Πρόβλεψη βαθμολογίας ταινιών από κείμενα κριτικών χρησιμοποιώντας το μοντέλο BERT | el |
dc.title.alternative | Predicting movie ratings from review text using a BERT model | el |
dc.type | Bachelor Dissertation | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | With applications in corporate intelligence, social media monitoring, political analysis, and healthcare, sentiment analysis is a major field of study in natural language processing (NLP). This study investigates the effectiveness of sentiment classification based on deep learning using the BERT model, focusing on movie review datasets. While traditional sentiment analysis techniques such as Naïve Bayes and Support Vector Machines (SVMs) have shown respectable performance, they struggle with complex linguistic structures and context-dependent shifts in sentiment. Text classification accuracy has significantly improved with recent transformer-based architectures, especially BERT, which uses self-attention mechanisms and captures bidirectional context.
This thesis presents a method for sentiment classification, beginning with data collection and preparation. The main dataset used is the IMDB dataset, a popular benchmark for sentiment analysis. Preprocessing techniques like tokenization, stop-word removal, and lemmatization are applied to enhance textual input for deep learning models. The study presents and compares various machine learning and deep learning approaches to demonstrate the superiority of transformer-based models over conventional ones.
According to experimental results, BERT outperforms recurrent neural networks and traditional machine learning techniques in sentiment classification, achieving excellent accuracy and robustness. Its improved precision, recall, and F1-score stem from its ability to capture complex sentiment expressions. However, despite its advantages, BERT has notable limitations, including issues of interpretability, computational complexity, and reliance on large datasets.
The study's findings highlight the potential of transformer-based architectures for real-world sentiment analysis applications. Future research should explore strategies to overcome current limitations, such as integrating multimodal sentiment analysis (combining voice and facial expression data), improving interpretability via attention visualization methods, and increasing inference speed through model distillation. Solving these issues could make sentiment classification models more efficient, adaptable, and understandable for a wide range of uses. | el |
dc.subject.keyword | BERT model | el |
dc.date.defense | 2025-05-26 | |