Εμφάνιση απλής εγγραφής

Natural language processing and text classification with Bert & BiLSTM model

dc.contributor.advisorSotiropoulos, Dionisios
dc.contributor.advisorΣωτηρόπουλος, Διονύσιος
dc.contributor.authorTouloupis, Ioannis
dc.date.accessioned2024-11-05T17:36:58Z
dc.date.available2024-11-05T17:36:58Z
dc.date.issued2024-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/16979
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/4401
dc.description.abstractΑυτή η διπλωματική εργασία αναφέρεται στην αρχιτεκτονική των μοντέλων βαθιάς μάθησης. Αυτό επιτυγχάνεται με τη χρήση μοντέλων βαθιάς μάθησης για την ταξινόμηση των tweets που σχετίζονται με τον Covid-19 σε τρεις διαφορετικές κατηγορίες. Η πρώτη κατηγορία αφορά tweets που είναι υπέρ του εμβολιασμού, συμφωνούν και εφαρμόζουν μεθόδους προστασίας κατά του ιού. Η δεύτερη κατηγορία αφορά tweets που είναι κατά του εμβολιασμού και προωθούν θεωρίες συνωμοσίας. Η τρίτη κατηγορία αφορά tweets που έχουν ουδέτερη στάση. Συγκεκριμένα, για την επίλυση του παραπάνω προβλήματος, συλλέχθηκε ένας αριθμός tweets ώστε να εκπαιδεύσουμε τα δύο μοντέλα βαθιάς μάθησης που χρησιμοποιούμε, ένα Δικτυακό Μοντέλο Bidirectional LSTM και ένα μοντέλο Bert. Αυτά τα μοντέλα θα αναλυθούν και θα εξηγηθούν βήμα-βήμα, και ταυτόχρονα θα δοθεί έμφαση σε κάποιες διαφορές μεταξύ τους. Για να εκπαιδεύσουμε αυτά τα μοντέλα, έπρεπε πρώτα να συλλέξουμε και να κατηγοριοποιήσουμε τα tweets. Κατά τη διάρκεια αυτού του βήματος χρειάστηκε να βρούμε μια νέα μέθοδο συλλογής λόγω αλλαγών στην πολιτική του Twitter. Επιπλέον, θα παρουσιάσουμε την προετοιμασία αυτών των tweets ώστε τα μοντέλα να μπορούν να τα δεχθούν και να τα χρησιμοποιήσουν για εκπαίδευση με τον καλύτερο δυνατό τρόπο. Η όλη προετοιμασία και η διαδικασία περιγράφονται λεπτομερώς παρακάτω, ενώ στο τέλος παρουσιάζονται τα αποτελέσματα και οι παρατηρήσεις σχετικά με τα μοντέλα.el
dc.format.extent72el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/gr/*
dc.titleNatural language processing and text classification with Bert & BiLSTM modelel
dc.title.alternativeΕπεξεργασία φυσικής γλώσσας και ταξινόμηση κειμένων με μοντέλο Bert & BiLSTMel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENThis thesis refers to the architecture of deep learning models . This is accomplished by using the deep learning models to classify tweets related to Covid-19 to three different categories. The first category as tweets which are in favor of vaccination, agree and implement methods of protection against the virus. The second category as tweets which are against the vaccination and promote conspiracy theories. The third category as tweets which they have a neutral stance. Specifically, to solve the problem above they have been collected a number of tweets so we can train the two deep learning models we are using, a Bidirectional LSTM and a Bert model. These models are going to be analyzed and explained through every step and at the same time we will emphasize some differences between those two models. To train these models we have firstly to collect those tweets and categorize them, also during this step we had to find another collection method due to twitter policy changes. In addition, we will present the preparation of those tweets so that the models can accept them and use them to train as best as possible. The whole preparation and the process is described in detail later on and the results and any observations of the models at the end.el
dc.subject.keywordBiLSTMel
dc.subject.keywordBertel
dc.subject.keywordTransformersel
dc.subject.keywordTweetsel
dc.subject.keywordCOVID-19el
dc.subject.keywordOptimizersel
dc.subject.keywordTrainingel
dc.subject.keywordMachine learning modelel
dc.date.defense2024-09-30


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»