dc.contributor.advisor | Σωτηρόπουλος, Διονύσιος | |
dc.contributor.author | Σταυράκης, Νικόλαος | |
dc.date.accessioned | 2025-03-31T06:07:49Z | |
dc.date.available | 2025-03-31T06:07:49Z | |
dc.date.issued | 2025-02 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17589 | |
dc.description.abstract | Η ταξινόμηση κειμένου, ως έργο επεξεργασίας της φυσικής γλώσσας, έχει αποτελέσει ένα
δημοφιλές και ενδιαφέρον πεδίο στον τομέα της μηχανικής μάθησης. Με την πάροδο των χρόνων,
παρατηρείται ανοδική πορεία στο πώς, με την αξιοποίηση δικτύων μηχανικής, αλλά και βαθιάς
μάθησης, μπορεί να διεκπεραιωθεί ανάλυση σε σύνθετα κείμενα.
Η παρούσα πτυχιακή εργασία έχει στόχο τη δημιουργία ενός ταξινομητή για κείμενα που
προέρχονται από αμερικανικό πολιτικό λόγο, με την ικανότητα να εφαρμόζει δυαδική ταξινόμηση,
που αφορά στις κλάσεις δημοκρατικού ή ρεπουμπλικανικού λόγου.
Οι αλγόριθμοι βαθιάς μάθησης BERT αποτελούν ιδανικά μοντέλα που προσαρτούν γλωσσικές
δυνατότητες. Με την αρχιτεκτονική τους να θεμελιώνεται στα δίκτυα μετασχηματιστών, γνωρίζουν
αποτελεσματικότητα στην επεξεργασία φυσικής γλώσσας, και για την επίτευξη του στόχου μας
αρκεί η προσαρμογή ενός μοντέλου, αυτής της οικογενειας, στα κειμενικά δεδομένα που
συλλέξαμε. Με την αποπεράτωση δύο ανεξάρτητων πειραμάτων διαφορετικών παραμέτρων
ερευνάται η επιτυχία αυτής της διαδικασίας. | el |
dc.format.extent | 55 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-sa/3.0/gr/ | * |
dc.title | Ταξινόμηση κειμένου πολιτικού λόγου με τεχνολογίες BERT | el |
dc.title.alternative | Text classification of political speech with BERT | el |
dc.type | Bachelor Dissertation | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | Text classification, as a natural language processing task, has been a popular and interesting field
of Machine Learning. Over the years, there has been a significant advancement in how the
analysis of complex texts can be conducted with the utilization of machine and deep learning
networks.
This thesis aims to develop a classifier for texts, coming from American political speech, capable
of performing binary classification to the classes of democratic or republican speech.
BERT deep learning algorithms are ideal models that incorporate linguistic capabilities. With their
architecture based on transformers networks, they have effectiveness in processing natural
language. To achieve our goal, we adapt a model from this family to the text data we have
collected. By conducting two independent experiments with different parameters, the success of
this process is tested. | el |
dc.subject.keyword | Επεξεργασία φυσικής γλώσσας | el |
dc.subject.keyword | Διαδική ταξινόμηση | el |
dc.subject.keyword | Βαθιά μάθηση | el |
dc.subject.keyword | BERT | el |
dc.subject.keyword | Κλάσεις δημοκρατικού - ρεπουμπλικανικού λόγου | el |
dc.date.defense | 2025-02-06 | |