Show simple item record

Ταξινόμηση κειμένου πολιτικού λόγου με τεχνολογίες BERT

dc.contributor.advisorΣωτηρόπουλος, Διονύσιος
dc.contributor.authorΣταυράκης, Νικόλαος
dc.date.accessioned2025-03-31T06:07:49Z
dc.date.available2025-03-31T06:07:49Z
dc.date.issued2025-02
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/17589
dc.description.abstractΗ ταξινόμηση κειμένου, ως έργο επεξεργασίας της φυσικής γλώσσας, έχει αποτελέσει ένα δημοφιλές και ενδιαφέρον πεδίο στον τομέα της μηχανικής μάθησης. Με την πάροδο των χρόνων, παρατηρείται ανοδική πορεία στο πώς, με την αξιοποίηση δικτύων μηχανικής, αλλά και βαθιάς μάθησης, μπορεί να διεκπεραιωθεί ανάλυση σε σύνθετα κείμενα. Η παρούσα πτυχιακή εργασία έχει στόχο τη δημιουργία ενός ταξινομητή για κείμενα που προέρχονται από αμερικανικό πολιτικό λόγο, με την ικανότητα να εφαρμόζει δυαδική ταξινόμηση, που αφορά στις κλάσεις δημοκρατικού ή ρεπουμπλικανικού λόγου. Οι αλγόριθμοι βαθιάς μάθησης BERT αποτελούν ιδανικά μοντέλα που προσαρτούν γλωσσικές δυνατότητες. Με την αρχιτεκτονική τους να θεμελιώνεται στα δίκτυα μετασχηματιστών, γνωρίζουν αποτελεσματικότητα στην επεξεργασία φυσικής γλώσσας, και για την επίτευξη του στόχου μας αρκεί η προσαρμογή ενός μοντέλου, αυτής της οικογενειας, στα κειμενικά δεδομένα που συλλέξαμε. Με την αποπεράτωση δύο ανεξάρτητων πειραμάτων διαφορετικών παραμέτρων ερευνάται η επιτυχία αυτής της διαδικασίας.el
dc.format.extent55el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/gr/*
dc.titleΤαξινόμηση κειμένου πολιτικού λόγου με τεχνολογίες BERTel
dc.title.alternativeText classification of political speech with BERTel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENText classification, as a natural language processing task, has been a popular and interesting field of Machine Learning. Over the years, there has been a significant advancement in how the analysis of complex texts can be conducted with the utilization of machine and deep learning networks. This thesis aims to develop a classifier for texts, coming from American political speech, capable of performing binary classification to the classes of democratic or republican speech. BERT deep learning algorithms are ideal models that incorporate linguistic capabilities. With their architecture based on transformers networks, they have effectiveness in processing natural language. To achieve our goal, we adapt a model from this family to the text data we have collected. By conducting two independent experiments with different parameters, the success of this process is tested.el
dc.subject.keywordΕπεξεργασία φυσικής γλώσσαςel
dc.subject.keywordΔιαδική ταξινόμησηel
dc.subject.keywordΒαθιά μάθησηel
dc.subject.keywordBERTel
dc.subject.keywordΚλάσεις δημοκρατικού - ρεπουμπλικανικού λόγουel
dc.date.defense2025-02-06


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»