Εμφάνιση απλής εγγραφής

Ταξινόμηση κειμένου πολιτικού λόγου με τεχνολογίες BERT

dc.contributor.advisorΣωτηρόπουλος, Διονύσιος
dc.contributor.authorΣταυράκης, Νικόλαος
dc.date.accessioned2025-03-31T06:07:49Z
dc.date.available2025-03-31T06:07:49Z
dc.date.issued2025-02
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/17589
dc.description.abstractΗ ταξινόμηση κειμένου, ως έργο επεξεργασίας της φυσικής γλώσσας, έχει αποτελέσει ένα δημοφιλές και ενδιαφέρον πεδίο στον τομέα της μηχανικής μάθησης. Με την πάροδο των χρόνων, παρατηρείται ανοδική πορεία στο πώς, με την αξιοποίηση δικτύων μηχανικής, αλλά και βαθιάς μάθησης, μπορεί να διεκπεραιωθεί ανάλυση σε σύνθετα κείμενα. Η παρούσα πτυχιακή εργασία έχει στόχο τη δημιουργία ενός ταξινομητή για κείμενα που προέρχονται από αμερικανικό πολιτικό λόγο, με την ικανότητα να εφαρμόζει δυαδική ταξινόμηση, που αφορά στις κλάσεις δημοκρατικού ή ρεπουμπλικανικού λόγου. Οι αλγόριθμοι βαθιάς μάθησης BERT αποτελούν ιδανικά μοντέλα που προσαρτούν γλωσσικές δυνατότητες. Με την αρχιτεκτονική τους να θεμελιώνεται στα δίκτυα μετασχηματιστών, γνωρίζουν αποτελεσματικότητα στην επεξεργασία φυσικής γλώσσας, και για την επίτευξη του στόχου μας αρκεί η προσαρμογή ενός μοντέλου, αυτής της οικογενειας, στα κειμενικά δεδομένα που συλλέξαμε. Με την αποπεράτωση δύο ανεξάρτητων πειραμάτων διαφορετικών παραμέτρων ερευνάται η επιτυχία αυτής της διαδικασίας.el
dc.format.extent55el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/gr/*
dc.titleΤαξινόμηση κειμένου πολιτικού λόγου με τεχνολογίες BERTel
dc.title.alternativeText classification of political speech with BERTel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENText classification, as a natural language processing task, has been a popular and interesting field of Machine Learning. Over the years, there has been a significant advancement in how the analysis of complex texts can be conducted with the utilization of machine and deep learning networks. This thesis aims to develop a classifier for texts, coming from American political speech, capable of performing binary classification to the classes of democratic or republican speech. BERT deep learning algorithms are ideal models that incorporate linguistic capabilities. With their architecture based on transformers networks, they have effectiveness in processing natural language. To achieve our goal, we adapt a model from this family to the text data we have collected. By conducting two independent experiments with different parameters, the success of this process is tested.el
dc.subject.keywordΕπεξεργασία φυσικής γλώσσαςel
dc.subject.keywordΔιαδική ταξινόμησηel
dc.subject.keywordΒαθιά μάθησηel
dc.subject.keywordBERTel
dc.subject.keywordΚλάσεις δημοκρατικού - ρεπουμπλικανικού λόγουel
dc.date.defense2025-02-06


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού - Παρόμοια Διανομή 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»