Fact checking with large language models

Koufopoulos, Ioannis - Aris; Κουφόπουλος, Ιωάννης - Άρης

dc.contributor.advisor	Papastefanatos, George
dc.contributor.advisor	Παπαστεφανάτος, Γεώργιος
dc.contributor.author	Koufopoulos, Ioannis - Aris
dc.contributor.author	Κουφόπουλος, Ιωάννης - Άρης
dc.date.accessioned	2024-09-19T09:12:07Z
dc.date.available	2024-09-19T09:12:07Z
dc.date.issued	2024-07
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/16763
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/4185
dc.description.abstract	Η πρόσφατη αυξημένη εξάπλωση της παραπληροφόρησης έχει διεγείρει την έρευνα γύρω από τον τομέα της επαλήθευσης γεγονότων, ο οποίος τομέας ορίζεται ως η διαδικασία αξιολόγησης της αλήθειας ενός ισχυρισμού. Ενώ οι αυτοματοποιημένες διαδικασίες επαλήθευσης γεγονότων έχουν δει αυξανόμενο ενδιαφέρον τα τελευταία χρόνια, η ταχεία ανάπτυξη τεχνολογιών που μπορούν να χρησιμοποιηθούν για την υποβοήθηση της αυτόματης διαδικασίας, έχουν ανοίξει τον δρόμο για την αναθεώρηση των τρεχουσών μεθόδων και προσεγγίσεων. Οι ταχείες εξελίξεις στον τομέα της βαθιάς μάθησης, μαζί με την εμφάνιση των μεγάλων γλωσσικών μοντέλων (LLMs) έχουν παραγάγει διάφορες τεχνικές που μπορούν να αντικαταστήσουν επιτυχώς τις παραδοσιακές προσεγγίσεις επεξεργασίας φυσικής γλώσσας (NLP). Επομένως, για τους σκοπούς αυτής της διατριβής, θα χρησιμοποιήσουμε μια ήδη υπάρχουσα διαδικασία επαλήθευσης γεγονότων και θα αντικαταστήσουμε τις περισσότερες από τις μεθόδους της μεσύγχρονες αρχιτεκτονικές όπως μοντέλων ενσωμάτωσης κειμένου, που βρίσκονται συνήθως στα LLMs. Επιπλέον, θα επεκτείνουμε το σύνολο δεδομένων που δημιουργήθηκε για την αποθήκευση ισχυρισμών στην ελληνική γλώσσα και θα αντικαταστήσουμε τα μοντέλα ταξινόμησης που χρησιμοποιήθηκαν για την παραγωγή μιας απόφασης, με μοντέρνα νευρωνικά δίκτυα. Τα αποτελέσματα αυτής της διατριβής απέδειξαν ότι η προσέγγισή μας παράγει πολύ υποσχόμενα αποτελέσματα σε πολλές περιπτώσεις, συχνά φτάνοντας, και ξεπερνώντας τα αποτελέσματα που αφορούν την ακρίβεια και που παράγονται από παραδοσιακές τεχνικές NLP. Επιπλέον, η μεθοδολογία μας παρέχει σημαντικές ευκαιρίες για περαιτέρω βελτίωση, καθώς η τελική διαδικασία που καθιερώσαμε είναι ιδιαίτερα προσαρμόσιμη και παρέχει ένα γόνιμο έδαφος για επιπλέον πειραματισμό — είτε με την περαιτέρω διεύρυνση του συνόλου δεδομένων είτε με την εισαγωγή πιο αποτελεσματικών μοντέλων ενσωμάτωσης κειμένου που μπορεί να παραχθούν στο μέλλον, και μοντέλων ταξινόμησης με διαφορετικές αρχιτεκτονικές που είναι πιο αξιόπιστες στην ανίχνευση προτύπων.	el
dc.format.extent	73	el
dc.language.iso	en	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.title	Fact checking with large language models	el
dc.title.alternative	Έλεγχος γεγονότων με την χρήση μεγάλων γλωσσικών μοντέλων	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής	el
dc.description.abstractEN	The recently increased focus on misinformation has stimulated research in fact checking, the task of assessing the truthfulness of a claim. While automated fact checking pipelines have seen a growing interest over the past few years, the rapid development of technologies that can be utilized to aid the automated pipeline, have paved the way for the revision of the current methods and approaches. The swift advancements in the field of deep learning, along with the emergence of the large language models (LLMs) have produced various techniques that can successfully replace traditional natural language processing (NLP) approaches. Thus, for the purposes of this thesis, we will employ an already established fact checking pipeline, and replace most of its methods with modern architectures, such as text embedding models, that are commonly found in LLMs. Furthermore, we will expand the dataset that was constructed for the purpose of storing Greek language statements and replace the classification models that were utilized to produce a verdict, with cutting-edge neural networks. The results of this dissertation proved that our approach produces very promising results in many cases, often reaching and surpassing the accuracy results produced by traditional NLP techniques. Furthermore, our methodology allows for considerable opportunities for further enchantment, since the final pipeline that we established is highly customisable and provides a breeding ground for additional experimentation—either by further enlarging the dataset or by introducing more effective text embedding models that may be produced in the future, and classification models with different architectures that are more reliable in capturing patterns.	el
dc.corporate.name	Ερευνητικό κέντρο ΑΘΗΝΑ	el
dc.contributor.master	Κυβερνοασφάλεια και Επιστήμη Δεδομένων	el
dc.subject.keyword	Μεγάλα γλωσσικά μοντέλα	el
dc.subject.keyword	Αυτόματη επαλήθευση γεγονότων	el
dc.subject.keyword	Μοντέλα ενσωμάτωσης κειμένου	el
dc.subject.keyword	Ελληνικό σύνολο δεδομένων επαλήθευσης ισχυρισμών	el
dc.date.defense	2024-07-16

Files in this item

Name:: Koufopoulos_2214.pdf
Size:: 2.752Mb
Format:: PDF
Description:: Master thesis

View/Open

This item appears in the following Collection(s)

Τμήμα Πληροφορικής
Department of Informatics

Show simple item record

Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα