dc.contributor.advisor | Αποστόλου, Δημήτριος | |
dc.contributor.author | Πουρνάρα, Δήμητρα | |
dc.date.accessioned | 2020-10-15T09:09:39Z | |
dc.date.available | 2020-10-15T09:09:39Z | |
dc.date.issued | 2020-10-01 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/12959 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/382 | |
dc.description.abstract | Το πρόβλημα της διασποράς ψευδών ειδήσεων έχει λάβει μεγάλες διαστάσεις στην διαδικτυακή εποχή και ανά περίσταση διώκεται ποινικά. Οι πληροφορίες μπορούν να διαδίδονται χωρίς κάποιο φίλτρο αξιοπιστίας της πληροφόρησης, γεγονός που ενέχει κινδύνους ανάλογα με την απήχηση και τους αποδέκτες, ειδικά όταν αφορά σε σοβαρά ζητήματα όπως δημόσιας υγείας και ασφάλειας. Ο όγκος των πληροφοριών και η ταχύτητα μετάδοσής τους καθιστούν σχεδόν ανέφικτη την έγκαιρη ανάλυσή τους χωρίς την χρήση νέων τεχνολογιών.
Η παρούσα μελέτη πραγματεύεται το πρόβλημα του εντοπισμού των ψευδών ειδησεογραφικών άρθρων με χρήση βαθέων τεχνητών νευρωνικών δικτύων Long Short-Term Memory. Στα ειδησεογραφικά άρθρα εφαρμόζεται επιπρόσθετη σημασιολογική ανάλυση με τεχνικές επεξεργασίας της φυσικής γλώσσας και μοντελοποίησης θεμάτων, σε μία προσέγγιση αναζήτησης και σύγκρισης μοτίβων στις θεματολογίες των ψευδών και αληθών άρθρων. Για τις ανάγκες του πειράματος χρησιμοποιήθηκαν τέσσερεις συλλογές πραγματικών δημοσιευμάτων που αγγίζουν τις 60.000 εγγραφές και δύο συλλογές για τον έλεγχο των τελικών μοντέλων. Σκιαγραφείται το απαραίτητο θεωρητικό υπόβαθρο που πλαισιώνεται από τους τομείς της μηχανικής μάθησης και της επιστήμης δεδομένων. Η παρουσίαση της μεθοδολογίας και της υλοποίησης του πειράματος ακολουθείται από την ανάλυση των αποτελεσμάτων. Συμπερασματικά διατυπώνονται παρατηρήσεις και μελλοντικές βελτιώσεις. | el |
dc.format.extent | 61 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Εντοπισμός και ανάλυση ψευδών ειδησεογραφικών άρθρων με χρήση βαθέων τεχνητών νευρωνικών δικτύων και μοντελοποίησης θεμάτων | el |
dc.title.alternative | Fake news detection and analysis using artificial neural networks and latent topic analysis | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | In the internet era, the spread of fake news has grown and might even lead to legal actions per occasion. The dissemination of information without a prior credibility check on their reliability, combined with their popularity and the targeted audience, may involve risks especially on important issues, such as public health and safety. The increased volume and diffusion speed of the information makes their timely analysis almost impossible except when new technologies are utilized.
This dissertation approaches the problem of fake news detection using Lοng Short-Term Memory deep neural networks. Additional semantic analysis was performed to identify and compare patterns in the topics of fake and real news respectively, using natural language processing and topic modeling techniques. The dataset of the experiment is a combination of four separate datasets constituting a unified set of 60,000 fake and real news articles. Two more datasets were combined to construct the unseen dataset for the finalized models. The theoretical background is discussed covering aspects of machine learning and data science. The representation of the methodologies and the implementation of the models is followed by the research results. In conclusion observations and future improvements are discussed. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Εντοπισμός ψευδών ειδήσεων | el |
dc.subject.keyword | Μοντελοποίηση θεμάτων | el |
dc.subject.keyword | Βαθιά μάθηση | el |
dc.subject.keyword | LDA | el |
dc.subject.keyword | LSTM | el |
dc.subject.keyword | Tensorflow | el |
dc.date.defense | 2020-09-30 | |