Εντοπισμός και ανάλυση ψευδών ειδησεογραφικών άρθρων με χρήση βαθέων τεχνητών νευρωνικών δικτύων και μοντελοποίησης θεμάτων
Fake news detection and analysis using artificial neural networks and latent topic analysis
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Εντοπισμός ψευδών ειδήσεων ; Μοντελοποίηση θεμάτων ; Βαθιά μάθηση ; LDA ; LSTM ; TensorflowΠερίληψη
Το πρόβλημα της διασποράς ψευδών ειδήσεων έχει λάβει μεγάλες διαστάσεις στην διαδικτυακή εποχή και ανά περίσταση διώκεται ποινικά. Οι πληροφορίες μπορούν να διαδίδονται χωρίς κάποιο φίλτρο αξιοπιστίας της πληροφόρησης, γεγονός που ενέχει κινδύνους ανάλογα με την απήχηση και τους αποδέκτες, ειδικά όταν αφορά σε σοβαρά ζητήματα όπως δημόσιας υγείας και ασφάλειας. Ο όγκος των πληροφοριών και η ταχύτητα μετάδοσής τους καθιστούν σχεδόν ανέφικτη την έγκαιρη ανάλυσή τους χωρίς την χρήση νέων τεχνολογιών.
Η παρούσα μελέτη πραγματεύεται το πρόβλημα του εντοπισμού των ψευδών ειδησεογραφικών άρθρων με χρήση βαθέων τεχνητών νευρωνικών δικτύων Long Short-Term Memory. Στα ειδησεογραφικά άρθρα εφαρμόζεται επιπρόσθετη σημασιολογική ανάλυση με τεχνικές επεξεργασίας της φυσικής γλώσσας και μοντελοποίησης θεμάτων, σε μία προσέγγιση αναζήτησης και σύγκρισης μοτίβων στις θεματολογίες των ψευδών και αληθών άρθρων. Για τις ανάγκες του πειράματος χρησιμοποιήθηκαν τέσσερεις συλλογές πραγματικών δημοσιευμάτων που αγγίζουν τις 60.000 εγγραφές και δύο συλλογές για τον έλεγχο των τελικών μοντέλων. Σκιαγραφείται το απαραίτητο θεωρητικό υπόβαθρο που πλαισιώνεται από τους τομείς της μηχανικής μάθησης και της επιστήμης δεδομένων. Η παρουσίαση της μεθοδολογίας και της υλοποίησης του πειράματος ακολουθείται από την ανάλυση των αποτελεσμάτων. Συμπερασματικά διατυπώνονται παρατηρήσεις και μελλοντικές βελτιώσεις.