Detecting Alzheimer’s disease using NLP methods
Master Thesis
Συγγραφέας
Σαραφίδης, Αναστάσιος
Sarafidis, Anastasios
Ημερομηνία
2023-02Επιβλέπων
Ρεντούμη, ΒασιλικήRentoumi, Vassiliki
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Machine learning ; ADReSS ; Feature engineering ; Alzheimer's disease detection ; Natural language processingΠερίληψη
Η νόσος του Αλτσχάιμερ είναι μία προοδευτική ασθένεια του εγκεφάλου, η οποία δεν μπορεί να θεραπευτεί, αλλά μόνο να επιβραδυνθεί λαμβάνοντας φαρμακευτική αγωγή. Πιθανές γλωσσικές διαφοροποιήσεις μπορεί να υποδηλώνουν ότι οι γνωστικές λειτουργίες του ασθενούς έχουν υποβαθμιστεί, οδηγώντας σε πρώιμη διάγνωση. Δεδομένης της δυσκολίας στην στον παραδοσιακό τρόπο διάγνωσης τέτοιων νευρολογικών διαταραχών, η χρήση αλγορίθμων μηχανικής μάθησης που είναι σε θέση να ανιχνεύουν αυτόματα τις εν λόγω διαταραχές χρησιμοποιώντας γλωσσικά χαρακτηριστικά θα μπορούσε να φανεί πολύ βοηθητική. Για το λόγο αυτό, αποφασίσαμε να χρησιμοποιήσουμε το σύνολο δεδομένων του ADReSS Challenge και να αναπτύξουμε μεθόδους Επεξεργασίας Φυσικής Γλώσσας (NLP) για την ανάλυση και ταξινόμηση των γλωσσικών χαρακτηριστικών των ασθενών με νόσο Αλτσχάιμερ. Για την κατηγοριοποίηση των γλωσσικών δειγμάτων που έχουμε συλλέξει από πιθανούς ασθενείς της νόσου και από υγιείς συμμετέχοντες, προτείνουμε την εφαρμογή του XGBoost μοντέλου, το οποίο δεν χρησιμοποιείται συχνά σε αντίστοιχες περιπτώσεις, παράλληλα με την υλοποίηση τριών επιπλέον μοντέλων. Τα τελικά αποτελέσματα του XGBoost υποδεικνύουν πως το συγκεκριμένο μοντέλο, υπό τις κατάλληλες ρυθμίσεις, είναι σε θέση να αποφέρει παρόμοια ή και καλύτερα αποτελέσματα από τα υπόλοιπα μοντέλα.