Μηχανική μάθηση και πρόβλεψη επανεισαγωγής λόγω διαβήτη

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Machine learning ; Πρόβλεψη ; Επαναεισαγωγή ; EDA ; ΜοντελοποίησηΠερίληψη
Ο Σακχαρώδης Διαβήτης αποτελεί ένα από τα σημαντικότερα και πλέον διαδεδομένα χρόνια νοσήματα παγκοσμίως, με αύξηση της εμφάνισης του τόσο σε ανεπτυγμένες όσο και σε αναπτυσσόμενες χώρες. Ένας από τους κυριότερους δείκτες της ποιότητας της παρεχόμενης φροντίδας στα νοσοκομεία αποτελεί ο ρυθμός επανεισαγωγής ασθενών, δηλαδή το ποσοστό των ασθενών που εισάγονται εκ νέου στο νοσοκομείο μέσα σε σύντομο χρονικό διάστημα από το προηγούμενο εξιτήριό τους. Η επανεισαγωγή ασθενών με διαβήτη σε νοσοκομείο επιβαρύνει τόσο το σύστημα υγείας όσο και την ποιότητα ζωής των ατόμων. Η συχνή επανεισαγωγή ασθενών με διαβήτη μπορεί να οφείλεται σε διάφορους παράγοντες, όπως η ανεπαρκής διαχείριση της νόσου, η αναποτελεσματική φαρμακευτική αγωγή, ή η ελλιπείς παρακολούθηση μετά την έξοδο από το νοσοκομείο.
Η μηχανική μάθηση χρησιμοποιείται για να διδάξει στις μηχανές πώς να χειρίζονται τα δεδομένα πιο αποτελεσματικά. Αυτό συμβαίνει καθώς τα δεδομένα δεν είναι πάντα ερμηνεύσιμα ή δεν μπορεί να εντοπιστεί κάποιο συγκεκριμένο μοτίβο. Με την πληθώρα των διαθέσιμων συνόλων δεδομένων, η ζήτηση για μηχανική μάθηση αυξάνεται. Πολλές βιομηχανίες, από την ιατρική έως τον στρατό, εφαρμόζουν τη μηχανική μάθηση για να εξαγάγουν σχετικές πληροφορίες. Με άλλα λόγια σκοπός της μηχανικής μάθησης είναι η εξαγωγή πληροφορίας από τα δεδομένα.
Η παρούσα μελέτη έχει ως στόχο την ανάπτυξη και αξιολόγηση μοντέλων μηχανικής μάθησης για την πρόβλεψη της πιθανότητας επανεισαγωγής εντός 30 ημερών, με σκοπό την έγκαιρη παρέμβαση και τη μείωση της νοσοκομειακής επιβάρυνσης. Μέσω αυτής της εργασίας επιδιώκεται η βελτίωση της διαχείρισης των ασθενών, ο έγκαιρος εντοπισμός ομάδων υψηλού κινδύνου και η συνολική αναβάθμιση της ποιότητας των παρεχόμενων υπηρεσιών υγείας.
Για την επίτευξη του παραπάνω στόχου, χρησιμοποιήθηκε το δημόσιο dataset «Diabetes 130-US hospitals for years 1999-2008», το οποίο περιλαμβάνει δεδομένα που αφορούν νοσηλείες διαβητικών ασθενών από 130 νοσοκομεία των Ηνωμένων Πολιτειών. Η εργασία περιλαμβάνει αναλυτική εξερεύνηση και επεξεργασία των δεδομένων, αντιμετώπιση ανισορροπίας κλάσης, ανάπτυξη και αξιολόγηση έξι μοντέλων μηχανικής μάθησης, καθώς και εξήγηση των αποτελεσμάτων με τη χρήση τεχνικών ερμηνείας μοντέλων (SHapley Additive exPlanations).
Η σημασία της παρούσας εργασίας έγκειται όχι μόνο στην υψηλή ακρίβεια πρόβλεψης που μπορεί να επιτευχθεί, αλλά και στην παροχή ουσιαστικής πληροφορίας προς τους επαγγελματίες υγείας, που θα τους επιτρέψει να εφαρμόσουν στοχευμένες παρεμβάσεις με στόχο τη μείωση των ποσοστών επανεισαγωγής και τη βελτίωση της συνολικής φροντίδας των διαβητικών ασθενών.