Συγκριτική αξιολόγηση αλγορίθμων μηχανικής μάθησης σε δεδομένα ασθενών με διαβήτη
A comparative evaluation of machine learning algorithms in patient data with diabetes
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Κ κοντινότεροι γείτονες ; Μηχανική μάθηση ; Απλοϊκός Bayes ; Λογιστική παλινδρόμηση ; Νευρωνικά δίκτυα ; Μηχανές διανυσμάτων στήριξης ; Δένδρα απόφασης ; Συλλογική μάθηση ; Σακχαρώδης διαβήτηςΠερίληψη
Η ραγδαία ανάπτυξη της τεχνολογίας τα τελευταία χρόνια σε συνδυασμό με την καθημερινή αποθήκευση μεγάλων όγκων δεδομένων, καθώς και η ανάγκη για σωστή κατηγοριοποίηση των δεδομένων αυτών, οδήγησε στην υλοποίηση διαφόρων αλγορίθμων με σκοπό την καλύτερη κατηγοριοποίηση των δεδομένων αυτών. Η κατηγοριοποίηση εφαρμόζεται σε πολλά επιστημονικά πεδία όπως η ιατρική, η οικονομία, η μετεωρολογία και άλλα πολλά. Στο πεδίο της ιατρικής η σωστή και άμεση πρόβλεψη μιας μεταβολικής ασθένειας όπως ο διαβήτης, παίζει πολύ σημαντικό ρόλο. Οι ασθένειες αυτές μπορούν να προκαλέσουν διάφορες άλλες σοβαρότερες επιπλοκές, έτσι γίνεται αντιληπτό ότι η ανάπτυξη συστημάτων, τα οποία θα μπορούν να προβλέψουν με αρκετά υψηλή ακρίβεια τέτοιου είδους ασθένειες, είναι πολύ σημαντική. Η παρούσα διπλωματική εργασία με τίτλο «Συγκριτική Αξιολόγηση Αλγορίθμων Μηχανικής Μάθησης σε Δεδομένα Ασθενών με Διαβήτη» αναφέρεται στη συγκριτική αξιολόγηση της επίδοσης αλγορίθμων μηχανικής μάθησης και συγκεκριμένα της επιβλεπόμενης μάθησης για την πρόβλεψη του διαβήτη. Τέτοιοι αλγόριθμοι είναι ο απλοϊκός Bayes, η λογιστική παλινδρόμηση, τα νευρωνικά δίκτυα, οι μηχανές διανυσμάτων στήριξης, τα δένδρα απόφασης, η συλλογική μάθηση και ο “Κ κοντινότεροι γείτονες”. Γίνεται συνοπτική παρουσίαση των διαφόρων αλγορίθμων που επιλέχτηκαν, των αποτελεσμάτων από άλλες διεθνείς μελέτες που αφορούν το ίδιο θέμα, και στη συνέχεια παρουσιάζονται τα αποτελέσματα εφαρμογής των αλγορίθμων σε δύο σύνολα δεδομένων, διαθέσιμα δωρεάν για μελέτη από το διαδίκτυο. Η επεξεργασία πραγματοποιήθηκε με τη χρήση της γλώσσας προγραμματισμού Python.