Εφαρμογή μεθόδων στατιστικής μηχανικής μάθησης στην ανάλυση κειμένων και εικόνων υγείας
Statistical machine learning used in health image and text analysis
Master Thesis
Συγγραφέας
Αρβανιτόπουλος, Ιωάννης
Arvanitopoulos, Ioannis
Ημερομηνία
2023-03Επιβλέπων
Μπερσίμης, ΣωτήριοςBersimis, Sotiris
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Machine learning ; Text mining ; Text classification ; Image classification ; HealthcareΠερίληψη
Η παρούσα διπλωματική εργασία στόχο έχει να καλύψει ένα μεγάλο μέρος των τεχνικών προ επεξεργασίας δεδομένων κειμένων και εικόνων στον τομέα της υγείας, με σκοπό τη βελτίωση της απόδοσης των αλγορίθμων κατηγοριοποίησης αυτών σε προκαθορισμένες κατηγορίες. Για την κατηγοριοποίηση των κειμένων δοκιμάστηκαν τόσο τεχνικές μηχανικής μάθησης όσο και τεχνικές βαθιάς μηχανικής μάθησης. Στις τεχνικές μηχανικές μάθησης χρησιμοποιήθηκαν οι αλγόριθμοι Logistic Regression, Multinomial Naïve Bayes και Support Vector Machines (SVM). Τα αποτελέσματα αυτών συγκρίθηκαν και ο αλγόριθμος με την καλύτερη απόδοση βρέθηκε να είναι ο SVM με ακρίβεια κατηγοριοποίησης 88.98% Στις τεχνικές βαθιάς μηχανικής μάθησης χρησιμοποιηθήκαν αρχιτεκτονικές νευρωνικών δικτύων όπως Multilayer Perceptron και Convolutional Neural Network (CNN). Τα αποτελέσματα, αφού συγκρίθηκαν οι μέθοδοι μεταξύ τους, έδειξαν πως καλύτερη κατηγοριοποίηση των κειμένων επιτυγχάνει το δίκτυο Multilayer Perceptron με ακρίβεια κατηγοριοποίησης 84.85%. Η κατηγοριοποίηση εικόνων δοκιμάστηκε να επιτευχθεί με CNNs και Transfer Learning. Συγκεκριμένα ένα απλό CNN και ένα προ εκπαιδευμένο CNN γνωστό ως VGG16 δοκιμάστηκαν με καλύτερη απόδοση το VGG16 που πέτυχε ακρίβεια κατηγοριοποίησης 97.83%