Αξιολόγηση μεθόδων ταξινόμησης και ερμηνευσιμότητας σε ακτινογραφίες θώρακος
Evaluating classification and interpretability on chest X-ray images

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Νευρωνικά δίκτυαΠερίληψη
Η αυτόματη αναγνώριση παθήσεων του θώρακα σε ακτινογραφίες έχει γίνει μια αποτελεσματική μέθοδος, αξιοποιώντας την τεχνολογία βαθιάς μάθησης για να ενισχύσει τη διαγνωστική διαδικασία. Η παρούσα διπλωματική εξετάζει την ταξινόμηση πολλαπλών ετικετών για ακτινογραφίες θώρακα, χρησιμοποιώντας τέσσερα μοντέλα συνελικτικών νευρωνικών δικτύων (CNN): DenseNet121, Xception, EfficientNet και ένα συνδυασμό (Ensemble) αυτών των δικτύων. Τα μοντέλα έχουν εκπαιδευτεί και αξιολογηθεί με βάση το δεδομένο σύνολο NIH ChestX-ray14, το οποίο περιλαμβάνει περίπου 112 000 εικόνες, 14 ομάδες ασθενειών. Ο διττός στόχος είναι η μεγιστοποίηση της ακρίβειας στην ταξινόμηση και η ενίσχυση της διαφάνειας του μοντέλου χρησιμοποιώντας μεθόδους ερμηνευσιμότητας. Τα πιο θετικά αποτελέσματα προήλθαν από ένα μοντέλο Ensemble, το οποίο είχε καλύτερη απόδοση σε σχέση με τα επιμέρους δίκτυα αναφορικά με τη μέση AUC. Το DenseNet και το Xception, δύο ισχυρά βαθιά νευρωνικά δίκτυα, είχαν ελαφρώς καλύτερες επιδόσεις από το EfficientNet στην αναγνώριση παθολογιών. Για να αντιμετωπιστεί η φύση του "μαύρου κουτιού" των CNN, χρησιμοποιήθηκαν οι μέθοδοι Gradient-weighted Class Activation Mapping (Grad-CAM) και SHapley Additive ExPlanations (SHAP), προκειμένου να απεικονιστούν οι περιοχές που επηρεάζουν τις αποφάσεις του μοντέλου. Η ακρίβεια της εξήγησης αξιολογήθηκε ποσοτικά μέσω Area Over the Perturbation Curve (AOPC). Αυτή η προσέγγιση δείχνει τη μείωση της παραγωγής του μοντέλου όταν αφαιρεθούν κρίσιμες περιοχές της εικόνας. Τα αποτελέσματα αποδεικνύουν ότι ο ταξινομητής Ensemble ανιχνεύει με ακρίβεια διάφορες συνυπάρχουσες θωρακικές παθήσεις, με μέση AUC περίπου 0,80–0,82. Επιπλέον, η εφαρμογή ερμηνευτικών μεθόδων προσφέρει γνώσεις για τα χαρακτηριστικά που επηρεάζουν κάθε πρόβλεψη.