dc.contributor.advisor | Μπερσίμης, Σωτήριος | |
dc.contributor.advisor | Bersimis, Sotiris | |
dc.contributor.author | Αρβανιτόπουλος, Ιωάννης | |
dc.contributor.author | Arvanitopoulos, Ioannis | |
dc.date.accessioned | 2023-04-11T06:53:25Z | |
dc.date.available | 2023-04-11T06:53:25Z | |
dc.date.issued | 2023-03 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/15349 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/2771 | |
dc.description.abstract | Η παρούσα διπλωματική εργασία στόχο έχει να καλύψει ένα μεγάλο μέρος των τεχνικών προ επεξεργασίας δεδομένων κειμένων και εικόνων στον τομέα της υγείας, με σκοπό τη βελτίωση της απόδοσης των αλγορίθμων κατηγοριοποίησης αυτών σε προκαθορισμένες κατηγορίες. Για την κατηγοριοποίηση των κειμένων δοκιμάστηκαν τόσο τεχνικές μηχανικής μάθησης όσο και τεχνικές βαθιάς μηχανικής μάθησης. Στις τεχνικές μηχανικές μάθησης χρησιμοποιήθηκαν οι αλγόριθμοι Logistic Regression, Multinomial Naïve Bayes και Support Vector Machines (SVM). Τα αποτελέσματα αυτών συγκρίθηκαν και ο αλγόριθμος με την καλύτερη απόδοση βρέθηκε να είναι ο SVM με ακρίβεια κατηγοριοποίησης 88.98% Στις τεχνικές βαθιάς μηχανικής μάθησης χρησιμοποιηθήκαν αρχιτεκτονικές νευρωνικών δικτύων όπως Multilayer Perceptron και Convolutional Neural Network (CNN). Τα αποτελέσματα, αφού συγκρίθηκαν οι μέθοδοι μεταξύ τους, έδειξαν πως καλύτερη κατηγοριοποίηση των κειμένων επιτυγχάνει το δίκτυο Multilayer Perceptron με ακρίβεια κατηγοριοποίησης 84.85%. Η κατηγοριοποίηση εικόνων δοκιμάστηκε να επιτευχθεί με CNNs και Transfer Learning. Συγκεκριμένα ένα απλό CNN και ένα προ εκπαιδευμένο CNN γνωστό ως VGG16 δοκιμάστηκαν με καλύτερη απόδοση το VGG16 που πέτυχε ακρίβεια κατηγοριοποίησης 97.83% | el |
dc.format.extent | 142 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Εφαρμογή μεθόδων στατιστικής μηχανικής μάθησης στην ανάλυση κειμένων και εικόνων υγείας | el |
dc.title.alternative | Statistical machine learning used in health image and text analysis | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
dc.description.abstractEN | Current thesis aims to cover a wide range of pre-processing techniques on text and image data on health sector, with the scope of improving the performance of classification algorithms. For text classification, Machine Learning algorithms such as Logistic Regression, Multinomial Naïve Bayes, and Support Vector Machines (SVM) were used and the results of them were compared to each other. The best performing algorithm was SVM with a classification accuracy of 88.98%. Deep Learning techniques were used as well, for the same task. A Multilayer Perceptron and a 1-Dimentional Convolutional Neural Network (1-D CNN) were trained and evaluated. The best performance achieved from the Multilayer Perceptron with a classification accuracy of 84.85%. Image classification task was implemented using CNNs and Transfer Learning. Specifically, a simple CNN and a pre-trained CNN known as VGG16 were used and the best performing was the VGG16 with a classification accuracy of 97.83%. | el |
dc.contributor.master | Εφαρμοσμένη Στατιστική | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Text mining | el |
dc.subject.keyword | Text classification | el |
dc.subject.keyword | Image classification | el |
dc.subject.keyword | Healthcare | el |
dc.date.defense | 2023-03-16 | |