Συγκριτική μελέτη παραγωγικών ανταγωνιστικών δικτύων για την εξισορρόπηση κλάσεων σε ιατρικές εικόνες

Παπατσαρουχάς, Δημήτριος

dc.contributor.advisor	Μαγκλογιάννης, Ηλίας
dc.contributor.author	Παπατσαρουχάς, Δημήτριος
dc.date.accessioned	2023-11-20T09:42:03Z
dc.date.available	2023-11-20T09:42:03Z
dc.date.issued	2023-09
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/15945
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/3367
dc.description.abstract	Η ανάπτυξη της τεχνολογίας και ειδικότερα της μηχανικής μάθησης φαίνεται να εξελίσσεται με γοργούς ρυθμούς τα τελευταία χρόνια, με τεχνικές βαθιάς μάθησης και υπολογιστικής όρασης, να χρησιμοποιούνται για την επίλυση διαφόρων προβλημάτων σε ποικίλους τομείς. Η συλλογή δεδομένων αποτελεί σημαντική πρόκληση σε πολλούς κλάδους, καθώς η εξασφάλιση αξιόπιστων και επαρκών δεδομένων απαιτεί προσπάθεια και χρόνο από ειδικούς του κάθε κλάδου. Ειδικά στο επιστημονικό πεδίο της ιατρικής, η συλλογή δεδομένων υγειών ατόμων μπορεί να είναι σχετικά ευκολότερη σε σύγκριση με τη συλλογή δεδομένων από ασθενείς, ιδιαίτερα όταν πρόκειται για σπάνιες ασθένειες. Αυτό δημιουργεί ένα πρόβλημα ανισορροπίας στο σύνολο δεδομένων, κάτι το οποίο κάνει δύσκολη την αξιοποίηση των τεχνικών μηχανικής μάθησης . Για την αντιμετώπιση του προβλήματος της ανισορροπίας κλάσεων έχουν προταθεί διάφορες τεχνικές όπως ο εμπλουτισμός δεδομένων με τεχνητά δείγματα. Η παρούσα διπλωματική εργασία, προτείνει την αντιμετώπιση του προαναφερθέντος προβλήματος, με τη χρήση Παραγωγικών Ανταγωνιστικών Δικτύων (GAN). Τα GANs είναι μοντέλα μηχανικής μάθησης τα οποία παράγουν ρεαλιστικές τεχνητές εικόνες. Αποτελούνται από 2 νευρωνικά δίκτυα, τον Γεννήτορα (Generator) και τον Διευκρινιστή (Discriminator), με το πρώτο να προσπαθεί να παράξει τεχνητές εικόνες όμοιες με τις πραγματικές και το δεύτερο να επιδιώκει να διαχωρίσει τις τεχνητές από τις πραγματικές εικόνες. Η εκπαίδευσή τους έχει ως στόχο τον ανταγωνισμό των δύο δικτύων με τη συνεχή βελτίωσή τους, μέχρι το σημείο όπου οι τεχνητές εικόνες να φαίνονται όμοιες με τις πραγματικές. Η μελέτη εστιάζει στο σύνολο δεδομένων OASIS-3, το οποίο περιλαμβάνει εικόνες Μαγνητικής Απεικόνισης (MRI) εγκεφάλων από υγιή άτομα και ασθενείς με Αλτσχάιμερ. Η πειραματική διαδικασία αποτελείται αρχικά από τη λήψη και την επεξεργασία των δεδομένων. Έπειτα πραγματοποιείται η δοκιμή διαφόρων αρχιτεκτονικών GAN για τη δημιουργία τεχνητών εικόνων ασθενών, με στόχο την επιλογή των καταλληλότερων αρχιτεκτονικών. Στη συνέχεια δημιουργούνται τεχνητές εικόνες από τις επιλεγμένες αρχιτεκτονικές και προστίθενται στο αρχικό σύνολο δεδομένων, δοκιμάζοντας 5 διαφορετικές περιπτώσεις που περιλαμβάνουν διαφορετικά ποσοστά εισαγωγής τεχνητών εικόνων. Τέλος πραγματοποιείται η εκπαίδευση ενός ταξινομητή ResNet18 με τη χρήση των διαφορετικών εμπλουτισμένων συνόλων και συγκρίνονται τα αποτελέσματα από το αρχικό σύνολο δεδομένων. Όπως διαπιστώθηκε μετά από εκτενή μελέτη και ανάλυση των αποτελεσμάτων της έρευνας, η προσθήκη τεχνητών εικόνων φαίνεται να επηρεάζει σε μικρό βαθμό την απόδοση του ταξινομητή, παρατηρώντας ελάχιστη βελτίωση των μετρικών με την προσθήκη μικρού ποσοστού τεχνητών εικόνων (10%-20%) στην κλάση των ασθενών AD. Σε μεγαλύτερα ποσοστά τεχνητών εικόνων, παρατηρείται η αδυναμία του ταξινομητή να εντοπίσει τις περιπτώσεις της μειονοτικής κλάσης, ενώ παράλληλα οι μετρικές εμφανίζουν σταδιακή επιδείνωση.	el
dc.format.extent	97	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.title	Συγκριτική μελέτη παραγωγικών ανταγωνιστικών δικτύων για την εξισορρόπηση κλάσεων σε ιατρικές εικόνες	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	The development of technology, especially machine learning, seems to be advancing rapidly in recent years, with techniques such as deep learning and computer vision being used to solve various problems across diverse fields. Data collection poses a significant challenge in many sectors, as obtaining reliable and sufficient data requires effort and time from domain experts. Specifically, in the scientific field of medicine, collecting health-related data from negative samples might be relatively easier compared to collecting data from positives, especially when dealing with rare diseases. However, this creates an imbalance issue in the dataset, which complicates the utilization of machine learning techniques. To address the problem of imbalance, various techniques like data augmentation have been proposed. This thesis suggests tackling the issue using Generative Adversarial Networks (GANs). GANs are machine learning models that generate realistic artificial images. They consist of two neural networks, the Generator, and the Discriminator. The Generator aims to produce artificial images like real ones, while the Discriminator tries to distinguish between artificial and real images. Their training involves a competition between the two networks, iteratively improving them until the artificial images closely resemble real ones. The study focuses on the OASIS-3 dataset, which includes Magnetic Resonance Imaging (MRI) brain images from healthy individuals and Alzheimer's patients. The experimental process begins with data acquisition and processing. Various GAN architectures are then tested to create artificial patient images, with the goal of selecting the most suitable architectures. Subsequently, artificial images generated from the selected architectures are added to the original dataset, testing five different scenarios involving varying percentages of artificial image insertion. Finally, a ResNet18 classifier is trained using the enriched datasets, and the results are compared to those from the original dataset. As observed after an extensive study and analysis of the research results, the addition of artificial images appears to have a minor impact on the classifier's performance, showing minimal improvement in metrics with the addition of a small percentage of artificial images (10%-20%) to the class of AD patients. At higher percentages of artificial images, the classifier fails to identify instances of the minority class, while concurrently, the metrics exhibit a gradual deterioration.	el
dc.contributor.master	Πληροφοριακά Συστήματα και Υπηρεσίες	el
dc.subject.keyword	Τεχνητή νοημοσύνη	el
dc.subject.keyword	Ανταγωνιστική μάθηση	el
dc.subject.keyword	Βαθιά μάθηση	el
dc.subject.keyword	Εμπλουτισμός δεδομένων	el
dc.subject.keyword	Γεννητικά ανταγωνιστικά δίκτυα	el
dc.subject.keyword	Παραγωγικά ανταγωνιστικά δίκτυα	el
dc.subject.keyword	Αλτσχάιμερ	el
dc.date.defense	2023-10-10

Αρχεία σε αυτό το τεκμήριο

Name:: Papatsarouchas_ME2032.pdf
Μέγεθος:: 2.544Mb
Τύπος:: PDF
Description:: Μεταπτυχιακή διατριβή

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα