dc.contributor.advisor | Μαγκλογιάννης, Ηλίας | |
dc.contributor.author | Παπατσαρουχάς, Δημήτριος | |
dc.date.accessioned | 2023-11-20T09:42:03Z | |
dc.date.available | 2023-11-20T09:42:03Z | |
dc.date.issued | 2023-09 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/15945 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/3367 | |
dc.description.abstract | Η ανάπτυξη της τεχνολογίας και ειδικότερα της μηχανικής μάθησης φαίνεται να εξελίσσεται με γοργούς ρυθμούς τα τελευταία χρόνια, με τεχνικές βαθιάς μάθησης και υπολογιστικής όρασης, να χρησιμοποιούνται για την επίλυση διαφόρων προβλημάτων σε ποικίλους τομείς. Η συλλογή δεδομένων αποτελεί σημαντική πρόκληση σε πολλούς κλάδους, καθώς η εξασφάλιση αξιόπιστων και επαρκών δεδομένων απαιτεί προσπάθεια και χρόνο από ειδικούς του κάθε κλάδου. Ειδικά στο επιστημονικό πεδίο της ιατρικής, η συλλογή δεδομένων υγειών ατόμων μπορεί να είναι σχετικά ευκολότερη σε σύγκριση με τη συλλογή δεδομένων από ασθενείς, ιδιαίτερα όταν πρόκειται για σπάνιες ασθένειες. Αυτό δημιουργεί ένα πρόβλημα ανισορροπίας στο σύνολο δεδομένων, κάτι το οποίο κάνει δύσκολη την αξιοποίηση των τεχνικών μηχανικής μάθησης . Για την αντιμετώπιση του προβλήματος της ανισορροπίας κλάσεων έχουν προταθεί διάφορες τεχνικές όπως ο εμπλουτισμός δεδομένων με τεχνητά δείγματα. Η παρούσα διπλωματική εργασία, προτείνει την αντιμετώπιση του προαναφερθέντος προβλήματος, με τη χρήση Παραγωγικών Ανταγωνιστικών Δικτύων (GAN). Τα GANs είναι μοντέλα μηχανικής μάθησης τα οποία παράγουν ρεαλιστικές τεχνητές εικόνες. Αποτελούνται από 2 νευρωνικά δίκτυα, τον Γεννήτορα (Generator) και τον Διευκρινιστή (Discriminator), με το πρώτο να προσπαθεί να παράξει τεχνητές εικόνες όμοιες με τις πραγματικές και το δεύτερο να επιδιώκει να διαχωρίσει τις τεχνητές από τις πραγματικές εικόνες. Η εκπαίδευσή τους έχει ως στόχο τον ανταγωνισμό των δύο δικτύων με τη συνεχή βελτίωσή τους, μέχρι το σημείο όπου οι τεχνητές εικόνες να φαίνονται όμοιες με τις πραγματικές.
Η μελέτη εστιάζει στο σύνολο δεδομένων OASIS-3, το οποίο περιλαμβάνει εικόνες Μαγνητικής Απεικόνισης (MRI) εγκεφάλων από υγιή άτομα και ασθενείς με Αλτσχάιμερ. Η πειραματική διαδικασία αποτελείται αρχικά από τη λήψη και την επεξεργασία των δεδομένων. Έπειτα πραγματοποιείται η δοκιμή διαφόρων αρχιτεκτονικών GAN για τη δημιουργία τεχνητών εικόνων ασθενών, με στόχο την επιλογή των καταλληλότερων αρχιτεκτονικών. Στη συνέχεια δημιουργούνται τεχνητές εικόνες από τις επιλεγμένες αρχιτεκτονικές και προστίθενται στο αρχικό σύνολο δεδομένων, δοκιμάζοντας 5 διαφορετικές περιπτώσεις που περιλαμβάνουν διαφορετικά ποσοστά εισαγωγής τεχνητών εικόνων. Τέλος πραγματοποιείται η εκπαίδευση ενός ταξινομητή ResNet18 με τη χρήση των διαφορετικών εμπλουτισμένων συνόλων και συγκρίνονται τα αποτελέσματα από το αρχικό σύνολο δεδομένων.
Όπως διαπιστώθηκε μετά από εκτενή μελέτη και ανάλυση των αποτελεσμάτων της έρευνας, η προσθήκη τεχνητών εικόνων φαίνεται να επηρεάζει σε μικρό βαθμό την απόδοση του ταξινομητή, παρατηρώντας ελάχιστη βελτίωση των μετρικών με την προσθήκη μικρού ποσοστού τεχνητών εικόνων (10%-20%) στην κλάση των ασθενών AD. Σε μεγαλύτερα ποσοστά τεχνητών εικόνων, παρατηρείται η αδυναμία του ταξινομητή να εντοπίσει τις περιπτώσεις της μειονοτικής κλάσης, ενώ παράλληλα οι μετρικές εμφανίζουν σταδιακή επιδείνωση. | el |
dc.format.extent | 97 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Συγκριτική μελέτη παραγωγικών ανταγωνιστικών δικτύων για την εξισορρόπηση κλάσεων σε ιατρικές εικόνες | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | The development of technology, especially machine learning, seems to be advancing rapidly in recent years, with techniques such as deep learning and computer vision being used to solve various problems across diverse fields. Data collection poses a significant challenge in many sectors, as obtaining reliable and sufficient data requires effort and time from domain experts. Specifically, in the scientific field of medicine, collecting health-related data from negative samples might be relatively easier compared to collecting data from positives, especially when dealing with rare diseases. However, this creates an imbalance issue in the dataset, which complicates the utilization of machine learning techniques.
To address the problem of imbalance, various techniques like data augmentation have been proposed. This thesis suggests tackling the issue using Generative Adversarial Networks (GANs). GANs are machine learning models that generate realistic artificial images. They consist of two neural networks, the Generator, and the Discriminator. The Generator aims to produce artificial images like real ones, while the Discriminator tries to distinguish between artificial and real images. Their training involves a competition between the two networks, iteratively improving them until the artificial images closely resemble real ones.
The study focuses on the OASIS-3 dataset, which includes Magnetic Resonance Imaging (MRI) brain images from healthy individuals and Alzheimer's patients. The experimental process begins with data acquisition and processing. Various GAN architectures are then tested to create artificial patient images, with the goal of selecting the most suitable architectures. Subsequently, artificial images generated from the selected architectures are added to the original dataset, testing five different scenarios involving varying percentages of artificial image insertion. Finally, a ResNet18 classifier is trained using the enriched datasets, and the results are compared to those from the original dataset.
As observed after an extensive study and analysis of the research results, the addition of artificial images appears to have a minor impact on the classifier's performance, showing minimal improvement in metrics with the addition of a small percentage of artificial images (10%-20%) to the class of AD patients. At higher percentages of artificial images, the classifier fails to identify instances of the minority class, while concurrently, the metrics exhibit a gradual deterioration. | el |
dc.contributor.master | Πληροφοριακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Τεχνητή νοημοσύνη | el |
dc.subject.keyword | Ανταγωνιστική μάθηση | el |
dc.subject.keyword | Βαθιά μάθηση | el |
dc.subject.keyword | Εμπλουτισμός δεδομένων | el |
dc.subject.keyword | Γεννητικά ανταγωνιστικά δίκτυα | el |
dc.subject.keyword | Παραγωγικά ανταγωνιστικά δίκτυα | el |
dc.subject.keyword | Αλτσχάιμερ | el |
dc.date.defense | 2023-10-10 | |