Εμφάνιση απλής εγγραφής

Σχεδιασμός, υλοποίηση και δοκιμή τεχνικών μηχανικής μάθησης για την ανίχνευση κυβερνοεπιθέσεων

dc.contributor.advisorΚοτζανικολάου, Παναγιώτης
dc.contributor.authorΣταυρόπουλος, Γεώργιος
dc.date.accessioned2025-04-30T10:01:18Z
dc.date.available2025-04-30T10:01:18Z
dc.date.issued2025-04
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/17703
dc.description.abstractΗ ανίχνευση κυβερνοεπιθέσεων με τη χρήση Μηχανικής Μάθησης έχει αναδειχθεί ως ένα από τα πιο δυναμικά πεδία έρευνας, επιτρέποντας την ανάλυση μεγάλων δεδομένων σε πραγματικό χρόνο και την αναγνώριση ασυνήθιστων συμπεριφορών με σημαντικά μεγαλύτερη ακρίβεια σε σύγκριση με τις παραδοσιακές μεθόδους. Η παρούσα εργασία εστιάζει στην ταξινόμηση κακόβουλου λογισμικού, το οποίο αναπαρίσταται με τη μορφή εικόνων σε πέντε διακριτές κατηγορίες: Backdoors & RATs, Downloaders & Droppers, Multipurpose, Spyware, Adware, Rogue Software & Fraudware, Worms & Self-Replicating Malware. Εφαρμόστηκε η μέθοδος της Μεταφοράς Μάθησης (Transfer Learning), κατά την οποία πραγματοποιήθηκε εξαγωγή χαρακτηριστικών από τις εικόνες της δημόσιας βάσης δεδομένων Malimg, με τον συνδυασμό των προεκπαιδευμένων στο ImageNet αρχιτεκτονικών ResNet-50 και DenseNet-121. Με τη χρήση της Bayesian Optimization εντοπίστηκε ο βέλτιστος αριθμός των τελευταίων στρωμάτων που συμμετέχουν στη Μικροπροσαρμογή (fine-tuning), ώστε να επιτευχθεί η αποδοτικότερη εξαγωγή χαρακτηριστικών. Ακολούθησε καθαρισμός και επιλογή των καταλληλότερων χαρακτηριστικών με τη μέθοδο ANOVA. Για την τελική ταξινόμηση χρησιμοποιήθηκαν τρία μοντέλα διαφορετικών κατηγοριών: ένα μη γραμμικό (Support Vector Classification - SVC), ένα Νευρωνικό Δίκτυο (Multi-Layer Perceptron - MLP) και ένα δενδρικής δομής που ανήκει στην κατηγορία των Ensemble (CatBoost), στα οποία εφαρμόστηκε βελτιστοποίηση Υπερπαραμέτρων με τη μέθοδο Bayes. Τα αποτελέσματα της επικύρωσης υπήρξαν εξαιρετικά, με όλες τις μετρικές — είτε κατά κλάση (accuracy, precision, recall, f1 score, specificity, ROC AUC), είτε ως μέσοι όροι (macro, weighted), είτε ως καθολικές (micro metrics, balanced accuracy, Cohen’s Kappa, Matthews Correlation Coefficient) — να υπερβαίνουν το 98% και σε πολλές περιπτώσεις το 99%. Τέλος, ο συνδυασμός των τριών μοντέλων με τη μέθοδο Borda οδήγησε σε περαιτέρω βελτίωση, καθώς παρατηρήθηκαν μόλις 35 λανθασμένες ταξινομήσεις σε σύνολο 8.024 δειγμάτων.el
dc.format.extent421el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΣχεδιασμός, υλοποίηση και δοκιμή τεχνικών μηχανικής μάθησης για την ανίχνευση κυβερνοεπιθέσεωνel
dc.title.alternativeDesign, implementation and testing of machine learning techniques for cyberattack detectionel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENCyberattack detection using Machine Learning has emerged as one of the most dynamic fields of research, enabling the real-time analysis of large datasets and the identification of abnormal be haviors with significantly greater accuracy compared to traditional methods. This study focuses on the classification of malware represented images, into five distinct categories: Backdoors & RATs, Downloaders & Droppers, Multipurpose, Spyware & Adware, Rogue Software & Fraud ware, and Worms & Self-Replicating Malware. A Transfer Learning approach was adopted, utiliz ing features extracted from the publicly available Malimg dataset through the integration of two Pre-Trained on ImageNet deep learning architectures — ResNet-50 and DenseNet-121. Bayes ian Optimization was employed to determine the optimal number of layers to unfreeze for fine tuning, enhancing the quality of feature extraction. Subsequently, feature selection was performed using the ANOVA method. For classification, three model families were explored: a non-linear model (Support Vector Classification – SVC), a neural network (Multi-Layer Perceptron – MLP), and a tree-based ensemble model (CatBoost). All models underwent hyperparameter optimiza tion via Bayesian search. Results demonstrated exceptional performance, with all evaluation met rics — including per-class (accuracy, precision, recall, F1-score, specificity, ROC AUC), averaged (macro, weighted), and global (micro metrics, balanced accuracy, Cohen’s Kappa, Matthews Cor relation Coefficient) consistently exceeding 98%, and in most cases, 99%. Finally, model combi nation using the Borda count method further improved accuracy, yielding only 35 misclassifica tions out of a total of 8,024 samples.el
dc.contributor.masterΚυβερνοασφάλεια και Επιστήμη Δεδομένωνel
dc.subject.keywordΜηχανική μάθησηel
dc.subject.keywordΚακόβουλο λογισμικόel
dc.subject.keywordΤαξινόμησηel
dc.subject.keywordMLPel
dc.subject.keywordSVCel
dc.subject.keywordCatBoostel
dc.subject.keywordBordael
dc.subject.keywordMalimgel
dc.subject.keywordΣυνελικτικά νευρωνικά δίκτυαel
dc.subject.keywordΣτρωματοποιημένη Διασταυρούμενη Επικύρωση K-Foldel
dc.subject.keywordResNet-50el
dc.subject.keywordDenseNet-121el
dc.subject.keywordBayesel
dc.subject.keywordSMOTEel
dc.subject.keywordANOVAel
dc.date.defense2025-04-29


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»