Generative adversarial AI

Master Thesis
Συγγραφέας
Kalligeros, Panteleimon
Καλλίγερος, Παντελεήμων
Ημερομηνία
2025Επιβλέπων
Xenakis, ChristosΞενάκης, Χρήστος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Adversarial ; AI ; Artificial Intelligence ; Attacks ; Hyperparameters ; TaxonomyΠερίληψη
Καθώς τα συστήματα τεχνητής νοημοσύνης (ΤΝ) ενσωματώνονται όλο και πιο βαθιά σε βασικές εφαρμογές, η ευπάθεια τους σε επιθέσεις από επιτιθέμενους αναδεικνύεται σε σημαντικό ζήτημα ασφάλειας. Η παρούσα διπλωματική εργασία εμβαθύνει στη σφαίρα της εχθρικής ΤΝ προτείνοντας μια λεπτομερή ταξινόμηση των στρατηγικών επίθεσης και διεξάγοντας μια εμπειρική αξιολόγηση των επιπτώσεών τους στα μοντέλα μηχανικής μάθησης (ΜΜ) και βαθιάς μάθησης (ΒΜ). Η έρευνα κατηγοριοποιεί τις αντίπαλες επιθέσεις σε τέσσερις πρωταρχικούς τύπους - δηλητηρίαση, αποφυγή, συμπερασματολογία και εξαγωγή μοντέλων - προσφέροντας έτσι μια δομημένη προσέγγιση για την σαφέστερη κατανόηση των μεθόδων και των στόχων τους. Επιπλέον, εξετάζει πώς οι υπερπαράμετροι του μοντέλου, όπως ο ρυθμός μάθησης, η ισχύς της κανονικοποίησης και η αρχιτεκτονική του δικτύου, παίζουν ρόλο στην ευπάθεια σε αυτές τις επιθέσεις. Μέσω μιας σειράς προσεκτικά ελεγχόμενων πειραμάτων, η μελέτη καταδεικνύει τα διαφορετικά επίπεδα αποτελεσματικότητας των επιθέσεων με στρατηγικές όπως οι FGSM, PGD, DeepFool και KnockoffNets, αποκαλύπτοντας τη λεπτή ισορροπία που υπάρχει μεταξύ της επίτευξης βέλτιστης απόδοσης του μοντέλου και της διατήρησης της ανθεκτικότητας. Τα ευρήματα υπογραμμίζουν ότι ακόμη και μικρές προσαρμογές στις υπερπαραμέτρους μπορούν να επηρεάσουν σημαντικά τη στάση ασφαλείας ενός μοντέλου. Αυτή η εργασία προσθέτει στο διευρυνόμενο πεδίο της ανταγωνιστικής τεχνητής νοημοσύνης ενσωματώνοντας τη θεωρητική ανάλυση με τον πρακτικό πειραματισμό, παρέχοντας πρακτικές γνώσεις για την ανάπτυξη συστημάτων τεχνητής νοημοσύνης με αυξημένη ανθεκτικότητα και θέτοντας τα θεμέλια για τη μελλοντική αμυντική στρατηγική.