| dc.contributor.advisor | Φιλιππάκης, Μιχαήλ | |
| dc.contributor.author | Κατσικαρέλης, Στέφανος | |
| dc.date.accessioned | 2025-12-04T08:34:57Z | |
| dc.date.available | 2025-12-04T08:34:57Z | |
| dc.date.issued | 2025 | |
| dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/18652 | |
| dc.description.abstract | Η παρούσα μεταπτυχιακή διπλωματική εργασία εστιάζει στην ανάπτυξη και
αξιολόγηση μοντέλων μηχανικής μάθησης για την ανίχνευση phishing URLs,
ένα αυξανόμενο πρόβλημα στον κυβερνοχώρο. Ο σκοπός της έρευνας είναι η
αξιοποίηση χαρακτηριστικών που εξάγονται από διευθύνσεις URL για την
ταξινόμηση τους ως κακόβουλες ή νόμιμες, χρησιμοποιώντας ένα
ετικετοποιημένο dataset από το αποθετήριο Mendeley. Η μεθοδολογία
περιλαμβάνει την προεπεξεργασία των δεδομένων, τη δημιουργία ποσοτικών
χαρακτηριστικών (π.χ. μήκος URL, ύπαρξη HTTPS), και την εφαρμογή
τεσσάρων μοντέλων: RandomForest, LogisticRegression, XGBoost και
LightGBM. Η αξιολόγηση πραγματοποιήθηκε με μετρικές όπως accuracy,
precision, recall και F1-score, καθώς και διασταυρούμενη επικύρωση,
αποκαλύπτοντας ακρίβεια άνω του 95%. Τα αποτελέσματα δείχνουν ότι το
XGBoost υπερέχει στην ανίχνευση phishing (recall ~90%), επιβεβαιώνοντας τη
σημασία χαρακτηριστικών όπως το μήκος URL. Παρά τους περιορισμούς, όπως
η ασυμμετρία των δεδομένων και η αποκλειστική εστίαση σε URLs, η εργασία
προσφέρει μια αξιόπιστη προσέγγιση για την ενίσχυση της κυβερνοασφάλειας.
Προτείνονται μελλοντικές βελτιώσεις, όπως η χρήση oversampling (SMOTE)
και η ενσωμάτωση νευρωνικών δικτύων, για μεγαλύτερη αποτελεσματικότητα. | el |
| dc.format.extent | 83 | el |
| dc.language.iso | el | el |
| dc.publisher | Πανεπιστήμιο Πειραιώς | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.title | Ανίχνευση phishing URLs με μοντέλα μηχανικής μάθησης | el |
| dc.type | Master Thesis | el |
| dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
| dc.description.abstractEN | This master's thesis focuses on the development and evaluation of machine
learning models for detecting phishing URLs, an escalating issue in
cybersecurity. The research aims to leverage features extracted from URL
addresses to classify them as malicious or legitimate, utilizing a labeled dataset
from the Mendeley repository. The methodology encompasses data
preprocessing, the creation of quantitative features (e.g., URL length, presence
of HTTPS), and the application of four models: RandomForest,
LogisticRegression, XGBoost, and LightGBM. Evaluation was performed using
metrics such as accuracy, precision, recall, and F1-score, along with cross validation, revealing accuracy exceeding 95%. The results indicate that XGBoost
outperforms in phishing detection (recall ~90%), confirming the significance of
features like URL length. Despite limitations, including data imbalance and an
exclusive focus on URLs, the work provides a reliable approach for bolstering
cybersecurity. Future enhancements are suggested, such as oversampling
techniques (SMOTE) and the integration of neural networks, to achieve greater
effectiveness. | el |
| dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
| dc.subject.keyword | Machine learning | el |
| dc.subject.keyword | Cybersecurity | el |
| dc.subject.keyword | Phishing detection | el |
| dc.date.defense | 2025 | |