| dc.contributor.advisor | Θεοδωρίδης, Ιωάννης | |
| dc.contributor.author | Κατή, Αναστασία | |
| dc.date.accessioned | 2025-10-24T06:41:23Z | |
| dc.date.available | 2025-10-24T06:41:23Z | |
| dc.date.issued | 2025-09 | |
| dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/18252 | |
| dc.description.abstract | Η παρούσα εργασία αναλύει ορισμένα από τα είδη των ψεύτικών ιστοσελίδων που υπάρχουν,
τη δομή των URLs, τις υπάρχουσες τεχνικές ανίχνευσης και τη χρήση αλγορίθμων ανίχνευσης
ψεύτικων (μποτ/σπαμ) ιστοσελίδων, το οποίο είναι ένα σημαντικό πρόβλημα για την ασφάλεια
στον κυβερνοχώρο. Το διαδίκτυο έχει γίνει αναπόσπαστο μέρος της σύγχρονης ζωής,
διευκολύνοντας την επικοινωνία, το εμπόριο, την εκπαίδευση και την ψυχαγωγία. Ωστόσο,
αυτός ο διασυνδεδεμένος ψηφιακός κόσμος είναι επίσης ευάλωτος σε εκμετάλλευση από
κακόβουλους παράγοντες. Οι ψεύτικες ιστοσελίδες (μποτ/σπαμ ιστοσελίδες) αποτελούν μια
διαρκή και εξελισσόμενη απειλή. Αυτές οι ιστοσελίδες μπορούν να μιμούνται νόμιμες
πλατφόρμες, διαδίδουν κακόβουλο λογισμικό και συμμετέχουν σε άλλες παράνομες
δραστηριότητες. Συχνά, εμφανίζονται με διάφορες μορφές, όπως σελίδες ηλεκτρονικού
ψαρέματος, διανομής κακόβουλου λογισμικού και σπαμ ιστοσελίδες που δημιουργούνται
αποκλειστικά για την παραπλάνηση των μηχανών αναζήτησης και των χρηστών. Η ανίχνευση
αυτών των κακόβουλων ιστοσελίδων αποτελεί κρίσιμη πρόκληση για την προστασία ατόμων,
επιχειρήσεων και οργανισμών. Οι διευθύνσεις URL κατατάσσονται σε προβλήματα
επεξεργασίας φυσική γλώσσας (Natural Language Processing - NLP), οπότε προηγμένες
τεχνικές Μηχανικής και Βαθιάς Μάθησης, όπως Random Forest και LSTM, μπορούν να
αναλύσουν μοτίβα και χαρακτηριστικά ιστοσελίδων και να παρέχουν αποτελεσματικότερη
ταξινόμηση. Στη συγκεκριμένη εργασία εφαρμόζονται διάφοροι τέτοιοι αλγόριθμοι και υβριδικές
μορφές αυτών (όπως CNN-LSTM) για την εκπαίδευση του συνόλου δεδομένων με
χαρακτηριστικά βασισμένα σε URL επικίνδυνων και νόμιμων ιστοσελίδων. | el |
| dc.format.extent | 86 | el |
| dc.language.iso | el | el |
| dc.publisher | Πανεπιστήμιο Πειραιώς | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.title | Ανακάλυψη ψευδών (μποτ/σπαμ) ιστοσελίδων | el |
| dc.title.alternative | On fake (bot/spam) website detection | el |
| dc.type | Bachelor Dissertation | el |
| dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
| dc.description.abstractEN | This thesis analyzes some of the types of fake websites that exist, the structure of URLs,
existing detection techniques and the use of algorithms to detect fake (bot/spam) websites,
which is a significant problem in cybersecurity. The internet has become an integral part of
modern life, facilitating communication, commerce, education and entertainment. However, this
interconnected digital word is also vulnerable to exploitation by malicious actors. Fake websites
(bot/spam websites) represent a persistent and evolving threat. These websites can mimic
legitimate platforms, distribute malware and engage in other illegal activities. Often, they appear
in various forms, such as phishing sites, malware distribution pages, and spam websites
created solely to mislead search engines and users. Detecting these malicious websites is a
critical challenge in protecting individuals, businesses and organizations. URLs are classified
into Natural Language Processing (NLP) problems, so advanced Machine Learning and Deep
Learning techniques such as Random Forest and LSTM can analyze websites patterns and
characteristics to provide more efficient classification. In this thesis, various algorithms and
hybrid forms of them (such as CNN-LSTM) are applied to train the dataset with URL-based
features of dangerous and legitimate websites. | el |
| dc.subject.keyword | Ανίχνευση κακόβουλης διεύθυνσης URL | el |
| dc.subject.keyword | Μηχανική μάθηση | el |
| dc.subject.keyword | Βαθιά μάθηση | el |
| dc.subject.keyword | Επιθέσεις ψεύτικων ιστοσελίδων | el |
| dc.subject.keyword | Ταξινόμηση ιστοσελίδας | el |
| dc.subject.keyword | Malicious URL detection | el |
| dc.subject.keyword | Machine learning | el |
| dc.subject.keyword | Deep learning | el |
| dc.subject.keyword | Fake website attacks | el |
| dc.subject.keyword | Website classification | el |
| dc.date.defense | 2025-09-29 | |