Εμφάνιση απλής εγγραφής

Ανακάλυψη ψευδών (μποτ/σπαμ) ιστοσελίδων

dc.contributor.advisorΘεοδωρίδης, Ιωάννης
dc.contributor.authorΚατή, Αναστασία
dc.date.accessioned2025-10-24T06:41:23Z
dc.date.available2025-10-24T06:41:23Z
dc.date.issued2025-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18252
dc.description.abstractΗ παρούσα εργασία αναλύει ορισμένα από τα είδη των ψεύτικών ιστοσελίδων που υπάρχουν, τη δομή των URLs, τις υπάρχουσες τεχνικές ανίχνευσης και τη χρήση αλγορίθμων ανίχνευσης ψεύτικων (μποτ/σπαμ) ιστοσελίδων, το οποίο είναι ένα σημαντικό πρόβλημα για την ασφάλεια στον κυβερνοχώρο. Το διαδίκτυο έχει γίνει αναπόσπαστο μέρος της σύγχρονης ζωής, διευκολύνοντας την επικοινωνία, το εμπόριο, την εκπαίδευση και την ψυχαγωγία. Ωστόσο, αυτός ο διασυνδεδεμένος ψηφιακός κόσμος είναι επίσης ευάλωτος σε εκμετάλλευση από κακόβουλους παράγοντες. Οι ψεύτικες ιστοσελίδες (μποτ/σπαμ ιστοσελίδες) αποτελούν μια διαρκή και εξελισσόμενη απειλή. Αυτές οι ιστοσελίδες μπορούν να μιμούνται νόμιμες πλατφόρμες, διαδίδουν κακόβουλο λογισμικό και συμμετέχουν σε άλλες παράνομες δραστηριότητες. Συχνά, εμφανίζονται με διάφορες μορφές, όπως σελίδες ηλεκτρονικού ψαρέματος, διανομής κακόβουλου λογισμικού και σπαμ ιστοσελίδες που δημιουργούνται αποκλειστικά για την παραπλάνηση των μηχανών αναζήτησης και των χρηστών. Η ανίχνευση αυτών των κακόβουλων ιστοσελίδων αποτελεί κρίσιμη πρόκληση για την προστασία ατόμων, επιχειρήσεων και οργανισμών. Οι διευθύνσεις URL κατατάσσονται σε προβλήματα επεξεργασίας φυσική γλώσσας (Natural Language Processing - NLP), οπότε προηγμένες τεχνικές Μηχανικής και Βαθιάς Μάθησης, όπως Random Forest και LSTM, μπορούν να αναλύσουν μοτίβα και χαρακτηριστικά ιστοσελίδων και να παρέχουν αποτελεσματικότερη ταξινόμηση. Στη συγκεκριμένη εργασία εφαρμόζονται διάφοροι τέτοιοι αλγόριθμοι και υβριδικές μορφές αυτών (όπως CNN-LSTM) για την εκπαίδευση του συνόλου δεδομένων με χαρακτηριστικά βασισμένα σε URL επικίνδυνων και νόμιμων ιστοσελίδων.el
dc.format.extent86el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΑνακάλυψη ψευδών (μποτ/σπαμ) ιστοσελίδωνel
dc.title.alternativeOn fake (bot/spam) website detectionel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENThis thesis analyzes some of the types of fake websites that exist, the structure of URLs, existing detection techniques and the use of algorithms to detect fake (bot/spam) websites, which is a significant problem in cybersecurity. The internet has become an integral part of modern life, facilitating communication, commerce, education and entertainment. However, this interconnected digital word is also vulnerable to exploitation by malicious actors. Fake websites (bot/spam websites) represent a persistent and evolving threat. These websites can mimic legitimate platforms, distribute malware and engage in other illegal activities. Often, they appear in various forms, such as phishing sites, malware distribution pages, and spam websites created solely to mislead search engines and users. Detecting these malicious websites is a critical challenge in protecting individuals, businesses and organizations. URLs are classified into Natural Language Processing (NLP) problems, so advanced Machine Learning and Deep Learning techniques such as Random Forest and LSTM can analyze websites patterns and characteristics to provide more efficient classification. In this thesis, various algorithms and hybrid forms of them (such as CNN-LSTM) are applied to train the dataset with URL-based features of dangerous and legitimate websites.el
dc.subject.keywordΑνίχνευση κακόβουλης διεύθυνσης URLel
dc.subject.keywordΜηχανική μάθησηel
dc.subject.keywordΒαθιά μάθησηel
dc.subject.keywordΕπιθέσεις ψεύτικων ιστοσελίδωνel
dc.subject.keywordΤαξινόμηση ιστοσελίδαςel
dc.subject.keywordMalicious URL detectionel
dc.subject.keywordMachine learningel
dc.subject.keywordDeep learningel
dc.subject.keywordFake website attacksel
dc.subject.keywordWebsite classificationel
dc.date.defense2025-09-29


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»