dc.contributor.advisor | Maglogiannis, Ilias | |
dc.contributor.advisor | Μαγκλογιάννης, Ηλίας | |
dc.contributor.author | Spanidis, Loukas | |
dc.contributor.author | Σπανίδης, Λουκάς | |
dc.date.accessioned | 2023-12-04T10:44:29Z | |
dc.date.available | 2023-12-04T10:44:29Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/16049 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/3471 | |
dc.description.abstract | Ta Deepfakes γίνονται γρήγορα πραγµατιϰότητα. Αυτά τα µέσα δηµιουργούνται από
πολύ ισχυρά εργαλεία που επιτρέπουν γρήγορο ϰαι φϑηνό χειρισµό µέσων. Τα βίντεο
αυτά µπορούν να χρησιµοποιηϑούν για ανήϑιϰες ϰαι ϰαϰόβουλες εφαρµογές, όπως η
διάδοση ψεύτιϰων ειδήσεων ή ψεύτιϰο πορνό. ∆εδοµένων των επερχόµενων προβλη µάτων που ϑέτουν αυτά τα µέσα, ερευνητές έχουν αρχίσει να εργάζονται µε διαφορε τιϰούς τρόπους για να προσπαϑήσουν να εντοπίσουν αυτούς τους τύπους µέσων. Αυτή
η διπλωµατιϰή εργασία διερευνά τη χρονιϰή προσέγγιση της ανίχνευσης deepfake, µε
ιδιαίτερη έµφαση στην εξερεύνηση των φυσιολογιϰών τεχνουργηµάτων που σχετίζονται
µε την ϰαταστροφή των φυσιολογιϰών σηµάτων, όπως η µεταβλητότητα του ϰαρδιαϰού
ρυϑµού, που λαµβάνονται µέσω του πλαισίου pyVHR. Η µελέτη χρησιµοποιεί πολλά
µοντέλα τελευταίας τεχνολογίας Συνελιϰτιϰού Νευρωνιϰού ∆ιϰτύου (CNN), συµπεριλ αµβανοµένων των AlexNet, ResNet ϰαι SincNet, µαζί µε διάφορες τροποποιήσεις ϰαι δι αφορετιϰές τεχνιϰές προεπεξεργασίας δεδοµένων. Αυτά τα µοντέλα εϰπαιδεύονται ϰαι
αξιολογούνται στο σύνολο δεδοµένων FaceForensics+, παρέχοντας µια ολοϰληρωµένη
αξιολόγηση της αποτελεσµατιϰότητάς τους στον εντοπισµό του deepfake βίντεο. Τα
αποτελέσµατα αυτής της έρευνας δείχνουν ότι το µοντέλο SincNet έχει ϰαλύτερη από δοση από άλλα µοντέλα σε διαφορετιϰά σύνολα δεδοµένων στο σύνολο δεδοµένων Face Forensics++. Συγϰεϰριµένα, επιτυγχάνει εντυπωσιαϰή αϰρίβεια 95,8% ϰαι F1-score 95,9%
όταν εϰπαιδεύεται στο σύνολο δεδοµένων FaceShifter. Ωστόσο, η απόδοση του µοντέλου
ποιϰίλλει ανάλογα µε το συγϰεϰριµένο σύνολο δεδοµένων που χρησιµοποιείται για την
εϰπαίδευση, υποδειϰνύοντας τη σηµασία της επιλογής δεδοµένων στην ανίχνευση deep fake βίντεο. Τα αποτελέσµατα υπογραµµίζουν τη δυνατότητα χρήσης φυσιολογιϰών
σηµάτων, που εξάγονται από το εργαλείο pyVHR, για την ανίχνευση deepfake βίντεο. Εί ναι αξιοσηµείωτο ότι το µοντέλο SincNet έδειξε την ιϰανότητα αποτελεσµατιϰής διάϰρ ισης µεταξύ πραγµατιϰών ϰαι ψεύτιϰων βίντεο χρησιµοποιώντας µόνο τα σήµατα BVP
που εξάγονται από το εργαλείο pyVHR. | el |
dc.format.extent | 65 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Deepfake detection with deep learning : leveraging remote heart rate estimation to discriminate real from fake videos of faces | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | Deepfakes are swiftly becoming a reality. These media are generated by very powerful tools
which allow fast and cheap media manipulation. These videos can be used for unethical
and malicious applications, such as spread of fake news or fake porn. Given the upcoming
problems these media pose, researchers have started working on different ways to try
and detect these types of media. This master’s thesis investigates the temporal aspect of
deepfake detection, with a specific emphasis on exploring the physiological artifacts asso ciated with the corruption of physiological signals, such as heart rate variability, obtained
through the pyVHR framework. The study employs several state-of-the-art Convolutional
Neural Network (CNN) models, including AlexNet, ResNet, and SincNet, along with vari ous modifications and different data preprocessing techniques. These models are trained
and evaluated on the FaceForensics+ dataset, providing a comprehensive evaluation of
their effectiveness in deepfake detection. The results of this investigation demonstrate
that the SincNet model outperforms other models across different datasets within the
FaceForensics++ dataset. Notably, it achieves an impressive accuracy of 95.8% and an
F1-score of 95.9% when trained on the FaceShifter dataset. However, the performance of the
model varies depending on the specific dataset used for training, indicating the importance
of dataset selection in deepfake detection. The results highlight the potential of using
physiological signals, extracted from the pyVHR framework, in detecting deepfake videos.
Remarkably, the SincNet model demonstrated the ability to effectively distinguish between
real and fake videos using only the BVP signals extracted from the pyVHR framework. | el |
dc.corporate.name | University of Milan | el |
dc.contributor.master | Πληροφοριακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Deepfake | el |
dc.subject.keyword | Deep learning | el |
dc.subject.keyword | CNN | el |
dc.subject.keyword | PyVHR | el |
dc.subject.keyword | FaceForensics++ dataset | el |
dc.subject.keyword | SincNet | el |
dc.date.defense | 2023-09-18 | |