Εμφάνιση απλής εγγραφής

Video binary classification using deep learning techniques

dc.contributor.advisorGiannakopoulos, Theodoros
dc.contributor.advisorΓιαννακόπουλος, Θεόδωρος
dc.contributor.authorPanopoulos, Sotirios
dc.contributor.authorΠανόπουλος, Σωτήριος
dc.date.accessioned2024-03-01T14:13:19Z
dc.date.available2024-03-01T14:13:19Z
dc.date.issued2024
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/16238
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/3660
dc.description.abstractΣτον τομέα της σύνοψης βίντεο απαιτείται η αποτελεσματική διάκριση μεταξύ πληροφοριακών και μη πληροφοριακών τμημάτων βίντεο για τη δημιουργία συνοπτικών περιλήψεων που περικλείουν το ουσιαστικό τους περιεχόμενο. Χρησιμοποιώντας προηγμένες μεθόδους βαθιάς μάθησης για την εξαγωγή χαρακτηριστικών τόσο από δεδομένα ήχου όσο και από οπτικά δεδομένα, η μελέτη αυτή χρησιμοποιεί ένα ευρύ φάσμα βελτιστοποιημένων αλγορίθμων ταξινόμησης μαζί με νέους που βασίζονται σε LSTM, Attention-based και Transformers μοντέλα. Μια πρώιμη προσέγγιση σύντηξης ενσωματώνει τα οπτικοακουστικά δεδομένα για να ενισχύσει την ακρίβεια της ταξινόμησης. Παρά τις αξιοσημείωτες επιτυχίες, ιδίως με τα οπτικά δεδομένα, οι προκλήσεις στην εξαγωγή χαρακτηριστικών ήχου και ορισμένες επιδόσεις μοντέλων υποδεικνύουν τους τομείς για μελλοντική βελτίωση. Η διατριβή συμβάλλει στον τομέα καταδεικνύοντας τις δυνατότητες του συνδυασμού ακουστικών και οπτικών χαρακτηριστικών με τη χρήση τεχνικών βαθιάς μάθησης για τη δυαδική ταξινόμηση βίντεο, θέτοντας στέρεες βάσεις για την ανάπτυξη ακριβέστερων περιλήψεων βίντεο.el
dc.format.extent59el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.titleVideo binary classification using deep learning techniquesel
dc.title.alternativeΔυαδική ταξινόμηση βίντεο με χρήση τεχνικών βαθιάς μάθησηςel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENIn the video summarization domain it is needed to efficiently differentiate between informative and non-informative video segments to create concise summaries that encapsulate essential content. Utilizing advanced deep learning methods for feature extraction from both audio and visual data, the study employs a diverse array of optimized classification algorithms and novel LSTM, alongside Attention-based models and Transformers. An early fusion approach integrates audio-visual data to enhance classification accuracy. Despite notable successes, particularly with visual data, challenges in audio feature extraction and certain model performances indicate areas for future improvement. The thesis contributes to the field by demonstrating the potential of combining aural and visual features using deep learning techniques for video binary classification, setting a solid groundwork for advancements in achieving more accurate video summarizations.el
dc.corporate.nameNational Center of Scientific Research "Demokritos"el
dc.contributor.masterΤεχνητή Νοημοσύνη - Artificial Intelligenceel
dc.subject.keywordVideo summarizationel
dc.subject.keywordBinary classificationel
dc.subject.keywordAudio feature extractionel
dc.subject.keywordVisual feature extractionel
dc.subject.keywordDeep learningel
dc.date.defense2024-02-09


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής


Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»