dc.contributor.author | Χαιρεκάκης, Θεμιστοκλής Γ. | |
dc.date.accessioned | 2011-09-22T14:55:16Z | |
dc.date.available | 2011-09-22T14:55:16Z | |
dc.date.issued | 2011-09-22T14:55:16Z | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/4196 | |
dc.description.abstract | Η αναγνώριση και εξαγωγή ενσωματωμένου κειμένου από ψηφιακό σήμα video, αποτελεί σημαντικό πεδίο έρευνας στον τομέα της πληροφορικής, διότι το κείμενο εμπεριέχει σημασιολογική πληροφορία η οποία δύναται να χαρακτηρίσει και να περιγράψει το υποκείμενο οπτικοακουστικό υλικό. Η επιστημονική βιβλιογραφία, προτείνει διάφορες μεθόδους εντοπισμού, ανάδειξης και οπτικής αναγνώρισης πληροφορίας κειμένου σε video. Κεντρικός στόχος των μεθόδων αυτών είναι η απαλοιφή της συνήθως πολύπλοκης πληροφορίας που ορίζει το φόντο και η τελική ανάδειξη της πληροφορίας κειμένου. Αντικείμενο της παρούσης εργασίας αποτελεί η μελέτη και η επέκταση των προαναφερθέντων μεθόδων, με σκοπό την ανάλυση, αναγνώριση και εξαγωγή της πληροφορίας στατικού και μηχανικά ενσωματωμένου κειμένου (video embedded textual information). Παρότι στην εργασία παρουσιάζονται τα πλεονεκτήματα αλλά και οι ανεπάρκειες υφιστάμενων προσεγγίσεων όπως η περιοχική προσέγγιση (Region Based Approach) και η προσέγγιση υφής (Texture Based Approach), γίνεται σαφές ότι η χρήση Ανομοιογενούς – Πολλαπλών Αναλύσεων Μετασχηματισμού Κυματίων στο Χώρο και το Χρόνο ( 3-Dimensional Multiresolution Inhomogeneous Wavelet Transform ) , μπορεί να αναδείξει με μεγαλύτερη ακρίβεια τα επιθυμητά χαρακτηριστικά. Λαμβάνοντας υπόψη το συγκεκριμένο συμπέρασμα , προτείνεται μια καινοτόμος και αποτελεσματική διαδικασία επεξεργασίας, η οποία υλοποιείται μέσω της δημιουργίας ολοκληρωμένου προϊόντος λογισμικού (3D Wavelet Toolbox for Textual Information Extraction in Video Sequences - W3D Toolbox), που επιτρέπει την προβολή, παραμετροποίηση και συνδυασμένη χρήση των προκρινόμενων μεθόδων σε πραγματικά δεδομένα. | |
dc.language.iso | el | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el | |
dc.subject | Digital video -- Editing -- Data processing | |
dc.subject | Motion pictures -- Editing -- Data processing | |
dc.subject | Wave equations | |
dc.title | Αναγνώριση και εξαγωγή ενσωματωμένου στατικού κειμένου από ψηφιακό σήμα εικόνας, με εφαρμογή ανομοιογενούς - πολυδιακριτικού μετασχηματισμού κυματίων, στις διαστάσεις του χώρου και του χρόνου | |
dc.type | Master Thesis | |
europeana.isShownAt | https://dione.lib.unipi.gr/xmlui/handle/unipi/4196 | |
europeana.type | IMAGE | |
dc.identifier.call | 778.5'35 ΧΑΙ | |
dc.description.abstractEN | Detection and extraction of machine embedded text over digital video signal, is a significant research field in information technology, because textual information contains semantic information which may describe and classify the subjacent audiovisual content. Scientific bibliography on this field suggests various methods of detection, emergence and optical recognition of video encoded textual information. The main target of such methods is the elimination of the usually complicated information which describes background and the extraction of textual information. The objective of this project is the study and extension of the aforementioned methodologies in order to analyze, detect and extract video embedded, spatially and temporally static, textual information. Although this project presents advantages and deficiencies of such approaches as region based and texture based approach, it finally becomes clear that the use of an innovative 3-Dimensional Multiresolution Inhomogeneous Wavelet Transform technique in Spatial and Temporal domains may extract more efficiently the desired characteristics. Following the above presumption, we suggest an innovative and efficient video content processing algorithm and additionally an integrated software product (3D Wavelet Toolbox for Textual Information Extraction in Video Sequences - W3D Toolbox), which permits the visualization, configuration and compound use of designated methodologies on real world data. | |