Αναγνώριση και εξαγωγή ενσωματωμένου στατικού κειμένου από ψηφιακό σήμα εικόνας, με εφαρμογή ανομοιογενούς - πολυδιακριτικού μετασχηματισμού κυματίων, στις διαστάσεις του χώρου και του χρόνου
Master Thesis
Συγγραφέας
Χαιρεκάκης, Θεμιστοκλής Γ.
Ημερομηνία
2011-09-22Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Digital video -- Editing -- Data processing ; Motion pictures -- Editing -- Data processing ; Wave equationsΠερίληψη
Η αναγνώριση και εξαγωγή ενσωματωμένου κειμένου από ψηφιακό σήμα video, αποτελεί σημαντικό πεδίο έρευνας στον τομέα της πληροφορικής, διότι το κείμενο εμπεριέχει σημασιολογική πληροφορία η οποία δύναται να χαρακτηρίσει και να περιγράψει το υποκείμενο οπτικοακουστικό υλικό. Η επιστημονική βιβλιογραφία, προτείνει διάφορες μεθόδους εντοπισμού, ανάδειξης και οπτικής αναγνώρισης πληροφορίας κειμένου σε video. Κεντρικός στόχος των μεθόδων αυτών είναι η απαλοιφή της συνήθως πολύπλοκης πληροφορίας που ορίζει το φόντο και η τελική ανάδειξη της πληροφορίας κειμένου. Αντικείμενο της παρούσης εργασίας αποτελεί η μελέτη και η επέκταση των προαναφερθέντων μεθόδων, με σκοπό την ανάλυση, αναγνώριση και εξαγωγή της πληροφορίας στατικού και μηχανικά ενσωματωμένου κειμένου (video embedded textual information). Παρότι στην εργασία παρουσιάζονται τα πλεονεκτήματα αλλά και οι ανεπάρκειες υφιστάμενων προσεγγίσεων όπως η περιοχική προσέγγιση (Region Based Approach) και η προσέγγιση υφής (Texture Based Approach), γίνεται σαφές ότι η χρήση Ανομοιογενούς – Πολλαπλών Αναλύσεων Μετασχηματισμού Κυματίων στο Χώρο και το Χρόνο ( 3-Dimensional Multiresolution Inhomogeneous Wavelet Transform ) , μπορεί να αναδείξει με μεγαλύτερη ακρίβεια τα επιθυμητά χαρακτηριστικά. Λαμβάνοντας υπόψη το συγκεκριμένο συμπέρασμα , προτείνεται μια καινοτόμος και αποτελεσματική διαδικασία επεξεργασίας, η οποία υλοποιείται μέσω της δημιουργίας ολοκληρωμένου προϊόντος λογισμικού (3D Wavelet Toolbox for Textual Information Extraction in Video Sequences - W3D Toolbox), που επιτρέπει την προβολή, παραμετροποίηση και συνδυασμένη χρήση των προκρινόμενων μεθόδων σε πραγματικά δεδομένα.