Αναγνώριση και εξαγωγή ενσωματωμένου στατικού κειμένου από ψηφιακό σήμα εικόνας, με εφαρμογή ανομοιογενούς - πολυδιακριτικού μετασχηματισμού κυματίων, στις διαστάσεις του χώρου και του χρόνου

Χαιρεκάκης, Θεμιστοκλής Γ.

dc.contributor.author	Χαιρεκάκης, Θεμιστοκλής Γ.
dc.date.accessioned	2011-09-22T14:55:16Z
dc.date.available	2011-09-22T14:55:16Z
dc.date.issued	2011-09-22T14:55:16Z
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/4196
dc.description.abstract	Η αναγνώριση και εξαγωγή ενσωματωμένου κειμένου από ψηφιακό σήμα video, αποτελεί σημαντικό πεδίο έρευνας στον τομέα της πληροφορικής, διότι το κείμενο εμπεριέχει σημασιολογική πληροφορία η οποία δύναται να χαρακτηρίσει και να περιγράψει το υποκείμενο οπτικοακουστικό υλικό. Η επιστημονική βιβλιογραφία, προτείνει διάφορες μεθόδους εντοπισμού, ανάδειξης και οπτικής αναγνώρισης πληροφορίας κειμένου σε video. Κεντρικός στόχος των μεθόδων αυτών είναι η απαλοιφή της συνήθως πολύπλοκης πληροφορίας που ορίζει το φόντο και η τελική ανάδειξη της πληροφορίας κειμένου. Αντικείμενο της παρούσης εργασίας αποτελεί η μελέτη και η επέκταση των προαναφερθέντων μεθόδων, με σκοπό την ανάλυση, αναγνώριση και εξαγωγή της πληροφορίας στατικού και μηχανικά ενσωματωμένου κειμένου (video embedded textual information). Παρότι στην εργασία παρουσιάζονται τα πλεονεκτήματα αλλά και οι ανεπάρκειες υφιστάμενων προσεγγίσεων όπως η περιοχική προσέγγιση (Region Based Approach) και η προσέγγιση υφής (Texture Based Approach), γίνεται σαφές ότι η χρήση Ανομοιογενούς – Πολλαπλών Αναλύσεων Μετασχηματισμού Κυματίων στο Χώρο και το Χρόνο ( 3-Dimensional Multiresolution Inhomogeneous Wavelet Transform ) , μπορεί να αναδείξει με μεγαλύτερη ακρίβεια τα επιθυμητά χαρακτηριστικά. Λαμβάνοντας υπόψη το συγκεκριμένο συμπέρασμα , προτείνεται μια καινοτόμος και αποτελεσματική διαδικασία επεξεργασίας, η οποία υλοποιείται μέσω της δημιουργίας ολοκληρωμένου προϊόντος λογισμικού (3D Wavelet Toolbox for Textual Information Extraction in Video Sequences - W3D Toolbox), που επιτρέπει την προβολή, παραμετροποίηση και συνδυασμένη χρήση των προκρινόμενων μεθόδων σε πραγματικά δεδομένα.
dc.language.iso	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subject	Digital video -- Editing -- Data processing
dc.subject	Motion pictures -- Editing -- Data processing
dc.subject	Wave equations
dc.title	Αναγνώριση και εξαγωγή ενσωματωμένου στατικού κειμένου από ψηφιακό σήμα εικόνας, με εφαρμογή ανομοιογενούς - πολυδιακριτικού μετασχηματισμού κυματίων, στις διαστάσεις του χώρου και του χρόνου
dc.type	Master Thesis
europeana.isShownAt	https://dione.lib.unipi.gr/xmlui/handle/unipi/4196
europeana.type	IMAGE
dc.identifier.call	778.5'35 ΧΑΙ
dc.description.abstractEN	Detection and extraction of machine embedded text over digital video signal, is a significant research field in information technology, because textual information contains semantic information which may describe and classify the subjacent audiovisual content. Scientific bibliography on this field suggests various methods of detection, emergence and optical recognition of video encoded textual information. The main target of such methods is the elimination of the usually complicated information which describes background and the extraction of textual information. The objective of this project is the study and extension of the aforementioned methodologies in order to analyze, detect and extract video embedded, spatially and temporally static, textual information. Although this project presents advantages and deficiencies of such approaches as region based and texture based approach, it finally becomes clear that the use of an innovative 3-Dimensional Multiresolution Inhomogeneous Wavelet Transform technique in Spatial and Temporal domains may extract more efficiently the desired characteristics. Following the above presumption, we suggest an innovative and efficient video content processing algorithm and additionally an integrated software product (3D Wavelet Toolbox for Textual Information Extraction in Video Sequences - W3D Toolbox), which permits the visualization, configuration and compound use of designated methodologies on real world data.

Αρχεία σε αυτό το τεκμήριο

Name:: Chairekakis.pdf
Μέγεθος:: 10.23Mb
Τύπος:: PDF

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Πληροφορικής
Department of Informatics

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές