dc.contributor.advisor | Σκόνδρας, Εμμανουήλ | |
dc.contributor.author | Ποντικάκος, Αντώνιος | |
dc.date.accessioned | 2021-09-28T10:59:25Z | |
dc.date.available | 2021-09-28T10:59:25Z | |
dc.date.issued | 2021-09 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/13702 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/1125 | |
dc.description.abstract | Στο πλαίσιο της εργασίας θα μελετηθούν οι σύγχρονες τεχνικές ψηφιακής ταξινόμησης εγγράφων μέσα από ένα πλήθος προδιαγεγραμμένων κλάσεων. Υπάρχουν εκατομμύρια σύγχρονα έγγραφα που ανήκουν και σε δημόσιους αλλά και σε ιδιωτικούς φορείς, τα οποία δεν έχουν ψηφιοποιηθεί και παραμένουν ανεκμετάλλευτα σε φυσική και μόνο μορφή. Η ταξινόμηση εικόνων που προέρχονται από τέτοια ψηφιοποιημένα έγγραφα αποτελεί ένα σημαντικό βήμα με στόχο την άντληση της πληροφορίας μέσω αυτών, καθώς και την ραγδαία επιτάχυνση διαδικασιών εισαγωγής δεδομένων, επιτρέποντας έτσι τη βέλτιστη διαχείριση ανθρώπινου δυναμικού αλλά και τη διατήρηση της πληροφορίας στο πέρασμα του χρόνου. Ενδεικτικές κατηγορίες σύγχρονων εγγράφων αποτελούν οι φόρμες, τα τιμολόγια/αποδείξεις, άρθρα από εφημερίδες, επιστολές και επιστημονικά άρθρα. Ένα τέτοιο ετερογενές δείγμα αποτελεί πρόκληση για ένα σύστημα αναγνώρισης εγγράφων, καθώς απαιτείται η αρχική ταξινόμηση τους στις παραπάνω κατηγορίες με στόχο την καλύτερη επεξεργασία τους (πχ. εξαγωγή περιοχών ενδιαφέροντος, δεικτοδότηση). Παράλληλα, στη βιβλιογραφία αναδεικνύεται το γεγονός πως καινοτόμες τεχνικές επεξεργασίας εικόνας με χρήση αλγορίθμων Τεχνητής Νοημοσύνης (πχ. Νευρωνικά Δίκτυα) έχουν δώσει σημαντική ώθηση στην αντιμετώπιση του παραπάνω προβλήματος. Στόχος της παρούσας εργασίας είναι να μελετηθούν τα παραπάνω συστήματα Τεχνητής Νοημοσύνης, καθώς και πως αυτά εκπαιδεύονται κατάλληλα και εντάσσονται σε ένα πλήρες σύστημα ταξινόμησης εγγράφων. | el |
dc.format.extent | 81 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Σύγχρονες τεχνικές αυτόματης ταξινόμησης εγγράφων | el |
dc.title.alternative | Modern techniques of automatic document classification | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | This paper studies recent advances in the Document Classification domain through a predefined set of classes. There are millions of modern documents which belong to public and private entities. Unfortunately, these documents stay unexploited, because they exist only in physical form. Image Classification of such documents is a crucial step towards the exploitation of useful information. Moreover, such processing facilitates the data entry procedure, saves information about these documents in a time-enduring digital form and allows the optimal use of human resources. Common classes of document images are forms, invoices/receipts, newspaper articles, letters and scientific reports. Such heterogeneous sample is a challenge for an Optical Character Recognition system, because an initial categorization in the respective document class is usually required, in order to further assist the processing procedure (eg. extraction of regions of interest, indexing). Recent technological advances in the field of Artificial Intelligence - AI (eg. Neural Networks) and innovative Image Processing techniques have been proven to be a priceless asset for the Document Classification problem. This paper aims to provide an introductive presentation of such AI systems and especially how do they apply on a Document Classification system. | el |
dc.contributor.master | Ψηφιακός Πολιτισμός, Έξυπνες Πόλεις, IoT και Προηγμένες Ψηφιακές Τεχνολογίες | el |
dc.subject.keyword | Ταξινόμηση εγγράφων | el |
dc.date.defense | 2021-09 | |