Show simple item record

Σύγχρονες τεχνικές αυτόματης ταξινόμησης εγγράφων

dc.contributor.advisorΣκόνδρας, Εμμανουήλ
dc.contributor.authorΠοντικάκος, Αντώνιος
dc.date.accessioned2021-09-28T10:59:25Z
dc.date.available2021-09-28T10:59:25Z
dc.date.issued2021-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/13702
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1125
dc.description.abstractΣτο πλαίσιο της εργασίας θα μελετηθούν οι σύγχρονες τεχνικές ψηφιακής ταξινόμησης εγγράφων μέσα από ένα πλήθος προδιαγεγραμμένων κλάσεων. Υπάρχουν εκατομμύρια σύγχρονα έγγραφα που ανήκουν και σε δημόσιους αλλά και σε ιδιωτικούς φορείς, τα οποία δεν έχουν ψηφιοποιηθεί και παραμένουν ανεκμετάλλευτα σε φυσική και μόνο μορφή. Η ταξινόμηση εικόνων που προέρχονται από τέτοια ψηφιοποιημένα έγγραφα αποτελεί ένα σημαντικό βήμα με στόχο την άντληση της πληροφορίας μέσω αυτών, καθώς και την ραγδαία επιτάχυνση διαδικασιών εισαγωγής δεδομένων, επιτρέποντας έτσι τη βέλτιστη διαχείριση ανθρώπινου δυναμικού αλλά και τη διατήρηση της πληροφορίας στο πέρασμα του χρόνου. Ενδεικτικές κατηγορίες σύγχρονων εγγράφων αποτελούν οι φόρμες, τα τιμολόγια/αποδείξεις, άρθρα από εφημερίδες, επιστολές και επιστημονικά άρθρα. Ένα τέτοιο ετερογενές δείγμα αποτελεί πρόκληση για ένα σύστημα αναγνώρισης εγγράφων, καθώς απαιτείται η αρχική ταξινόμηση τους στις παραπάνω κατηγορίες με στόχο την καλύτερη επεξεργασία τους (πχ. εξαγωγή περιοχών ενδιαφέροντος, δεικτοδότηση). Παράλληλα, στη βιβλιογραφία αναδεικνύεται το γεγονός πως καινοτόμες τεχνικές επεξεργασίας εικόνας με χρήση αλγορίθμων Τεχνητής Νοημοσύνης (πχ. Νευρωνικά Δίκτυα) έχουν δώσει σημαντική ώθηση στην αντιμετώπιση του παραπάνω προβλήματος. Στόχος της παρούσας εργασίας είναι να μελετηθούν τα παραπάνω συστήματα Τεχνητής Νοημοσύνης, καθώς και πως αυτά εκπαιδεύονται κατάλληλα και εντάσσονται σε ένα πλήρες σύστημα ταξινόμησης εγγράφων.el
dc.format.extent81el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΣύγχρονες τεχνικές αυτόματης ταξινόμησης εγγράφωνel
dc.title.alternativeModern techniques of automatic document classificationel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENThis paper studies recent advances in the Document Classification domain through a predefined set of classes. There are millions of modern documents which belong to public and private entities. Unfortunately, these documents stay unexploited, because they exist only in physical form. Image Classification of such documents is a crucial step towards the exploitation of useful information. Moreover, such processing facilitates the data entry procedure, saves information about these documents in a time-enduring digital form and allows the optimal use of human resources. Common classes of document images are forms, invoices/receipts, newspaper articles, letters and scientific reports. Such heterogeneous sample is a challenge for an Optical Character Recognition system, because an initial categorization in the respective document class is usually required, in order to further assist the processing procedure (eg. extraction of regions of interest, indexing). Recent technological advances in the field of Artificial Intelligence - AI (eg. Neural Networks) and innovative Image Processing techniques have been proven to be a priceless asset for the Document Classification problem. This paper aims to provide an introductive presentation of such AI systems and especially how do they apply on a Document Classification system.el
dc.contributor.masterΨηφιακός Πολιτισμός, Έξυπνες Πόλεις, IoT και Προηγμένες Ψηφιακές Τεχνολογίεςel
dc.subject.keywordΤαξινόμηση εγγράφωνel
dc.date.defense2021-09


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»