Εξόρυξη γνώσης & ανάκτηση δεδομένων εικόνας με χρήση υποδομών σχεσιακών βάσεων δεδομένων

Λεπίδας, Αλέξανδρος Ε.

Master Thesis

Συγγραφέας

Λεπίδας, Αλέξανδρος Ε.

Ημερομηνία

2011-04

Περίληψη

Οι οργανισμοί χρησιμοποιούν σήμερα τα συστήματα ψηφιακής απεικόνισης, περιμένοντας να βελτιωθεί η αποτελεσματικότητά τους. Η ψηφιακή εικόνα επιτρέπει την αποθήκευση, ανάκτηση και ανταλλαγή τεράστιου αριθμό εγγραφών σε υποδομή δικτύου και το Internet γενικότερα. Οι χρήστες μπορούν να βρουν ένα αρχείο με ένα σύστημα ψηφιακής απεικόνισης γρηγορότερα από ό, τι μπορούν να βρουν την έντυπη έκδοση ή την αντίστοιχη μικροφίλμ. Μπορούν επίσης να μοιράζονται αρχεία εύκολα με τη χρήση διαφόρων υποδομών, όπως e-mail και άμεσων μηνυμάτων. Από την άλλη πλευρά, υπάρχει η ανάγκη για αυξημένη αποθηκευτικό χώρο για εικόνες και φωτογραφίες. Αν και αυτό το τελευταίο σημείο είναι ότι κατά κύριο λόγο τονίζει το πραγματικό πλεονέκτημα της ψηφιακής απεικόνισης είναι η ηλεκτρονική πρόσβαση στα αρχεία και την ανταλλαγή των σχετικών πληροφοριών. Η απόφαση για το αν και πώς να εφαρμόζουν ένα σύστημα απεικόνισης είναι πολύπλοκη. Πολλοί παράγοντες πρέπει να λαμβάνονται υπόψη. Κατά κύριο λόγο, ποιο είναι το επιθυμητό αποτέλεσμα; Θα καλύψει τις πραγματικές ανάγκες και πώς να ενσωματώσουν την υπάρχουσα υποδομή; Υπάρχουν επαρκείς οικονομικοί πόροι για τη στήριξη των συστημάτων; Η μελέτη επικεντρώθηκε στην αποθήκευση και ανάκτηση καθώς και στην επιτυχή κατηγοριοποίηση. Ειδικότερα, υπάρχει μια διαδικασία εισαγωγής των εικόνων σε μια σχεσιακή βάση δεδομένων (Oracle Corporation RDBMS), μια επιτυχημένη μετατροπή σε κατάλληλη μορφή για την αναζήτηση σε αυτές τις εικόνες, τη δημιουργία της εξόρυξης δεδομένων και τη διεξαγωγή πειραμάτων για να καταλήξουμε σε σχετικές διαπιστώσεις. Το κλειδί για την επιτυχημένη σχεδίαση, ανάπτυξη και εφαρμογή ενός συστήματος για την επεξεργασία δεδομένων εικόνας είναι η σωστή ανάλυση. Οι τέσσερις κύριες φάσεις είναι οι εξής: α) Σχεδιασμός και ανάλυση απαιτήσεων, β) Ανάλυση της τεχνολογίας που επιλέγεται, γ) διαδικασία εφαρμογής, γ) Ανάλυση των αποτελεσμάτων. Σε αυτό το πλαίσιο, μελετήθηκαν τέσσερις διαφορετικοί αλγόριθμοι (decision trees, naive bayes, support vector machines and logistic regression), για ένα σύνολο περίπου χιλίων εικόνων. Τα αποτελέσματα είναι ικανοποιητικά, αν και υπάρχει πάντα περιθώριο για βελτίωση. Εκτός αυτού, ένας αλγόριθμος εξόρυξης δεδομένων που επιτυγχάνει πολύ υψηλό ποσοστό επιτυχίας για ένα συγκεκριμένο πρόβλημα που δημιουργείται από την πιθανότητα να είναι over optimized για το συγκεκριμένο πρόβλημα, καθιστώντας ενδεχομένως ακατάλληλο για ένα ευρύ φάσμα προβλημάτων.

Τίτλος Προγράμματος Μεταπτυχιακών Σπουδών

Προηγμένα Συστήματα Πληροφορικής

Τμήμα

Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής

Αριθμός σελίδων

Γλώσσα

Ελληνικά

URI

https://dione.lib.unipi.gr/xmlui/handle/unipi/7702

Συλλογή

Τμήμα Πληροφορικής

Εμφάνιση πλήρους εγγραφής

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές