Εξόρυξη γνώσης & ανάκτηση δεδομένων εικόνας με χρήση υποδομών σχεσιακών βάσεων δεδομένων
Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Εξόρυξη δεδομένων ; Data mining ; Βάσεις δεδομένων -- Διαχείριση ; Επεξεργασία εικόνας -- Ψηφιακές τεχνικές ; Database management ; Image processing -- Digital techniquesΠερίληψη
Οι οργανισμοί χρησιμοποιούν σήμερα τα συστήματα ψηφιακής απεικόνισης, περιμένοντας να βελτιωθεί η αποτελεσματικότητά τους. Η ψηφιακή εικόνα επιτρέπει την αποθήκευση, ανάκτηση και ανταλλαγή τεράστιου αριθμό εγγραφών σε υποδομή δικτύου και το Internet γενικότερα. Οι χρήστες μπορούν να βρουν ένα αρχείο με ένα σύστημα ψηφιακής απεικόνισης γρηγορότερα από ό, τι μπορούν να βρουν την έντυπη έκδοση ή την αντίστοιχη μικροφίλμ. Μπορούν επίσης να μοιράζονται αρχεία εύκολα με τη χρήση διαφόρων υποδομών, όπως e-mail και άμεσων μηνυμάτων. Από την άλλη πλευρά, υπάρχει η ανάγκη για αυξημένη αποθηκευτικό χώρο για εικόνες και φωτογραφίες. Αν και αυτό το τελευταίο σημείο είναι ότι κατά κύριο λόγο τονίζει το πραγματικό πλεονέκτημα της ψηφιακής απεικόνισης είναι η ηλεκτρονική πρόσβαση στα αρχεία και την ανταλλαγή των σχετικών πληροφοριών. Η απόφαση για το αν και πώς να εφαρμόζουν ένα σύστημα απεικόνισης είναι πολύπλοκη. Πολλοί παράγοντες πρέπει να λαμβάνονται υπόψη. Κατά κύριο λόγο, ποιο είναι το επιθυμητό αποτέλεσμα; Θα καλύψει τις πραγματικές ανάγκες και πώς να ενσωματώσουν την υπάρχουσα υποδομή; Υπάρχουν επαρκείς οικονομικοί πόροι για τη στήριξη των συστημάτων; Η μελέτη επικεντρώθηκε στην αποθήκευση και ανάκτηση καθώς και στην επιτυχή κατηγοριοποίηση. Ειδικότερα, υπάρχει μια διαδικασία εισαγωγής των εικόνων σε μια σχεσιακή βάση δεδομένων (Oracle Corporation RDBMS), μια επιτυχημένη μετατροπή σε κατάλληλη μορφή για την αναζήτηση σε αυτές τις εικόνες, τη δημιουργία της εξόρυξης δεδομένων και τη διεξαγωγή πειραμάτων για να καταλήξουμε σε σχετικές διαπιστώσεις. Το κλειδί για την επιτυχημένη σχεδίαση, ανάπτυξη και εφαρμογή ενός συστήματος για την επεξεργασία δεδομένων εικόνας είναι η σωστή ανάλυση. Οι τέσσερις κύριες φάσεις είναι οι εξής: α) Σχεδιασμός και ανάλυση απαιτήσεων, β) Ανάλυση της τεχνολογίας που επιλέγεται, γ) διαδικασία εφαρμογής, γ) Ανάλυση των αποτελεσμάτων. Σε αυτό το πλαίσιο, μελετήθηκαν τέσσερις διαφορετικοί αλγόριθμοι (decision trees, naive bayes, support vector machines and logistic regression), για ένα σύνολο περίπου χιλίων εικόνων. Τα αποτελέσματα είναι ικανοποιητικά, αν και υπάρχει πάντα περιθώριο για βελτίωση. Εκτός αυτού, ένας αλγόριθμος εξόρυξης δεδομένων που επιτυγχάνει πολύ υψηλό ποσοστό επιτυχίας για ένα συγκεκριμένο πρόβλημα που δημιουργείται από την πιθανότητα να είναι over optimized για το συγκεκριμένο πρόβλημα, καθιστώντας ενδεχομένως ακατάλληλο για ένα ευρύ φάσμα προβλημάτων.