Τεχνικές αναπαράστασης και διαχείρισης προτύπων. Το σύστημα διαχείρισης βάσεων προτύπων
View/ Open
Abstract
Λόγω του μεγάλου όγκου δεδομένων που συλλέγεται στις μέρες μας και αποθηκεύεται σε βάσεις δεδομένων διαφόρων πεδίων και εφαρμογών, οι εφαρμογές και τεχνικές εξόρυξης γνώσης από δεδομένα χρησιμοποιούνται πολύ συχνά για την ανακάλυψη κρυμμένης πληροφορίας, ομάδων και συσχετίσεων δεδομένων. Ο αριθμός των προτύπων που εξάγεται από τις βάσεις αυτές αυξάνεται επίσης ιδιαίτερα και σε πολλές περιπτώσεις η διαχείρισή τους δεν είναι απλή διαδικασία. Οι τελικοί χρήστες δεν μπορούν να αντιμετωπίσουν όλους τους διαφορετικούς τύπους προτύπων που παράγονται από μία ποικιλία λογισμικού σε ετερογενείς πηγές δεδομένων. Αντιμετωπίζοντας αυτή την πρόκληση, μελετάμε τη διαχείριση των προτύπων σε ένα Σύστημα Διαχείρισης Βάσεων Προτύπων (ΣΔΒΠ - Pattern Base Management System (PBMS)). Ένα ΣΔΒΠ χειρίζεται τα πρότυπα όπως ένα Σύστημα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) χειρίζεται τα απλά δεδομένα, χρησιμοποιώντας μία βάση προτύπων και μία γλώσσα επερωτήσεων προσανατολισμένη στην αναπαράσταση των προτύπων. Τα πρότυπα αποτελούν μια συμπαγή πλούσια σε σημασιολογία αναπαράσταση των αρχικών δεδομένων και μπορεί να είναι απλά ή σύνθετα (που ορίζονται πάνω σε απλά πρότυπα). Η ποικιλία των υπαρχόντων προτύπων είναι μεγάλη αλλά όλα τα πρότυπα μοιράζονται κοινά χαρακτηριστικά στον τρόπο που ορίζονται. Η ενιαία διαχείριση των προτύπων με προχωρημένες λειτουργίες πάνω στα πρότυπα, όπως η σύγκρισή τους, οδηγεί σε πολλές ενδιαφέρουσες εφαρμογές. Συγκεκριμένα, η σύγκριση συστάδων, στην περίπτωση της διατριβής αυτής, μπορεί να χρησιμοποιηθεί για να κατηγοριοποιήσει ή να ανακτήσει εικόνες στα πλαίσια ενός συστήματος ανάκτησης εικόνων με βάση το περιεχόμενο (Content-Based Image Retrieval - CBIR). Ένα επίσης σημαντικό θέμα σχετικό με τα πρότυπα που έχουν εξαχθεί αυτόματα είναι η αξιολόγησή τους, καθώς δεν είναι όλα τα πρότυπα σημαντικά και ενδιαφέροντα για τους χρήστες. Η αξιολόγηση των προτύπων είναι μία ενδιαφέρουσα αλλά και δύσκολη εργασία. Ωστόσο, με τη χρήση ενός ενοποιημένου συστήματος διαχείρισης προτύπων και τη χρήση οντολογιών που περιγράφουν τη γνώση της περιοχής (domain knowledge ontologies) αυτή η εργασία μπορεί να υποστηριχθεί από λογισμικό. Στην παρούσα διατριβή αντιμετωπίσαμε τα παραπάνω σχετικά με τη διαχείριση των προτύπων προβλήματα. Πιο συγκεκριμένα: - Μελετήσαμε το πιο κατάλληλο μοντέλο αναπαράστασης για μία βάση προτύπων, βασισμένη στον ορισμό των προτύπων του έργου PANDA. Μέσα από μία ποιοτική αξιολόγηση τριών μοντέλων βάσεων δεδομένων, του σχεσιακού, του αντικειμενο-σχεσιακού και του ημι-δομημένου (XML) μοντέλου, συμπεραίνουμε ότι το μοντέλο XML είναι πιο κατάλληλο για μία βάση προτύπων καθώς, ανάμεσα σε άλλα χαρακτηριστικά, είναι ευέλικτο, επεκτάσιμο και παρέχει αποτελεσματικότητα στις επερωτήσεις.