Show simple item record

Ζητήματα ομοιότητας στην εξόρυξη γνώσης: μεθοδολογίες και τεχνικές

dc.contributor.advisorΘεοδωρίδης, Ιωάννης
dc.contributor.authorΝτούτση, Ειρήνη Χριστόφορος
dc.date.accessioned2015-07-16T06:41:20Z
dc.date.available2015-07-16T06:41:20Z
dc.date.issued2008
dc.identifier.urihttp://dione.lib.unipi.gr/xmlui/handle/unipi/6855
dc.description.abstractΣτις μέρες μας εξάγονται όλο και περισσότερα πρότυπα εξαιτίας της πληθώρας των δεδομένων και της ευρείας χρήσης της Διαδικασίας Ανακάλυψης Γνώσης από τα Δεδομένα και της Εξόρυξης Γνώσης. Αυτή η πληθώρα των προτύπων επιβάλει την αντιμετώπιση προβλημάτων που σχετίζονται με τη διαχείρισή τους. Μία από τις πιο σημαντικές λειτουργίες στα πρότυπα είναι αυτή της αποτίμησης της ομοιότητας μεταξύ προτύπων, ένα πρόβλημα που έχει πολλές εφαρμογές και εγείρει σημαντικά ερευνητικά θέματα. Στα πλαίσια της παρούσας διατριβής μελετάμε διάφορα θέματα που προκύπτουν κατά την αποτίμηση της ομοιότητας μεταξύ προτύπων. Πιο συγκεκριμένα, προτείνουμε αρχικά ένα πλαίσιο για την αποτίμηση της ομοιότητας μεταξύ προτύπων αυθαίρετης πολυπλοκότητας τα οποία ορίζονται τόσο πάνω σε πρωτογενή δεδομένα όσο και πάνω σε άλλα πρότυπα. Στη συνέχεια μελετάμε προβλήματα ομοιότητας για μερικούς από τους πιο δημοφιλείς τύπους προτύπων, συγκεκριμένα για συχνά στοιχειοσύνολα, δέντρα απόφασης και συστάδες. Ειδικότερα για την περίπτωση των συχνών στοιχειοσυνόλων, εξετάζουμε κατά πόσο οι παράμετροι της Εξόρυξης Γνώσης επηρεάζουν το αποτέλεσμα της σύγκρισης μεταξύ συνόλων από στοιχειοσύνολα. Στην περίπτωση των δέντρων απόφασης, προτείνουμε ένα πλαίσιο που βασιζόμενο στα δέντρα απόφασης αποτιμά την ομοιότητα τόσο μεταξύ δέντρων απόφασης όσο και μεταξύ συνόλων δεδομένων κατηγοριοποίησης. Τέλος, στην περίπτωση των συστάδων προτείνουμε μέτρα απόστασης μεταξύ συστάδων και συσταδοποιήσεων, τα οποία και χρησιμοποιούμε στη συνέχεια για να παρακολουθήσουμε την εξέλιξη και να εντοπίσουμε τυχόν αλλαγές σε δυναμικούς πληθυσμούς. Κοινό στοιχείο σε όλες τις παραπάνω περιπτώσεις είναι η θεώρηση ότι τα πρότυπα αποτελούνται από μία δομική και μία ποσοτική συνιστώσα, γεγονός που ανοίγει νέους δρόμους προς την κατεύθυνση ενός ενιαίου μοντέλου για τα αποτελέσματα της Εξόρυξης Γνώσης.el
dc.format.extent188el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectΔίκτυα υπολογιστώνel
dc.subjectData miningel
dc.subjectComputer networksel
dc.subjectΕξόρυξη δεδομένωνel
dc.subjectOnline social networksel
dc.subjectΚοινωνικά δίκτυαel
dc.titleΖητήματα ομοιότητας στην εξόρυξη γνώσης: μεθοδολογίες και τεχνικέςel
dc.title.alternativeSimilarity issues in data mining: methodologies and techniquesen
dc.typeDoctoral Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.identifier.call004.6 ΝΤΟel
dc.description.abstractENThe amount of patterns extracted nowadays from Knowledge Discovery and Data Mining (KDD) is rapidly growing, thus imposing new challenges regarding their management. One of the most important operations on the extracted pattern sets is that of dissimilarity assessment which raises a lot of fruitful research issues and results in a variety of important applications. This dissertation studies several issues that arise during the pattern dissimilarity assessment process. At first, we propose a generic framework for the comparison of arbitrary complex patterns defined over raw data and over other patterns. Next, we study specific dissimilarity problems for the most popular pattern types, namely frequent itemsets, decision trees and clusters. More specifically, for the case of frequent itemset patterns, we study how the mining parameters affect the dissimilarity assessment process. For the case of decision tree patterns, we propose a framework that evaluates dissimilarity between both decision trees and classification datasets. Finally, for the case of clusters, we propose dissimilarity measures between clusters and clusterings, which we then employ for change detection in dynamic populations. All the above were studied under the consideration that patterns (of any type) are composed of a structure and a measure component, which opens a field towards a unified model for KDD results.el


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»