Ζητήματα ομοιότητας στην εξόρυξη γνώσης: μεθοδολογίες και τεχνικές

Ντούτση, Ειρήνη Χριστόφορος

dc.contributor.advisor	Θεοδωρίδης, Ιωάννης
dc.contributor.author	Ντούτση, Ειρήνη Χριστόφορος
dc.date.accessioned	2015-07-16T06:41:20Z
dc.date.available	2015-07-16T06:41:20Z
dc.date.issued	2008
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/6855
dc.description.abstract	Στις μέρες μας εξάγονται όλο και περισσότερα πρότυπα εξαιτίας της πληθώρας των δεδομένων και της ευρείας χρήσης της Διαδικασίας Ανακάλυψης Γνώσης από τα Δεδομένα και της Εξόρυξης Γνώσης. Αυτή η πληθώρα των προτύπων επιβάλει την αντιμετώπιση προβλημάτων που σχετίζονται με τη διαχείρισή τους. Μία από τις πιο σημαντικές λειτουργίες στα πρότυπα είναι αυτή της αποτίμησης της ομοιότητας μεταξύ προτύπων, ένα πρόβλημα που έχει πολλές εφαρμογές και εγείρει σημαντικά ερευνητικά θέματα. Στα πλαίσια της παρούσας διατριβής μελετάμε διάφορα θέματα που προκύπτουν κατά την αποτίμηση της ομοιότητας μεταξύ προτύπων. Πιο συγκεκριμένα, προτείνουμε αρχικά ένα πλαίσιο για την αποτίμηση της ομοιότητας μεταξύ προτύπων αυθαίρετης πολυπλοκότητας τα οποία ορίζονται τόσο πάνω σε πρωτογενή δεδομένα όσο και πάνω σε άλλα πρότυπα. Στη συνέχεια μελετάμε προβλήματα ομοιότητας για μερικούς από τους πιο δημοφιλείς τύπους προτύπων, συγκεκριμένα για συχνά στοιχειοσύνολα, δέντρα απόφασης και συστάδες. Ειδικότερα για την περίπτωση των συχνών στοιχειοσυνόλων, εξετάζουμε κατά πόσο οι παράμετροι της Εξόρυξης Γνώσης επηρεάζουν το αποτέλεσμα της σύγκρισης μεταξύ συνόλων από στοιχειοσύνολα. Στην περίπτωση των δέντρων απόφασης, προτείνουμε ένα πλαίσιο που βασιζόμενο στα δέντρα απόφασης αποτιμά την ομοιότητα τόσο μεταξύ δέντρων απόφασης όσο και μεταξύ συνόλων δεδομένων κατηγοριοποίησης. Τέλος, στην περίπτωση των συστάδων προτείνουμε μέτρα απόστασης μεταξύ συστάδων και συσταδοποιήσεων, τα οποία και χρησιμοποιούμε στη συνέχεια για να παρακολουθήσουμε την εξέλιξη και να εντοπίσουμε τυχόν αλλαγές σε δυναμικούς πληθυσμούς. Κοινό στοιχείο σε όλες τις παραπάνω περιπτώσεις είναι η θεώρηση ότι τα πρότυπα αποτελούνται από μία δομική και μία ποσοτική συνιστώσα, γεγονός που ανοίγει νέους δρόμους προς την κατεύθυνση ενός ενιαίου μοντέλου για τα αποτελέσματα της Εξόρυξης Γνώσης.	el
dc.format.extent	188	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Δίκτυα υπολογιστών	el
dc.subject	Data mining	el
dc.subject	Computer networks	el
dc.subject	Εξόρυξη δεδομένων	el
dc.subject	Online social networks	el
dc.subject	Κοινωνικά δίκτυα	el
dc.title	Ζητήματα ομοιότητας στην εξόρυξη γνώσης: μεθοδολογίες και τεχνικές	el
dc.title.alternative	Similarity issues in data mining: methodologies and techniques	en
dc.type	Doctoral Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής	el
dc.identifier.call	004.6 ΝΤΟ	el
dc.description.abstractEN	The amount of patterns extracted nowadays from Knowledge Discovery and Data Mining (KDD) is rapidly growing, thus imposing new challenges regarding their management. One of the most important operations on the extracted pattern sets is that of dissimilarity assessment which raises a lot of fruitful research issues and results in a variety of important applications. This dissertation studies several issues that arise during the pattern dissimilarity assessment process. At first, we propose a generic framework for the comparison of arbitrary complex patterns defined over raw data and over other patterns. Next, we study specific dissimilarity problems for the most popular pattern types, namely frequent itemsets, decision trees and clusters. More specifically, for the case of frequent itemset patterns, we study how the mining parameters affect the dissimilarity assessment process. For the case of decision tree patterns, we propose a framework that evaluates dissimilarity between both decision trees and classification datasets. Finally, for the case of clusters, we propose dissimilarity measures between clusters and clusterings, which we then employ for change detection in dynamic populations. All the above were studied under the consideration that patterns (of any type) are composed of a structure and a measure component, which opens a field towards a unified model for KDD results.	el

Αρχεία σε αυτό το τεκμήριο

Name:: 25919.pdf
Μέγεθος:: 5.065Mb
Τύπος:: PDF
Description:: Διδακτορική Διατριβή

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Πληροφορικής

Εμφάνιση απλής εγγραφής

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές