Εμφάνιση απλής εγγραφής

Σύγκριση των τεχνικών καθορισμού του πλήθους ομάδων σε σύνολα πολυδιάστατων δεδομένων

dc.contributor.advisorΚούτρας, Μάρκος
dc.contributor.authorΓεωργίου, Αναστάσιος
dc.date.accessioned2023-10-06T11:26:46Z
dc.date.available2023-10-06T11:26:46Z
dc.date.issued2023-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/15772
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/3194
dc.description.abstractΗ ανάλυση ομαδοποίησης είναι μια θεμελιώδης τεχνική στην επιστήμη των δεδομένων, με στόχο την αποκάλυψη εγγενών μοτίβων και σχέσεων μέσα σε πολύπλοκα σύνολα δεδομένων. Η παρούσα Διπλωματική Εργασία διερευνά και συγκρίνει διάφορα κριτήρια αξιολόγησης των τεχνικών ομαδοποίησης σε πολυδιάστατα σύνολα δεδομένων για τον εντοπισμό του βέλτιστου αριθμού συστάδων. Για την αξιολόγηση της σταθερότητας και της αποτελεσματικότητας των κριτηρίων αξιολόγησης χρησιμοποιούνται προσομοιωμένα δεδομένα με γνωστές δομές συστάδων. Διάφορα κριτήρια της βιβλιογραφίας όπως το μέτρο Silhouette και το κριτήριο Calinski Harabaz χρησιμοποιούνται για τη σύγκριση και πρόταση του βέλτιστου αριθμού συστάδων. Τα ευρήματα υπογραμμίζουν την ευαισθησία των κριτηρίων αξιολόγησης στο αρχικό επίπεδο διαχωρισμού των ομάδων μέσω της απόστασης αλλά και την ανάγκη για σωστή κάθε φορά επιλογή μεθόδου συσταδοποίησης τονίζοντας τη σημασία της επιλογής των κατάλληλων τεχνικών με βάση τα χαρακτηριστικά των δεδομένων. Η παρούσα εργασία συνεισφέρει πολύτιμες γνώσεις για την επιλογή του βέλτιστου αριθμού συστάδων και την ανάδειξη των διαφορετικών χαρακτηριστικών των κριτηρίων, προσφέροντας μέσω παραδειγμάτων κάποια συμπεράσματα για το θέμα αυτό. Προτείνονται μελλοντικές κατευθύνσεις έρευνας για τη διερεύνηση υβριδικών προσεγγίσεων και την αντιμετώπιση προκλήσεων στη ομαδοποίηση δεδομένων μεγάλης κλίμακας.el
dc.format.extent105el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΣύγκριση των τεχνικών καθορισμού του πλήθους ομάδων σε σύνολα πολυδιάστατων δεδομένωνel
dc.title.alternativeComparison of techniques identifying the number of clusters present in multivariate datasetsel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμηςel
dc.description.abstractENClustering analysis is a fundamental technique in data science, aiming to uncover inherent patterns and relationships within complex datasets. This MSc Thesis investigates and compares various evaluation criteria of clustering techniques on multidimensional datasets to identify the optimal number of clusters. Simulated data with known cluster structures are exploited to evaluate the stability and effectiveness of each method. Criteria such as the Silhouette measure and Calinski Harabasz are used to compare and suggest the optimal number of clusters. The findings of our numerical experimentation highlight the sensitivity of clustering outcomes to the choice of method, emphasizing the significance of selecting the appropriate techniques based on data characteristics. The Thesis contributes valuable insights into suggesting and selecting the optimal number of clusters and highlighting the different characteristics of criterias, offering through examples some conclusions on this subject. Finally, we offer guidance for method selection and validation. Future research directions are suggested to explore hybrid approaches, and address challenges in large-scale data clustering.el
dc.contributor.masterΕφαρμοσμένη Στατιστικήel
dc.subject.keywordΣυσταδοποίησηel
dc.subject.keywordΚριτήρια αξιολόγησης αλγορίθμωνel
dc.date.defense2023-09-29


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»