Τεχνικές ομαδοποίησης μικτών δεδομένων
Mixed data clustering techniques
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Clustering ; Mixed data ; Μικτά δεδομένα ; Ανάλυση σε ομάδες ; k-means ; KAMILA ; DBSCAN ; Agglomerative hierarchical clusteringΠερίληψη
Στη Στατιστική, οι τεχνικές ομαδοποίησης (Cluster Analysis) αποσκοπούν στην δημιουργία ομοιογενών ομάδων, ενώ παράλληλα κάθε ομάδα (ή συστάδα) να είναι όσο το δυνατόν πιο διαφορετική από μία άλλη. Κατά συνέπεια, εξετάζοντας ξεχωριστά κάθε ομάδα μπορούμε να επιτύχουμε πιο εύκολη και αποδοτικότερη επεξεργασία για τα δεδομένα που διαθέτουμε. Σε πολλούς χώρους όπως η υγεία, τα χρηματοοικονομικά, το μάρκετινγκ κ.ά, εμφανίζεται η ανάγκη μελέτης πολυδιάστατων μικτών δεδομένων, δηλαδή δεδομένων που περιλαμβάνουν τόσο αριθμητικά όσο και κατηγορικά χαρακτηριστικά. Συνήθως, η εφαρμογή τεχνικών ομαδοποίησης σε μικτά σύνολα δεδομένα, γίνεται με σκοπό την εύρεση δομών και ομαδοποίηση παρόμοιων αντικειμένων για περαιτέρω ανάλυση. Σκοπός της συγκεκριμένης διπλωματικής εργασίας είναι να παρουσιαστούν και να εφαρμοστούν τεχνικές ανάλυσης μικτών δεδομένων σε προσομοιωμένα δεδομένα και παράλληλα να παρουσιαστούν αναλύσεις σε πραγματικά δεδομένα. Η αξιολόγηση των τεχνικών αυτών θα γίνει με βάση τα αποτελέσματα των τεχνικών που θα εφαρμοστούν στα προσομοιωμένα δεδομένα, αλλά και μέσω βιβλιογραφικής ανασκόπησης των συγκεκριμένων τεχνικών σε πραγματικά δεδομένα.