Πειραματική μελέτη συσταδοποίησης δεδομένων με τον αλγόριθμο K-Means στο Spark
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Machine learning ; K-MeansΠερίληψη
Στα πλαίσια της παρούσας διπλωματικής γίνεται εισαγωγή στις έννοιες Επιστήμη Δεδομένων και τη Μηχανική Μάθηση. Σκοπός της μελέτης που έγινε είναι μέσα από διαφορετικά σύνολα δεδομένων να παρατηρήσουμε τη συμπεριφορά του δημοφιλούς αλγορίθμου K-Means χρησιμοποιώντας ταυτόχρονα διάφορες τεχνολογίες όπως η γλώσσα προγραμματισμού Python και το Apache Spark.