Συλλογή εργαστηριακών ασκήσεων στο Hadoop
Collection of Hadoop lab exercises
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Διαχείριση δεδομένων ; LinuxΠερίληψη
Η μεταπτυχιακή αυτή διατριβή, είναι ουσιαστικά μια συλλογή εργαστηριακών ασκήσεων για την κατανόηση των λειτουργιών του Hadoop. To Hadoop είναι ένα πλαίσιο το οποίο προσφέρει γρηγορότερη και αποδοτικότερη διαχείριση δεδομένων, και αυτό είναι ορατό κυρίως σε περιπτώσεις δεδομένων μεγάλου όγκου. Μπορεί να χρησιμοποιηθεί πολύ εύκολα σε περιβάλλον Linux, ενώ υπάρχει και η δυνατότητα υλοποίησης σε Windows, τόσο μέσω command prompt, όσο και με τη χρήση I.D.E. όπως ο Eclipse. Στη συγκεκριμένη διατριβή είδαμε τα απαραίτητα θεωρητικά για την κατανόηση των ασκήσεων, και στη συνέχεια την πρακτική εφαρμογή τους. Κάναμε εγκατάσταση του Hadoop σε συστοιχία ενός κόμβου και ακολούθως σε συστοιχία πολλών κόμβων και πως μπορούμε να επιλύσουμε κάποια γνωστά προβλήματα όπως ο Καταμετρητής λέξεων ενός κειμένου. Οι ασκήσεις αυτές προέρχονται από πανεπιστήμια του εξωτερικού, αλλά υπάρχει και η παρουσία ενός ελληνικού ερευνητικού τμήματος.