dc.contributor.advisor | Δουλκερίδης, Χρήστος | |
dc.contributor.author | Γεωργάτου, Χρυσούλα Δ. | |
dc.date.accessioned | 2015-04-24T06:30:50Z | |
dc.date.accessioned | 2015-06-19T15:13:14Z | |
dc.date.available | 2015-04-24T06:30:50Z | |
dc.date.available | 2015-06-19T15:13:14Z | |
dc.date.issued | 2015-04-24T06:30:50Z | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/6646 | |
dc.description.abstract | Η παρούσα διπλωματική εργασία πραγματεύεται τη διαχείριση μεγάλου όγκου δεδομένων σε υπολογιστικό νέφος. Συγκεκριμένα μελετά τη δυνατότητα χρησιμοποίησης R-tree ευρετηρίων για την ταχύτερη εκτέλεση επερωτήσεων σε πολυδιάστατα δεδομένα αποθηκευμένα στο υπολογιστικό νέφος. Αρχικά, παρουσιάζεται το υπολογιστικό νέφος και περιγράφεται η πολυδιάστατη φύση των δεδομένων καθώς και η αναγκαιότητα χρήσης ευρετηρίων κατά την εκτέλεση επερωτήσεων πάνω σε αυτά. Στη συνέχεια περιγράφεται το framework του Hadoop και το προγραμματιστικό μοντέλο Map Reduce στο οποίο και βασίζεται η προσέγγιση που παρουσιάζεται. Γίνεται μια βιβλιογραφική αναφορά αντίστοιχων προγενέστερων μελετών με στόχο τη βελτίωση του Hadoop και παρουσιάζονται τα αποτελέσματά τους. Επίσης γίνεται μια παρουσίαση της δομής ευρετηρίου R-tree και περιγράφεται η εκτέλεση επερωτήσεων με χρήση της. Εν συνεχεία γίνεται αναφορά στη σχεδίαση που ακολουθήθηκε και στην υλοποίηση με λεπτομέρειες για τον κώδικα μου αναπτύχθηκε. Ακόλουθα περιγράφεται το περιβάλλον δοκιμών καθώς και τα σενάρια που ακολουθήθηκαν. Εκτελέστηκαν επερωτήσεις εύρους (range queries) με χρήση R-tree ευρετηρίου και χωρίς χρήση αυτού για διαφορετικά αρχεία εισόδου κατά περίπτωση, με διαφορετικό αριθμό σημείων και διαστάσεων. Τέλος καταγράφονται τα συμπεράσματα που προέκυψαν από την πειραματική μελέτη και αποδεικνύουν ότι η χρήση R-tree ευρετηρίου βελτιώνει την απόδοση του Hadoop κατά την εκτέλεση επερωτήσεων εύρους πάνω σε πολυδιάστατα δεδομένα και ακολουθούν προτάσεις για μελλοντική έρευνα. | |
dc.language.iso | el | |
dc.subject | Apache Hadoop | |
dc.subject | MapReduce | |
dc.subject | Electronic data processing -- Distributed processing | |
dc.subject | Cloud computing | |
dc.title | Αποδοτική διαχείριση δεδομένων με χρήση πολυδιάστατων ευρετηρίων στο υπολογιστικό νέφος | |
dc.type | Master Thesis | |
europeana.isShownAt | https://dione.lib.unipi.gr/xmlui/handle/unipi/6646 | |
dc.identifier.call | 005.12 ΓΕΩ | |
dc.description.abstractEN | This master thesis deals with the management of large amounts of data in the cloud. Specifically it studies the ability of using R-tree indexes for querying multidimensional data stored in the cloud effectively. Initially, cloud computing is presented as well as the multidimensional nature of data and the necessity of using indexes when querying multidimensional data. In the next chapter the Map Reduce programming model is presented as well as its implementation, the Hadoop framework, on which the current approach is based. Related studies are referenced followed by a presentation of the R-tree index structure and a description of range query execution over an R-tree index. The next chapters focus on the design and the implementation of the approach including details of the code developed. Then a description of the environment, where the experimental analysis was carried out, takes place. During the experimental analysis range queries were executed, with the use of an R-tree index and without it, on different input files when it comes to the number of points includes and their dimensions. Finally, the conclusions derived from the experimental study are demonstrated showing that using R-tree indexes indeed improves Hadoop’s query performance on multidimensional data. Suggestions for future research are made. | |