Επεξεργασία χωροκειμενικών ερωτημάτων σε Redis - RediSearch
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
NoSQL ; Redis ; RediSearch ; Χωροκειμενικά δεδομένα ; Κειμενικά δεδομέναΠερίληψη
Ιδιαίτερα την τελευταία δεκαετία η μεγάλη ανάπτυξη των δυνατοτήτων των κινητών τηλεφώνων και ιδιαίτερα η δυνατότητα χρήσης GPS από όλο και περισσότερους χρήστες παράλληλα, έχουν οδηγήσει στην παραγωγή μεγάλου όγκου χωρικών δεδομένων. Σε συνδυασμό με την έξαρση των κοινωνικών δικτύων και ιστοσελίδων κριτικών όπως Twitter και IMDB αντίστοιχα έχει παρουσιαστεί μία ακόμα πολύ ενδιαφέρουσα κατηγορία δεδομένων, αυτή των χωροκειμενικών δεδομένων. Λόγω των παραπάνω, ο ρυθμός παραγωγής αλλά και ο όγκος αυτών των δεδομένων έχουν αυξηθεί σε μεγάλο βαθμό με συνέπεια να προκύπτουν πολλές προκλήσεις με βασικό όμως στόχο την αποτελεσματική αποθήκευση, διαχείριση και προσπέλαση αυτών. Για την διαχείριση τέτοιου μεγέθους δεδομένων έχουν υιοθετηθεί τα τελευταία χρόνια κατανεμημένα συστήματα βάσεων δεδομένων και πιο συγκεκριμένα αυτά των συστημάτων NoSQL. Παρέχουν πλέον μία σίγουρη επιλογή για την διαχείριση μεγάλου όγκου δεδομένων, προσφέροντας υψηλές επιδόσεις, διαθεσιμότητα και κλιμακωσιμότητα. Έχοντας ως στόχο να παρέχουμε έναν ενιαίο τρόπο προσπέλασης δεδομένων αποθηκευμένα σε βάσεις NoSQL, σε αυτή την διπλωματική εργασία παρουσιάζεται ένα επανασχεδιασμένο Application Programming Interface (API) το οποίο κάνει την διαδικασία προσπέλασης ανεξαρτήτως του συστήματος πολύ εύκολη προς τον χρήστη. Το υπάρχον API προσφέρει πολλά πρότυπα ερωτήματα για την σύνταξη ερωτημάτων και την εκτέλεση λειτουργιών προσπέλασης. Εμπλουτίζεται όμως με την προσθήκη της δυνατότητας εκτέλεσης κειμενικών και χωροκειμενικών ερωτημάτων. Πολλές σύγχρονες NoSQL βάσεις δεδομένων υποστηρίζουν ευρετηρίαση χωρικών δεδομένων αλλά όχι των χωροκειμενικών που προαναφέρθηκαν. Εκμεταλλευόμενοι αυτό το κενό, παρουσιάζεται η υλοποίηση μίας τεχνικής ευρετηρίασης χωροκειμενικών δεδομένων καθώς επίσης η διενέργεια πειραμάτων με την χρήση της Redis αλλά και του module αυτής RediSearch, με στόχο να μελετήσουμε την επίδοση και την αποδοτικότητα αυτού του συστήματος για τα χωροκειμενικά δεδομένα.