Scalable indexing and query processing of big spatio-temporal data
Κλιμακώσιμη ευρετηρίαση και επεξεργασία ερωτημάτων για μεγάλα χωρο-χρονικά δεδομένα
Doctoral Thesis
Συγγραφέας
Koutroumanis, Nikolaos
Κουτρουμάνης, Νικόλαος
Ημερομηνία
2024-07Επιβλέπων
Doulkeridis, ChristosΔουλκερίδης, Χρήστος
Λέξεις κλειδιά
Indexing ; Querying ; Data processing ; Big data ; Spatio-temporal data ; NoSQL ; Spatial joins ; Weather data ; Column-oriented file formatΠερίληψη
Η εποχή μας χαρακτηρίζεται ως η «Εποχή των Μεγάλων Δεδομένων» όπου ο όγκος των παραγόμενων δεδομένων αυξάνεται εκθετικά. Πολλά από τα παραγόμενα δεδομένα καταγράφουν πληροφορίες γεγονότων και φαινομένων που εκτυλίσσονται τόσο στο χώρο όσο και στο χρόνο. Αυτού του είδους τα δεδομένα είναι επίσης γνωστά ως χωροχρονικά δεδομένα, τα οποία συναντώνται σε διάφορους τομείς όπως ο πολεοδομικός σχεδιασμός, η υλικοτεχνική υποστήριξη μεταφορών, η επιδημιολογία και η παρακολούθηση του περιβάλλοντος. Η ανάλυση αυτών των δεδομένων σε μεγάλη κλίμακα, μπορεί να αποκαλύψει μοτίβα και τάσεις από τις οποίες μπορεί να εξαχθεί πολύτιμη γνώση. Παρόλο που οι παραδοσιακές προσεγγίσεις διαχείρισης δεδομένων έχουν μελετηθεί εκτενώς, εξακολουθεί να αποτελεί πρόκληση η υποστήριξη αποτελεσματικών λειτουργιών σε περιβάλλοντα υψηλής κλιμακωσιμότητας. Η χρήση νέων συστημάτων διαχείρισης δεδομένων και αλγορίθμων σε κατανεμημένα περιβάλλοντα είναι απαραίτητη για την κάλυψη των απαιτήσεων μεγάλων όγκων δεδομένων. Προς αυτή την κατεύθυνση, η παρούσα διατριβή εστιάζει στους θεματικούς τομείς διαχείρισης δεδομένων όπως: i) της αποθήκευσης, ii) της ευρετηρίασης, iii) των επερωτήσεων και iv) της επεξεργασίας μεγάλων χωροχρονικών δεδομένων. Οι προτεινόμενες μέθοδοι και αλγόριθμοι βελτιώνουν την εφαρμογή ευρέως χρησιμοποιούμενων τρόπων αποθήκευσης και πλαισίων του οικοσυστήματος των μεγάλων δεδομένων για χωροχρονικά δεδομένα, τα οποία δεν υποστηρίζουν εγγενώς. Οι προτεινόμενες λύσεις μπορούν να κλιμακωθούν αποτελεσματικά, καθιστώντας τις κατάλληλες για περιπτώσεις δεδομένων υψηλής εντάσεως.