dc.contributor.advisor | Δουλκερίδης, Χρήστος | |
dc.contributor.author | Καραμπίνος, Άγγελος | |
dc.date.accessioned | 2023-07-25T08:31:58Z | |
dc.date.available | 2023-07-25T08:31:58Z | |
dc.date.issued | 2023-06 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/15623 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/3045 | |
dc.description.abstract | Η αυξανόμενη χρήση του Διαδικτύου μέσω κινητών συσκευών εξοπλισμένων με GPS
έχει οδηγήσει στη δημιουργία ενός τεράστιου όγκου δεδομένων χωρο-κειμενικού
χαρακτήρα, τα οποία χαρακτηρίζονται από γεωγραφική θέση και κειμενική περιγραφή. Η
πολυπλοκότητα στη διαχείριση των χωρο-κειμενικών δεδομένων προκύπτει από την
υψηλή διαστασιμότητα του χώρου που αντιπροσωπεύουν.
Δεδομένου του μεγάλου όγκου χωρο-κειμενικών δεδομένων, έχουν αναπτυχθεί ποικίλοι
τύποι ερωτημάτων για να καλύψουν διάφορες ανάγκες. Ωστόσο, αυτή η εργασία
επικεντρώνεται στα χωρο-κειμενικά ερωτήματα εύρους. Ο σκοπός ενός τέτοιου
ερωτήματος είναι να εντοπίζει αντικείμενα που βρίσκονται κοντά σε μια καθορισμένη
τοποθεσία και επιδεικνύουν ομοιότητα με τις λέξεις-κλειδιά του ερωτήματος. Επιπλέον
λόγω του όγκου τους απαιτούνται κατανεμημένα συστήματα για την επεξεργασία και
αποθήκευσή τους.
Στην παρούσα διπλωματική εργασία, παρουσιάστηκε ένας αλγόριθμος ευρετηρίασης
χωρο-κειμενικών δεδομένων για εκτέλεση ερωτημάτων εύρους σε κατανεμημένο
περιβάλλον επεξεργασίας. Ο αλγόριθμος υλοποιήθηκε σε Apache Spark και συγκρίθηκε
με spatial first και textual first μεθόδους σε Apache Spark, Apache Sedona και GeoMesa
ως προς τον χρόνο εκτέλεσης. | el |
dc.format.extent | 56 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.title | Επεξεργασία χωροκειμενικών ερωτημάτων εύρους για μεγάλα δεδομένα | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | The widespread use of the Internet via GPS enabled mobile devices has led to the
generation of an enormous volume of spatio-textual data, characterized by geographic
location and textual description. The complexity of managing spatio-textual data arises
from the high dimensionality of the representation space.
Given the vast volume of spatio-textual data, a variety of query types have been proposed
to address diverse needs. This work, however, concentrates on spatio-textual range
queries. The purpose of such a query is to identify objects that are near to a specified
location and exhibit similarity with the query's keywords. Furthermore, due to the high
volume of data, distributed systems become necessary for effective processing and
storage.
This dissertation presents a spatio-textual indexing algorithm for conducting spatio-
textual range queries within a distributed processing environment. The algorithm was
implemented on Apache Spark and compared with spatial first and textual first methods
in Apache Spark, Apache Sedona and GeoMesa in terms of execution time. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Χωρο-κειμενικά δεδομένα | el |
dc.subject.keyword | Χωρο-κειμενική ευρετηρίαση | el |
dc.subject.keyword | Ερωτήματα εύρους | el |
dc.subject.keyword | Κατανεμημένη επεξεργασία | el |
dc.date.defense | 2023-07 | |