Semantic Spatio-Textual Similarity Search (SSTSS)
Master Thesis
Συγγραφέας
Θεοδωρόπουλος, Γεώργιος Στυλιανός
Theodoropoulos, George S.
Ημερομηνία
2022Επιβλέπων
Δουλκερίδης, ΧρήστοςDoulkeridis, Christos
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Ευρετηρίαση ; Χωρο-κειμενικά δεδομένα ; Πολυδιάστατες αναπαραστάσεις ; Κ-Μέσοι ; Προσεγγιστική ευρετηρίασηΠερίληψη
Σε αυτή την εργασία, ασχολούμαστε με το πρόβλημα της αναζήτησης των Κ κοντινότερων γειτόνων στα χωρο-κειμενικά δεδομένα χρησιμοποιώντας την σημασιολογική πληροφορία που υπάρχει εντός των κειμενικών εγγραφών. Σε αντίθεση με τις περισσότερες ήδη υπάρχουσες τεχνικές οι οποίες βασίζονται στην απόλυτη αντιστοίχιση λέξεων ή φράσεων, εμείς εστιάζουμε στην χρήση της της σημασιολογικής πληροφορίας αυτής μέσω των word embeddings τα οποία είναι αποδεδειγμένα ικανά στο να αποτυπώσουν την πληροφορία αυτή στην πράξη. Για να υποστηρίξουμε την γρήγορη αναζήτηση, προτείνουμε μια νεά μέθοδο ευρετηρίασης (το CSSI) που εγγυάται την εγγυρότητα των αποτελεσμάτων, καθώς και την προσεγγιστική μέθοδο αυτής (το CSSIA) η οποία περιορίζει σε μεγάλο βαθμό τον αναγκαίο χρόνο αναζήτησης, εισάγωντας ωστόσο ένα μικρό ποσοστό λάθους στα αποτελέσματα. Και οι δυο τεχνικές είναι βασισμένες σε μια “αμφίβια” τεχνική που ευρετηριάζει τόσο τη χωρική όσο και τη κειμενική-σημασιολογική πληροφορία την ίδια στιγμή, με αποτέλεσμα να μειώνεται ο αριθμών των εγγραφών που ελέγχονται και να βελτιώνεται η απόδοση και η κλιμάκωση.