dc.contributor.advisor | Δουλκερίδης, Χρήστος | |
dc.contributor.advisor | Doulkeridis, Christos | |
dc.contributor.author | Θεοδωρόπουλος, Γεώργιος Στυλιανός | |
dc.contributor.author | Theodoropoulos, George S. | |
dc.date.accessioned | 2022-10-25T11:07:12Z | |
dc.date.available | 2022-10-25T11:07:12Z | |
dc.date.issued | 2022 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/14741 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/2163 | |
dc.description.abstract | Σε αυτή την εργασία, ασχολούμαστε με το πρόβλημα της αναζήτησης των Κ κοντινότερων γειτόνων στα χωρο-κειμενικά δεδομένα χρησιμοποιώντας την σημασιολογική πληροφορία που υπάρχει εντός των κειμενικών εγγραφών. Σε αντίθεση με τις περισσότερες ήδη υπάρχουσες τεχνικές οι οποίες βασίζονται στην απόλυτη αντιστοίχιση λέξεων ή φράσεων, εμείς εστιάζουμε στην χρήση της της σημασιολογικής πληροφορίας αυτής μέσω των word embeddings τα οποία είναι αποδεδειγμένα ικανά στο να αποτυπώσουν την πληροφορία αυτή στην πράξη. Για να υποστηρίξουμε την γρήγορη αναζήτηση, προτείνουμε μια νεά μέθοδο ευρετηρίασης (το CSSI) που εγγυάται την εγγυρότητα των αποτελεσμάτων, καθώς και την προσεγγιστική μέθοδο αυτής (το CSSIA) η οποία περιορίζει σε μεγάλο βαθμό τον αναγκαίο χρόνο αναζήτησης, εισάγωντας ωστόσο ένα μικρό ποσοστό λάθους στα αποτελέσματα. Και οι δυο τεχνικές είναι βασισμένες σε μια “αμφίβια” τεχνική που ευρετηριάζει τόσο τη χωρική όσο και τη κειμενική-σημασιολογική πληροφορία την ίδια στιγμή, με αποτέλεσμα να μειώνεται ο αριθμών των εγγραφών που ελέγχονται και να βελτιώνεται η απόδοση και η κλιμάκωση. | el |
dc.format.extent | 43 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Semantic Spatio-Textual Similarity Search (SSTSS) | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | In this thesis, we address the problem of semantic similarity search over spatio-textual data. In contrast with most existing works on spatial-keyword search that rely on exact matching of query key-words to textual descriptions, we focus on semantic textual similarity using word embeddings, which have been shown to capture semantic similarity exceptionally well in practice. To support efficient search, we propose a novel indexing approach (called CSSI) that ensures correctness of results, alongside its approximate variant (called CSSIA) that introduces a small amount of error in exchange for improved performance. Both variants are based on a hybrid scheme that indexes both spatial and textual/semantic information at the same time, achieving high pruning percentages and improved performance and scalability. | el |
dc.contributor.master | Ψηφιακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Ευρετηρίαση | el |
dc.subject.keyword | Χωρο-κειμενικά δεδομένα | el |
dc.subject.keyword | Πολυδιάστατες αναπαραστάσεις | el |
dc.subject.keyword | Κ-Μέσοι | el |
dc.subject.keyword | Προσεγγιστική ευρετηρίαση | el |
dc.date.defense | 2022-10-18 | |