Συλλογή, ολοκλήρωση και ανάλυση δεδομένων για Covid-19 με τεχνολογίες σημασιολογικού ιστού
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
COVID-19 ; Σημασιολογικός ΙστόςΠερίληψη
Η παρούσα διπλωματική εργασία αποσκοπεί στον συνδυασμό ετερογενών δεδομένων για την εύρεση συσχετίσεων μεταξύ μεταβλητών και την εξαγωγή συμπερασμάτων σχετικά με την εξέλιξη της πανδημίας Covid-19. Αρχικά συλλέχθηκαν δεδομένα από επίσημες πηγές που αναφέρονται άμεσα στις μετρικές της πανδημίας, δεδομένα που αφορούν την ατμοσφαιρική μόλυνση και δεδομένα σχετικά με τις μετακινήσεις του πληθυσμού. Τα δεδομένα αυτά οργανώθηκαν και δομήθηκαν σύμφωνα με τις αρχές του σημασιολογικού ιστού, ενώ δημιουργήθηκε και η αντίστοιχη οντολογία με τη χρήση της γλώσσας OWL και του εργαλείου Protégé. Στη συνέχεια με τη δημιουργία κατάλληλων λεξικών και γραμματικών κανόνων και τη χρήση RDF-Gen παράχθηκαν τα τελικά αρχεία που περιέχουν τις επιθυμητές RDF τριπλέτες. Έτσι η εξαγωγή των επιθυμητών πληροφοριών πραγματοποιήθηκε με την κατασκευή των κατάλληλων SPARQL ερωτημάτων που βασίστηκαν στη δομή της οντολογίας αυτής. Επιπρόσθετα, με τη χρήση της SPARQL και αντίστοιχων queries συγκεντρώθηκαν δευτερεύοντα δεδομένα που προέρχονται από πηγές του σημασιολογικού ιστού και σχετίζονται με τον αριθμό των νοσοκομείων, των αθλητικών εγκαταστάσεων και της πυκνότητας του πληθυσμού για ένα σύνολο πρωτευουσών συγκεκριμένων χωρών-πιλότων. Σύμφωνα με τα αποτελέσματα, φαίνεται να υπάρχουν ενδιαφέρουσες συσχετίσεις ανάμεσα στα δεδομένα που χρήζουν περεταίρω διερεύνησης.