dc.contributor.advisor | Φιλιππάκης, Μιχαήλ | |
dc.contributor.author | Χατζηδιάκου, Ελένη | |
dc.date.accessioned | 2022-05-03T06:28:18Z | |
dc.date.available | 2022-05-03T06:28:18Z | |
dc.date.issued | 2022-03 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/14316 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/1739 | |
dc.description.abstract | Σε αυτή την εργασία θα μελετήσουμε τη γεωγραφική εξάπλωση του κορονοϊού. Ως πηγή δεδομένων για τον κορονοϊό είναι οι περιπτώσεις μολύνσεων και θάνατοι ανά ημέρα. Έχουν χρησιμοποιηθεί δεδομένα που περιέχουν αυτή τη στιγμή περίπου 60000 εγγραφές, οπότε είναι κατάλληλα για εφαρμογή τεχνικών ανάλυσης μεγάλων δεδομένων. Ακόμα μελετήθηκαν χωρικά δεδομένα όπως για παράδειγμα κάποια βασικά γεωγραφικά και οικονομικά δεδομένα ανά χώρα (τύπου πληθυσμός, πυκνότητα, ΑΕΠ κλπ) και δημογραφικά δεδομένα (πληθυσμός, πυκνότητα, ηλικία κλπ) για το 2020.
Επιπλέον, αναλύονται χωρικά δεδομένα διαφορετικού τύπου, όπως για παράδειγμα σχετικά με τον καιρό (π.χ. θερμοκρασία, βροχή). Τα μετεωρολογικά δεδομένα είναι για το 2020. Τα παραπάνω δεδομένα θα συνδυαστούν και θα αποτελέσουν χαρακτηριστικά προς ταξινόμηση. Η μεταβλητή στόχος θα είναι η ημερήσια αύξηση του κορονοϊού. Θα χωρίσουμε την αύξηση σε διακριτές κατηγορίες.
Στη συνέχεια θα εκπαιδεύσουμε διάφορους αλγορίθμους, για παράδειγμα K-nearest-neighbors, SVM (support vector machines), δέντρα αποφάσεων (Decision Tree) και Τυχαίο Δάσος (Random Forest). Θα γίνει 10-fold cross-validation, ώστε να χωρίσουμε τα δεδομένα σε υποσύνολα εκπαίδευσης και δοκιμής. Επίσης, θα δοκιμάσουμε διάφορες παραμέτρους, ώστε να βελτιστοποιήσουμε τα αποτελέσματα του κάθε αλγορίθμου. Με βάση τα δεδομένα δοκιμής θα αξιολογήσουμε τους ταξινομητές με διάφορες μετρικές, όπως η ακρίβεια, η ευαισθησία και η εξειδίκευση για να δούμε ποιος αλγόριθμος δίνει το καλύτερο αποτέλεσμα.
Tα γεωγραφικά δεδομένα για τον κορονοϊό που συγκεντρώθηκαν προηγουμένως θα γίνει απεικόνισή τους σε χάρτη. Επίσης, μπορεί να γίνει απεικόνιση σε χάρτη της συσχέτισης των οικονομικών, δημογραφικών και μετεωρολογικών δεδομένων με την εξάπλωση του ιού. Λαμβάνοντας υπόψη τη φύση των δεδομένων, η ανάλυση και η απεικόνιση θα γίνει ανά χώρα. | el |
dc.format.extent | 60 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Ανάλυση δεδομένων COVID-19 με Συστήματα Γεωγραφικών Πληροφοριών | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | In this research we will study the geographical spread of the coronavirus. Τhe coronavirus source of data are the cases of infections and deaths per day. Data that currently contains about 60,000 records have been used, making them suitable for the application of big data analysis techniques. Spatial data were also studied, such as some basic geographical and economic data by country (type of population, density, GDP, etc.) and demographic data (population, density, age, etc.) for 2020.
In addition, spatial data of different types are analyzed, such as the weather (e.g., temperature, rain). The meteorological data is for 2020. The data will be combined and the characteristics will be classified. The variable goal will be the daily increase of the coronavirus. We will divide the increase into distinct categories.
Next, we are going to train various algorithms, for example K-nearest-neighbors, SVM (support vector machines), Decision Tree and Random Forest. There will be 10-fold cross-validation, so that we can divide the data into training and test subsets. Furthermore, we will test various parameters to optimize the results of each algorithm. Based on the test data we will evaluate the classifiers with various metrics such as accuracy, sensitivity and expertise to see which algorithm gives the best result.
The geographical data that was collected before for the coronavirus, will be displayed on a map. The correlation of economic, demographic and meteorological data with the spread of the virus can also be mapped. Taking into account the nature of the data, the analysis and display will be done by country. | el |
dc.contributor.master | Ψηφιακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Μεγάλα δεδομένα | el |
dc.subject.keyword | COVID-19 | el |
dc.subject.keyword | Συστήματα Γεωγραφικών Πληροφοριών | el |
dc.date.defense | 2022-02-28 | |