| dc.contributor.advisor | Τριανταφύλλου, Ιωάννης | |
| dc.contributor.author | Φακατσέλη, Μαρία Άννα | |
| dc.date.accessioned | 2025-11-04T11:18:47Z | |
| dc.date.available | 2025-11-04T11:18:47Z | |
| dc.date.issued | 2025-09 | |
| dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/18327 | |
| dc.description.abstract | Η ηπατίτιδα είναι μια ασθένεια που οφείλεται στη φλεγμονή του ήπατος και μπορεί να προκληθεί από διαφορετικούς ιούς, κατανάλωση αλκοόλ, φάρμακα και άλλους παράγοντες. Οι πιο γνωστές ιογενείς μορφές είναι η ηπατίτιδα A, B, C, D και E. Η πρόοδος της ιατρικής επιστήμης έχει συμβάλει σημαντικά στη μείωση του αριθμού των κρουσμάτων της ασθένειας αυτής. Τα περισσότερα κράτη έχουν αναπτύξει ειδικές στρατηγικές με σκοπό τη μείωση της εξάπλωσης της νόσου. Κάθε κράτος όμως έχει τη δική του φιλοσοφία, οικονομία και ανάπτυξη, με αποτέλεσμα ο ιός της ηπατίτιδας να μην εξαπλώνεται ομοιόμορφα στον κόσμο. Πολλές χώρες σημειώνουν μέχρι και σήμερα υψηλό αριθμό κρουσμάτων.
Το μεγαλύτερο πρόβλημα παγκοσμίως προκαλεί η ηπατίτιδα C και στην συνέχεια η ηπατίτιδα B. Για την παρούσα διπλωματική εργασία συλλέχθηκαν δεδομένα από την ιστοσελίδα του Παγκόσμιου Οργανισμού Υγείας, τα οποία σχετίζονται με διάφορα χαρακτηριστικά των ηπατίτιδων B και C στον πληθυσμό αρκετών χωρών. Με βάση τα χαρακτηριστικά αυτά εφαρμόζεται η στατιστική μέθοδος Ανάλυση Κατά Συστάδες, με σκοπό να εντοπιστούν ομοιόμορφες ομάδες χωρών που έχουν παρόμοια αντιμετώπιση του ιού της ηπατίτιδας. Στην συνέχεια εφαρμόζεται η μέθοδος της Ανάλυσης Κύριων Συνιστωσών η οποία απλοποιεί τα δεδομένα που έχουν συλλεχθεί, τα οποία περιέχουν μεγάλο πλήθος χαρακτηριστικών σχετικά με τις προαναφερθείσες ηπατίτιδες. Με τα απλοποιημένα δεδομένα που λαμβάνουμε από την Ανάλυση των Κύριων Συνιστωσών πραγματοποιείται ξανά ομαδοποίηση των χωρών, ώστε να συγκριθούν τα αποτελέσματα και να αξιολογηθεί αν οι ομάδες που δημιουργούνται με τα απλούστερα δεδομένα που περιέχουν λιγότερο «θόρυβο» είναι πιο συμπαγείς.
Έπειτα, ως γνωστών η στατιστική είναι πολύ χρήσιμη όχι μόνο για την ανάλυση δεδομένων αλλά και για την πρόβλεψη τιμών. Για αυτόν το λόγο, στο τέλος εφαρμόζονται δύο προβλεπτικά μοντέλα, τα οποία είναι εξαιρετικά χρήσιμα για τη βελτίωση των στρατηγικών που εφαρμόζει κάθε κράτος. Αρχικά, προσαρμόζεται στα δεδομένα μας ένα μοντέλο Παλινδρόμησης Ridge, με σκοπό την πρόβλεψη του αριθμού θανάτων που προκαλούνται από την νόσο της ηπατίτιδας B σε μια χώρα. Τέλος, εφαρμόζεται η μέθοδος Μηχανής Υποστήριξης Διανυσμάτων (SVM), με στόχο να προσδιοριστεί αν μια χώρα ανήκει στην κατηγορία χωρών που αντιμετωπίζουν δυναμικά την ηπατίτιδα B ή στην κατηγορία χωρών όπου απαιτούνται αρκετές βελτιώσεις. | el |
| dc.format.extent | 137 | el |
| dc.language.iso | el | el |
| dc.publisher | Πανεπιστήμιο Πειραιώς | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.title | Η εξάπλωση των κυριότερων ιών ηπατίτιδας σε παγκόσμια κλίμακα : ανάλυση δεδομένων και συμπεράσματα | el |
| dc.title.alternative | The spread of the main hepatitis viruses on a global scale : data analysis and conclusions | el |
| dc.type | Master Thesis | el |
| dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
| dc.description.abstractEN | Hepatitis is a disease caused by inflammation of the liver and can be triggered by various viruses, alcohol consumption, medications, and other factors. The most well-known viral forms are hepatitis A, B, C, D, and E. Advances in medical science have significantly contributed to reducing the number of cases of this disease. Most countries have developed specific strategies aimed at limiting the spread of the disease. However, each country has its own philosophy, economy, and level of development, resulting in the hepatitis virus not spreading uniformly worldwide. Many countries continue to report a high number of cases even today.
The greatest global concern is caused by hepatitis C, followed by hepatitis B. For the purposes of this thesis, data were collected from the World Health Organization's website, relating to various characteristics of hepatitis B and C in the populations of several countries. Based on these characteristics, the statistical method Cluster Analysis is applied, with the aim of identifying homogeneous groups of countries that have similar approaches to manag-ing the hepatitis virus.
Next, Principal Component Analysis (PCA) is applied, which simplifies the collected data, which contain a large number of features related to the aforementioned types of hepatitis. Using the simplified data obtained from PCA, countries are re-clustered to compare the results and evaluate whether the groups created from the simplified data, which contain less “noise,” are more cohesive.
Furthermore, statistics are widely recognized as being highly useful not only for data analysis but also for predicting values. For this reason, two predictive models are applied at the end, which are extremely useful for improving the strategies implemented by each country. Initially, a Ridge Regression model is fitted to the data in order to predict the number of deaths caused by hepatitis B in a given country. Finally, the Support Vector Machine (SVM) method is applied, aiming to determine whether a country belongs to the category of countries effectively managing hepatitis B or to the category of countries where significant improvements are required. | el |
| dc.contributor.master | Εφαρμοσμένη Στατιστική | el |
| dc.subject.keyword | Ηπατίτιδα | el |
| dc.subject.keyword | Ανάλυση δεδομένων | el |
| dc.subject.keyword | Μηχανική μάθηση | el |
| dc.subject.keyword | Machine learning | el |
| dc.subject.keyword | Cluster analysis | el |
| dc.subject.keyword | Hepatitis | el |
| dc.subject.keyword | Data analysis | el |
| dc.subject.keyword | SVM | el |
| dc.subject.keyword | Ridge regression | el |
| dc.subject.keyword | PCA | el |
| dc.date.defense | 2025-09-22 | |