dc.contributor.advisor | Filippakis, Michael | |
dc.contributor.advisor | Φιλιππάκης, Μιχαήλ | |
dc.contributor.author | Voulgari, Evangelia | |
dc.contributor.author | Βούλγαρη, Ευαγγελία | |
dc.date.accessioned | 2025-06-02T11:37:53Z | |
dc.date.available | 2025-06-02T11:37:53Z | |
dc.date.issued | 2025-02 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17811 | |
dc.description.abstract | Με τη ραγδαία αύξηση των δεδομένων, ο τομέας της ανάλυσης δεδομένων αναπτύχθηκε επίσης, ιδιαίτερα στον τομέα της υγειονομικής περίθαλψης. Οι καρδιακές παθήσεις αποτελούν μία από τις κύριες αιτίες θανάτου παγκοσμίως, γεγονός που καθιστά την έγκαιρη ανίχνευση ζωτικής σημασίας.
Οι παραδοσιακές μέθοδοι διάγνωσης των καρδιακών παθήσεων συχνά απαιτούν ακριβές και χρονοβόρες ιατρικές εξετάσεις, οι οποίες δεν εγγυώνται πάντα ακριβή αποτελέσματα. Από την άλλη πλευρά, η μηχανική μάθηση προσφέρει έναν ταχύτερο και πιο αποδοτικό τρόπο ανάλυσης των δεδομένων των ασθενών και πρόβλεψης του κινδύνου καρδιοπάθειας.
Η παρούσα εργασία εξετάζει την εφαρμογή της ανάλυσης δεδομένων με Python και αλγορίθμων μηχανικής μάθησης για την πρόβλεψη καρδιακών παθήσεων. Το σύνολο δεδομένων που χρησιμοποιείται περιλαμβάνει βασικά ιατρικά χαρακτηριστικά. Σε αυτό το σύνολο δεδομένων εφαρμόζονται τεχνικές προεπεξεργασίας όπως καθαρισμός δεδομένων, κανονικοποίηση και κωδικοποίηση χαρακτηριστικών, ώστε τα δεδομένα να είναι κατάλληλα για περαιτέρω επεξεργασία. Επιπλέον, πραγματοποιείται Εξερευνητική Ανάλυση Δεδομένων (EDA) για την αναγνώριση προτύπων και συσχετίσεων μεταξύ των χαρακτηριστικών.
Η μελέτη υλοποιεί και συγκρίνει δύο μοντέλα μηχανικής μάθησης: τον Random Forest Classifier, που ανήκει στις επιβλεπόμενες μεθόδους μάθησης, και τον K-Means Clustering, που είναι μία μη επιβλεπόμενη μέθοδος. Η απόδοση των μοντέλων αξιολογείται μέσω βασικών μετρικών, όπως η ακρίβεια (accuracy), η ακρίβεια προβλέψεων (precision), η ανάκληση (recall) και ο δείκτης F1 (F1-score).
Τα ευρήματα αυτής της έρευνας δείχνουν ότι τα μοντέλα μηχανικής μάθησης, και ιδιαίτερα ο Random Forest Classifier, μπορούν να προβλέψουν αποτελεσματικά την καρδιοπάθεια με υψηλή ακρίβεια. Η ανάλυση της σημασίας των χαρακτηριστικών ανέδειξε βασικούς παράγοντες κινδύνου, όπως η ηλικία, τα επίπεδα χοληστερόλης, η αρτηριακή πίεση και ο τύπος πόνου στο στήθος, επιβεβαιώνοντας τη σημασία τους στη διάγνωση καρδιοπαθειών.
Η μελέτη υπογραμμίζει τη δυναμική ενσωμάτωσης μοντέλων μηχανικής μάθησης στα συστήματα υγείας, με σκοπό την έγκαιρη διάγνωση, τη μείωση του κόστους και τη βελτίωση των αποτελεσμάτων για τους ασθενείς. Μελλοντική έρευνα θα μπορούσε να εξετάσει τεχνικές βαθιάς μάθησης, παρακολούθηση ασθενών σε πραγματικό χρόνο μέσω φορετής τεχνολογίας και ενσωμάτωση προβλεπτικών μοντέλων σε συστήματα υποστήριξης ιατρικών αποφάσεων.
Αυτή η εργασία συμβάλλει στην έρευνα για τη χρήση της Τεχνητής Νοημοσύνης (AI) στην υγειονομική περίθαλψη, δείχνοντας πώς η ανάλυση δεδομένων μπορεί να βοηθήσει στη βελτίωση της διάγνωσης καρδιοπαθειών. | el |
dc.format.extent | 75 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Data analysis and prediction algorithms with Python | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | With the rapid increase of data, the field of data analysis also developed, especially in healthcare. Heart
disease is one of the leading causes of death worldwide, making early detection a crucial matter.
Traditional diagnosing methods for heart disease often require expensive and time-consuming medical
test, which may not always correspond to accurate results. On the other hand, machine learning offers a
faster and more efficient way to analyze patient data and predict heart disease risk.
This thesis explores the application of Python-Based data analysis and machine learning algorithms for
heart disease prediction. The dataset that will be used for this, contains key medical attributes. In this
dataset there going to be applied preprocessing techniques such as data cleaning, normalization and
feature encoding to ensure that the data was ready for further process. Exploratory Data Analysis (EDA)
will be applied to identify patterns and correlations within the features. The study implements and
compares two machine learning models, the Random Forest Classifier, that is a supervised learning
approach and K-Means Clustering that is an unsupervised learning method. Model performance will be
evaluated with the use of key metrics, including accuracy, precision, recall and F1-score.
Findings from this research indicate that machine learning models, particularly the Random Forest
Classifier, can effectively predict heart disease with high accuracy. Feature importance analysis identified
key risk factors such as age, cholesterol levels, blood pressure, and chest pain type, reinforcing their
significance in heart disease diagnosis. The study highlights the potential of integrating machine learning
models into healthcare systems to facilitate early detection, reduce costs, and enhance patient outcomes.
Future research could explore deep learning techniques, real-time patient monitoring with wearable
technology and the integration of predictive models into clinical decision support systems. This thesis
contributes to the research on using Artificial Intelligence (AI) in healthcare, showing how data analysis
can help improve heart disease diagnosis. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Data analysis | el |
dc.subject.keyword | Prediction algorithms | el |
dc.subject.keyword | Python | el |
dc.subject.keyword | Healthcare data | el |
dc.subject.keyword | Machine learning | el |
dc.date.defense | 2025-05-28 | |