dc.contributor.advisor | Φιλιππάκης, Μιχαήλ | |
dc.contributor.author | Μάρκου, Χρυσοβαλάντου Ευαγγελία | |
dc.date.accessioned | 2025-10-21T14:20:50Z | |
dc.date.available | 2025-10-21T14:20:50Z | |
dc.date.issued | 2025 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/18245 | |
dc.description.abstract | Η παρούσα διπλωματική εργασία εξετάζει τη χρήση μεθόδων μηχανικής μάθησης για την
πρόβλεψη της εμφάνισης διαβήτη. Με χρήση ενός μεγάλου συνόλου δεδομένου υγείας
πραγματοποιήθηκε εκπαίδευση μίας σειράς αλγορίθμων ταξινόμησης με σκοπό τον
εντοπισμό του μοντέλου που θα μπορούσε να πετύχει την καλύτερη πρόβλεψη.
Δοκιμάστηκαν αλγόριθμοι, όπως η Λογιστική Παλινδρόμηση, ο Random Forest, οι SVM,
ο XGBoost και ο LightGBM. Οι αλγόριθμοι αξιολογήθηκαν στη βάση τυπικών μετρικών
όπως η ακρίβεια, η ευστοχία, η ανάκληση και η καμπύλη ROC. Οι XGBoost και LightGBM
παρουσίασαν την υψηλότερη απόδοση με ακρίβεια 97%. Ενώ η χρήση τεχνικών SMOTE
αποδείχθηκε αρκετά αποτελεσματική στη βελτίωση της ικανότητας πρόβλεψης των
εκπαιδευμένων μοντέλων συνολικά. Τέλος, η ανάπτυξη ενός API που επιτρέπει την
αυτόματη διάγνωση με βάση τα δεδομένα εισόδου περιπτώσεων ασθενών, υποδεικνύει την
άμεση εφαρμοσιμότητα και επεκτασιμότητα της μελέτης, καθώς και τον τρόπο που αυτή
θα μπορούσε να καταστεί μέρος ευρύτερων πληροφοριακών εφαρμογών πραγματικής
χρήσης στο πεδίο της κλινικής πρακτικής. | el |
dc.format.extent | 40 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Πρόβλεψη διαβήτη χρησιμοποιώντας data mining αλγορίθμους και ανάλυση με Python | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | This diploma thesis examines the use of machine learning methods to predict the occurrence
of diabetes. Using a large set of health data, a series of classification algorithms were trained
in order to identify the model that could achieve the best prediction. Algorithms such as
Logistic Regression, Random Forest, SVM, XGBoost and LightGBM were tested. The
algorithms were evaluated on the basis of standard metrics such as accuracy, accuracy,
recall, and ROC curve. XGBoost and LightGBM showed the highest performance with 97%
accuracy. While the use of SMOTE techniques proved quite effective in improving the
predictive ability of the trained models overall. Finally, the development of an API that
enables automatic diagnosis based on patient case input data indicates the immediate
applicability and scalability of the study, as well as how it could become part of broader
real-world information applications in the field of clinical practice. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Data mining | el |
dc.subject.keyword | Python | el |
dc.subject.keyword | Πρόβλεψη διαβήτη | el |
dc.subject.keyword | Ανάλυση με Python | el |
dc.date.defense | 2025-04-03 | |