dc.contributor.advisor | Sotiropoulos, Dionisios | |
dc.contributor.advisor | Σωτηρόπουλος, Διονύσιος | |
dc.contributor.author | Solanakis, Spyridon | |
dc.contributor.author | Σολανάκης, Σπυρίδων | |
dc.date.accessioned | 2025-03-13T10:59:27Z | |
dc.date.available | 2025-03-13T10:59:27Z | |
dc.date.issued | 2025-02 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/17547 | |
dc.description | Not available until 07/03/2028 | |
dc.description.abstract | Η παρούσα μεταπτυχιακή διατριβή επεκτείνει τη δουλειά που παρουσιάστηκε στο άρθρο "Evolving
Transparent Credit Risk Models: A Symbolic Regression Approach Using Genetic Programming"
(Sotiropoulos et al. 2024), εστιάζοντας στη βελτίωση της ακρίβειας πρόβλεψης πιστωτικού κινδύνου
μέσω προηγμένων τεχνικών μοντελοποίησης. Η αρχική μελέτη πρότεινε ένα πολυεπίπεδο πλαίσιο
παλινδρόμησης για την ανάλυση κανονικοποιημένων FICO scores, τα οποία χωρίστηκαν σε 20
κατηγορίες που αντιπροσωπεύουν διαφορετικά επίπεδα πιστωτικού κινδύνου. Παρότι το πλαίσιο
αντιμετώπισε αποτελεσματικά το πρόβλημα της παλινδρόμησης χρησιμοποιώντας διάφορα μοντέλα
μηχανικής μάθησης, εντοπίστηκαν προκλήσεις στα ανώτερα επίπεδα λόγω της αυξημένης
πολυπλοκότητας και της επικάλυψης των κλάσεων.
Με βάση αυτά τα ευρήματα, η παρούσα έρευνα εισάγει τα Kolmogorov-Arnold Networks (KANs) ως
μια ερμηνεύσιμη εναλλακτική λύση στα «black box» μοντέλα. Παράλληλα, διερευνώνται προηγμένες
μέθοδοι επεξεργασίας χαρακτηριστικών (feature engineering) και επαναληπτικής αναπροσαρμογής του
dataset για την αντιμετώπιση προβλημάτων εσφαλμένης ταξινόμησης δεδομένων και της
μεταβλητότητας στα ανώτερα επίπεδα. Κύριες καινοτομίες περιλαμβάνουν την εκ νέου ανάθεση
σημείων δεδομένων σε FICO κατηγορίες βάσει της εγγύτητας στα κεντροειδή, την ανακατανομή των
δεδομένων σε επίπεδα ώστε να διασφαλιστεί ισορροπημένη εκπροσώπηση και την εφαρμογή μέσων
τιμών FICO από τα k κοντινότερα κεντροειδή. Αυτές οι μεθοδολογίες οδήγησαν σε σημαντικές
βελτιώσεις στην ακρίβεια πρόβλεψης, επιτυγχάνοντας τιμές κοντά στη μονάδα σε ορισμένες
διαμορφώσεις, ιδιαίτερα για datasets με διευρυμένα σύνολα χαρακτηριστικών.
Τα αποτελέσματα επιβεβαιώνουν την υπόθεση ότι ορισμένα σημεία δεδομένων είχαν αρχικά
ταξινομηθεί λανθασμένα σε εσφαλμένες κατηγορίες ή ότι επιπλέον χαρακτηριστικά που δεν
περιλαμβάνονται στο dataset επηρεάζουν τις αναθέσεις στις κατηγορίες. Συνολικά, τα ευρήματα
υποδεικνύουν ότι η βελτίωση των αναθέσεων στις FICO κατηγορίες και η ενίσχυση της κατανομής των
δεδομένων στα επίπεδα είναι κρίσιμα βήματα για τη βελτίωση της απόδοσης των μοντέλων. Επιπλέον,
η ενσωμάτωση πρόσθετων χαρακτηριστικών ή εξειδικευμένης γνώσης του πεδίου μπορεί να
βελτιστοποιήσει περαιτέρω τις προβλέψεις πιστωτικού κινδύνου και να προσφέρει μια ισχυρότερη
βάση για μελλοντικές εξελίξεις στον τομέα. | el |
dc.format.extent | 86 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Advanced deep learning techniques for credit risk prediction | el |
dc.title.alternative | Προηγμένες τεχνικές βαθιάς μάθησης για πρόβλεψη πιστωτικού κινδύνου | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | This thesis extends the work presented in "Evolving Transparent Credit Risk Models: A Symbolic
Regression Approach Using Genetic Programming" (Sotiropoulos et al. 2024), focusing on improving
credit risk prediction accuracy through advanced modeling techniques. The original study proposed a
layered regression framework to model normalized FICO scores, discretized into 20 bins representing
distinct levels of credit risk. While the framework effectively addressed the regression task using various
machine learning models, challenges were identified in the higher-index layers due to increased data
complexity and class overlap.
Building upon these findings, this research introduces Kolmogorov-Arnold Networks (KANs) as an
interpretable alternative to black-box models. The study also explores advanced feature engineering
and iterative dataset refinement methods to address issues of data misclassification and variability in
higher-index layers. Key innovations include the reassignment of data points to FICO bins based on
proximity to centroids, the redistribution of data points across layers to ensure balanced representation,
and the application of mean FICO values from the nearest k-bin centroids. These methodologies yielded
significant improvements in prediction accuracy, achieving near-perfect values in some
configurations, particularly for datasets with extended feature sets.
The results support the hypothesis that certain data points were initially misclassified into incorrect
bins or that additional latent features not captured in the dataset influence bin assignments. Ultimately,
the findings suggest that refining FICO bin assignments and improving data distribution across layers are
critical steps toward enhancing model performance. Furthermore, the integration of additional features
or domain knowledge has the potential to further optimize credit risk predictions and provide a stronger
foundation for future advancements in the field. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Παρεμβολή | el |
dc.subject.keyword | Τεχνητά νευρωνικά δίκτυα | el |
dc.subject.keyword | Βαθιά μάθηση | el |
dc.subject.keyword | Δίκτυα Kolmogorov-Arnold | el |
dc.subject.keyword | Αξιολόγηση πιστοληπτικής κανότητας | el |
dc.subject.keyword | Regression | el |
dc.subject.keyword | Artificial neural networks | el |
dc.subject.keyword | Deep learning | el |
dc.subject.keyword | Kolmogorov-Arnold networks | el |
dc.subject.keyword | Credit scoring | el |
dc.date.defense | 2025-02-25 | |