Credit risk prediction with neural networks and feature subset selection
Πρόβλεψη πιστωτικού κινδύνου με νευρωνικά δίκτυα και επιλογή υποσυνόλου χαρακτηριστικών

Master Thesis
Συγγραφέας
Lampropoulos, Konstantinos
Λαμπρόπουλος, Κωνσταντίνος
Ημερομηνία
2025-11Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Neural networks ; Credit risk prediction ; Feature subset selectionΠερίληψη
Στη παρούσα μεταπτυχιακή μελετάμε την πρόβλεψη αθέτησης πληρωμών στο LendingClub (2007-2018) στο πλαίσιο μιας αξιολόγησης που λαμβάνει υπόψη το χρόνο και επιβάλλει χρονολογικούς διαχωρισμούς, αυστηρούς ελέγχους διαρροών και σταθερά όρια που επιλέγονται κατά την επικύρωση. Συγκρίνουμε τρεις κλίμακες συνόλων δεδομένων (10k, 100k, πλήρης) και τέσσερα καθεστώτα χαρακτηριστικών (συμπαγές έως ευαισθητοποιημένο στον πάροχο με τιμολόγηση/βαθμολογίες) σε όλες τις οικογένειες μοντέλων, συμπεριλαμβανομένων των νευρωνικών δικτύων.
Ο εμπλουτισμός των χαρακτηριστικών με int_rate, grade/sub_grade και installment βελτιώνει σταθερά το AUCPR: +0,04 στα 10k (0,460 έναντι 0,421 βασικής γραμμής), +0,03 στα 100k (0,452 έναντι 0,427) και +0,03 στο πλήρες (0,393 έναντι 0,366) . Τα σύνολα δέντρων υπερέχουν συνολικά σε μεγαλύτερα πίνακα δεδομένων [@shwartz2022tabular; @grinsztajn2022why].
Αναλύουμε τους λόγους και σκιαγραφούμε ένα νευρωνικό σχέδιο (κατηγορικές ενσωματώσεις, μονοτονικές ενδείξεις, κανονικοποίηση, βαθμονόμηση) για να μειώσουμε το χάσμα. Τα ερευνητικά ερωτήματα επικεντρώνονται (i) στην επίδραση των χαρακτηριστικών που αναγνωρίζουν τον πάροχο, (ii) στα πρότυπα απόδοσης σε επίπεδο οικογένειας και (iii) στις επιδράσεις του μεγέθους υπό χρονική μετατόπιση.
Παρέχουμε αναπαραγώγιμα τεχνούργημα (leaderboards, PR/ROC, varimp) και έναν οδικό χάρτη για βελτιώσεις με προτεραιότητα στα νευρωνικά δίκτυα και ανθεκτικότητα στη μετατόπιση.


