dc.contributor.advisor | Sotiropoulos, Dionisios | |
dc.contributor.advisor | Σωτηρόπουλος, Διονύσιος | |
dc.contributor.author | Papasymeon, Michail | |
dc.contributor.author | Παπασυμεών, Μιχαήλ | |
dc.date.accessioned | 2022-02-21T08:00:32Z | |
dc.date.available | 2022-02-21T08:00:32Z | |
dc.date.issued | 2021-12 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/14122 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/1545 | |
dc.description.abstract | Το πιστωτικό σκορ αποτελεί έναν καθοριστικό παράγοντα για την διαχείριση του
οικονομικού ρίσκου δίνοντας τη δυνατότητα στα χρηματοπιστωτικά ιδρύματα να
ποσοτικοποιήσουν την πιθανότητα της υγιούς εξόφλησης ενός δανείου. Ωστόσο, τα σύγχρονα
και αναγνωρισμένα από την βιομηχανία μοντέλα μέτρησης πιστοληπτικού ρίσκου που
παρέχονται από ιδιωτικές εταιρίες μεταξύ άλλων όπως η FICO και η Vantage δεν είναι διαθέσιμα
στο κοινό.
Η δυσκολία του προβλήματος αυξάνεται δραστικά λαμβάνοντας υπ’ όψη την έλλειψη
γνώσης του αρχικού μοντέλου αλλά και των μεταβλητών που αυτό χρησιμοποιεί για να παράξει
το πιστοληπτικό σκορ ενός φυσικού προσώπου. Το προτεινόμενο μοντέλο θα παραχθεί
αξιοποιώντας ένα υποσύνολο του πλήθους των αρχικών μεταβλητών που έχουν συγκεντρωθεί
από τις χιλιάδες αιτήσεις δανεισμού που έχουν πραγματοποιηθεί από φυσικά πρόσωπα στην
πλατφόρμα. Το υποσύνολο αυτό αποτελείται από εύκολα προσβάσιμες μεταβλητές δίνοντας τη
δυνατότητα στο τελικό μοντέλο να μπορεί να υπολογίσει το πιστοληπτικό ρίσκο ενός φυσικού
προσώπου χωρίς την ανάγκη των δύσκολα προσβάσιμων ιστορικών πιστωτικών δεδομένων.
Στόχος της παρούσας διπλωματικής εργασίας είναι η δημιουργία ενός εναλλακτικού
μοντέλου ανάλυσης και μέτρησης του πιστοληπτικού κινδύνου που προσεγγίζει την συμπεριφορά
του μοντέλου που έχει αναπτύξει η FICO χρησιμοποιώντας μια μεγάλη συλλογή δεδομένων που
σχετίζονται με τον δανεισμό από την πλατφόρμα “Lending Club”. Πιο συγκεκριμένα, σκοπός μας
είναι να παρουσιάσουμε τη μέτρηση του πιστωτικού ρίσκου με ένα κατανοητό από τον άνθρωπο
και παραμετροποιήσιμο σε πολυπλοκότητα μαθηματικό μοντέλο. Για τον λόγο αυτό θα
χρησιμοποιήσουμε ένα μοντέλο συμβολικής παλινδρόμησης το οποίο λειτουργεί στο πλαίσιο του
γενετικού προγραμματισμού.
Για να πιστοποιήσουμε την εγκυρότητα της προσέγγισης μας συγκρίνουμε τα
αποτελέσματα του γενετικού προγραμματισμού με άλλα “state-of-the-art” μοντέλα μηχανικής
μάθησης όπως Συστήματα Υποστήριξης Αποφάσεων (ΣΥΑ), Πολλαπλών Στρώσεων Perceptron
(MLP) και Radial Basis Function Networks (RBFNs). Χρησιμοποιώντας ένα δραστικά μικρότερο
σύνολο μεταβλητών αποδεικνύεται ότι τα αποτελέσματα του γενετικού προγραμματισμού είναι
συγκρίσιμα με τις παραπάνω αναγνωρισμένες μεθόδους. Ταυτόχρονα, το παραχθέν μοντέλο
παρουσιάζει πολύτιμες πληροφορίες για τους μηχανισμούς οι οποίοι συντελούν στον υπολογισμό
του FICO σκορ. | el |
dc.format.extent | 36 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Evolving measures of credit risk | el |
dc.title.alternative | Εξελισσόμενα μέτρα πιστωτικού κινδύνου | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | Credit scoring constitutes a quintessential element of economic risk management
allowing financial agencies to quantify the probability of default for a future loan. However,
acclaimed contemporary credit risk measures such as the scores provided by FICO or Vantage
are not publicly accessible.
The severity of the underlying problem is manifested by the limited amount of knowledge
which can be obtained for both the exact analytical formula and the complete set of credit-specific
features that underpin the computation of FICO score. The proposed measure will be derived by
exploiting a limited amount of entry-level information submitted by each candidate borrower
without requiring the accumulation of historical credit data for each consumer over large periods
of time.
This thesis addresses the problem of developing an alternative credit scoring measure
that approximates the behavior of the original FICO score in a large-scale collection of loan-
related data available from Lending Club. We are particularly interested in expressing the
acquired credit risk measure in a closed analytical form of adjustable complexity. For this purpose,
we utilize a symbolic regression technique which operates within the framework of Genetic
Programming (GP). In this context, we harness the notion of Occam’s razor to apply evolutionary
pressure towards the preservation of models associated with reduced complexity and higher
degree of human interpretability.
In order to verify the validity of our approach we compare the approximation ability of the
GP-based symbolic regression against state-of-the-art machine learning-based regression
methods such as Support Vector Machines (SVMs), Multi-Layer Perceptrons (MLPs) and Radial
Basis Function Networks (RBFNs). Our experimentation demonstrates that GP-based symbolic
regression achieves comparable accuracy with respect to the aforementioned benchmark
techniques. At the same time, the acquired analytical model can provide valuable insights
concerning the credit risk assessment mechanisms that underlie the computation of FICO based
on a significantly reduced set of credit-related features. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Credit risk | el |
dc.subject.keyword | GPTIPS | el |
dc.subject.keyword | Genetic programming | el |
dc.date.defense | 2021-12 | |