Εφαρμογή εξόρυξης δεδομένων στον τραπεζικό τομέα : πρόβλεψη αδυναμίας αποπληρωμής τραπεζικών δανείων
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Αδυναμία αποπληρωμής δανείων ; Τραπεζικός τομέας ; Προβλεπτική αναλυτικήΠερίληψη
Η παρούσα διπλωματική εργασία με τίτλο "ΕΦΑΡΜΟΓΗ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΣΤΟΝ ΤΡΑΠΕΖΙΚΟ ΤΟΜΕΑ: ΠΡΟΒΛΕΨΗ ΑΔΥΝΑΜΙΑΣ ΑΠΟΠΛΗΡΩΜΗΣ ΤΡΑΠΕΖΙΚΩΝ ΔΑΝΕΙΩΝ", περιέχει μια μελέτη εφαρμογής των μεγάλων δεδομένων στον
Τραπεζικό Τομέα ενώ παράλληλα εξετάζει τη χρήση τεχνικών εξόρυξης δεδομένων για την
πρόβλεψη της αδυναμίας αποπληρωμής τραπεζικών δανείων. Η εργασία είναι δομημένη σε
πέντε κύρια κεφάλαια, τα οποία καλύπτουν την εισαγωγή, την ανασκόπηση βιβλιογραφίας, τις
περιπτώσεις χρήσης των Μεγάλων Δεδομένων και της Τεχνητής Νοημοσύνης στην
Τραπεζική, τη μεθοδολογία και προσέγγιση της πρόβλεψης αδυναμίας αποπληρωμής δανείων,
τα συμπεράσματα και τη μελλοντική εργασία.
Αρχικά, στην εισαγωγή, αναλύεται ο ψηφιακός μετασχηματισμός του τραπεζικού τομέα και η
ανάγκη για τεχνολογικές καινοτομίες, όπως η τεχνητή νοημοσύνη (AI) και η ανάλυση μεγάλων
δεδομένων (big data analytics). Η τεχνητή νοημοσύνη επιτρέπει στις τράπεζες να
διαχειρίζονται τεράστιους όγκους δεδομένων σε πραγματικό χρόνο, να προβλέπουν
συμπεριφορές πελατών, να εντοπίζουν απάτες και να βελτιώνουν την εμπειρία του χρήστη.
Στο κεφάλαιο της ανασκόπησης βιβλιογραφίας καλύπτονται τα θεμελιώδη μοντέλα μηχανικής
και βαθιάς μάθησης, η ανάλυση μεγάλων δεδομένων στην τραπεζική και η διαχείριση
οικονομικών κινδύνων μέσω της τεχνητής νοημοσύνης. Εξετάζονται οι βασικές θεωρητικές
προσεγγίσεις και τα εργαλεία που χρησιμοποιούνται για την ανάλυση μεγάλων δεδομένων και
τη λήψη αποφάσεων στον τραπεζικό τομέα. Υπογραμμίζονται επίσης οι δυσκολίες που
συναντούνται υιοθέτηση τέτοιων τεχνολογικών λύσεων και οι οποίες αφορούν τη
διακυβέρνηση των δεδομένων, τη διαφάνεια των αλγορίθμων και την ανάγκη ύπαρξης
εξειδικευμένου ανθρώπινου δυναμικού.
Στο τρίτο κεφάλαιο, αναλύονται οι περιπτώσεις χρήσης των μεγάλων δεδομένων, της
αναλυτικής και της γενετικής τεχνητής νοημοσύνης (GenAI) στον τραπεζικό τομέα.
Εξετάζεται η παραδοσιακή αναλυτική και οι εφαρμογές μεγάλων δεδομένων, όπως η
ανίχνευση τραπεζικής απάτης, η αναγνώριση του κινδύνου αδυναμίας αποπληρωμής
δανείων, η τμηματοποίηση πελατών, η εκτίμηση πιστοληπτικής ικανότητας και η
εξατομικευμένη τραπεζική εξυπηρέτηση. Σχετικά με τη γενετική τεχνητή νοημοσύνη (GenAI)
παρουσιάζονται οι αντίστοιχες περιπτώσεις χρήσης όπως, νέες δυνατότητες
αυτοματοποιημένης εξυπηρέτησης, δημιουργίας οικονομικών αναφορών και
εξατομικευμένων τραπεζικών προϊόντων. Το τέταρτο κεφάλαιο αφορά το πρακτικό μέρος της εργασίας. Αυτό επικεντρώνεται στην
πρόβλεψη αδυναμίας αποπληρωμής τραπεζικών δανείων. Χρησιμοποιούνται πραγματικά
οικονομικά δεδομένα από δανειοληπτικές συναλλαγές για την ανάπτυξη και σύγκριση
διαφορετικών αλγορίθμων και τεχνικών ανάλυσης δεδομένων. Αναπτύσσονται και
αξιολογούνται επτά μοντέλα μηχανικής και βαθιάς μάθησης: Logistic Regression, Decision
Tree, Random Forest, XGBoost, Naïve Bayes, K-Nearest Neighbors, και Artificial Neural
Network (ANN). Χρησιμοποιούνται παράλληλα διάφορες τεχνικές προεπεξεργασίας όπως
επανα-δειγματοληψία (SMOTE, ADASYN, Bordeline SMOTE) για την εξισορρόπηση των
δεδομένων, διακριτοποίηση, label και one-hot κωδικοποιήσεις αλλά και κλιμάκωση (scaling)
των δεδομένων. Επιπρόσθετα, εφαρμόζεται ένας συνδυασμός grid search και cross validation,
ώστε αφενός να βρεθεί κάθε φορά ο βέλτιστος συνδυασμός των παραμέτρων του εκάστοτε
μοντέλου και αφετέρου να αποτραπεί τυχόν υπερπροσαρμογή τους (overfitting) λόγω
διαχωρισμού των δεδομένων σε συγκεκριμένο σύνολο εκπαίδευσης και σύνολο δοκιμής. Η
μετρική που επιλέχθηκε για την αξιολόγηση της απόδοσης των μοντέλων είναι το σταθμισμένο
F2 σκορ, το οποίο δίνει μεγαλύτερη έμφαση στην ανάκληση από ότι στην ακρίβεια. Τα
αποτελέσματα δείχνουν ότι το μοντέλο XGBoost, χρησιμοποιώντας την τεχνική
υπερδειγματοληψίας ADASYN, επιτυγχάνει την καλύτερη απόδοση με σταθμισμένο F2 σκορ
0.914. Στη συνέχεια, υλοποιούνται δύο διαφορετικοί συνδυασμοί μη-επιβλεπόμενης μάθησης
(unsupervised learning) με επιβλεπόμενη μάθηση (supervised learning) ώστε να μελετηθεί
τυχόν βελτίωση της απόδοσης ή/και απλούστευσης της πολυπλοκότητας των μοντέλων. Τέλος,
αναπτύσσεται μια web-based εφαρμογή, βάσει του βέλτιστου μοντέλου, που έχει ως στόχο να
αναδείξει αφενός την επιχειρηματική αξία μιας τέτοιας τεχνολογικής λύσης και αφετέρου να
παρουσιάσει πώς μπορεί να ενσωματωθεί σε ένα πραγματικό τραπεζικό περιβάλλον.
Στο πέμπτο και τελευταίο κεφάλαιο, παρουσιάζονται τα συμπεράσματα της παρούσας
μελέτης. Η εργασία καταλήγει στο ότι η τεχνητή νοημοσύνη και η ανάλυση μεγάλων
δεδομένων μπορούν να μετασχηματίσουν τον τραπεζικό τομέα, προσφέροντας βελτιωμένη
αξιολόγηση κινδύνων και εξατομικευμένες υπηρεσίες. Οι τράπεζες πλέον μπορούν να
μειώσουν τις οικονομικές απώλειες από μη αποπληρωμένα δάνεια, να ενισχύσουν την
πιστοληπτική αξιοπιστία τους και να βελτιώσουν την εμπειρία των πελατών μέσω
αυτοματοποιημένων και ακριβών προβλέψεων. Παράλληλα, η ανάπτυξη web-based
εφαρμογών που χρησιμοποιούν μοντέλα μηχανικής μάθησης, όπως το XGBoost, μπορεί να προσφέρει σε πραγματικό χρόνο προβλέψεις για την αδυναμία αποπληρωμής δανείων,
ενισχύοντας την αποτελεσματικότητα των τραπεζικών λειτουργιών.
Η εργασία ωστόσο αναγνωρίζει και σημαντικούς περιορισμούς στην υιοθέτηση τέτοιων
τεχνολογιών και λύσεων , όπως η ποιότητα και η ποικιλία των δεδομένων, η πολυπλοκότητα
των μοντέλων και η ανάγκη για εξειδικευμένο ανθρώπινο δυναμικό. Η συμμόρφωση με
κανονιστικά πλαίσια και η διασφάλιση της διαφάνειας των αλγορίθμων είναι κρίσιμα
ζητήματα που πρέπει να αντιμετωπιστούν.