Εξόρυξη γνώσης σε τραπεζικά δεδομένα με τη βοήθεια του προγράμματος Weka

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
WEKA ; Data AnalyticsΠερίληψη
Η οικονομική κρίση που ξεκίνησε στην Ευρώπη το 2009 και διαρκεί ως και σήμερα
στην Ελλάδα αναδεικνύει το πόσο επιτακτική είναι η ανάγκη παρακολούθησης
του ρίσκου που αναλαμβάνει μια τράπεζα όταν δίνει ένα καταναλωτικό δάνειο η
μια πιστωτικη καρτα. Ένα μοντέλο που μπορεί να προβλέψει έγκαιρα και έγκυρα
τους πελάτες που δεν θα μπορέσουν να εξοφλήσουν στο άμεσο μέλλον
αποτελεί εργαλείο ζωτικής σημασίας για κάθε τραπεζικό οργανισμό.
Στόχος μας είναι η περιγραφή και σύγκριση τέτοιων μοντέλων μέσω της
εφαρμογής τους σε δεδομένα από μεγάλη ελληνική τράπεζα που αφορούν
πελάτες.
Εφαρμόσαμε στα δεδομένα μας την μέθοδο της Λογιστικής Παλινδρόμησης
(Logistic Regression), τα Τεχνητά Νευρωνικά Δίκτυα (Artificial Neural Networks)
και τα Δέντρα Ταξινόμησης (Classification Trees) κάνοντας χρήση είτε όλων των
μεταβλητών είτε κάνοντας χρήση μόνο όσων χαρακτηρίστηκαν σημαντικές μετά
από την κατάλληλη προεπεξεργασία. Συγκεκριμένα, εφαρμόστηκε η βηματική
μέθοδος επιλογής μεταβλητών και η ανάλυση ευαισθησίας για τον εντοπισμό
των μεταβλητών που παίζουν σημαντικό ρόλο στο εξαγόμενο αποτέλεσμα.