Χρήση τεχνικών εξόρυξης δεδομένων στον αναλογισμό
Data mining techniques in actuary and insurance
Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Εξόρυξη δεδομένων ; Ασφαλιστικές εταιρείες ; Data mining ; Mathematical statistics ; Insurance companiesΠερίληψη
Περίπου το 80% των δεδομένων που διακινείται καθημερινά στον κόσμο είναι αδόμητα. Τα σύγχρονα συστήματα υποστήριξης λήψης επιχειρηματικών αποφάσεων βασίζονται σε πληροφόρηση που προέρχεται κυρίως από δομημένα δεδομένα, αγνοώντας τα αδόμητα τα οποία όμως μπορούν να προσφέρουν σημαντική πληροφορία. Υπάρχει επομένως η ανάγκη νέων δυναμικών εργαλείων μετατροπής των αδόμητων δεδομένων σε δομημένα, τα οποία σε συνδυασμό με τα εξαρχής δομημένα δεδομένα να βοηθήσει τους καταναλωτές πληροφοριών να λαμβάνουν καλύτερες αποφάσεις. Αυτή την ανάγκη καλείται να καλύψει ένας νέος κλάδος της επιστήμης η εξόρυξη από κείμενα (text mining) που είναι συνδυασμός ετερόκλητων επιστημονικών πεδίων όπως της στατιστικής, της μηχανικής εκμάθησης, της θεωρίας της πληροφορίας και των υπολογιστικών διαδικασιών. Στην παρούσα εργασία εξετάζονται δύο εφαρμογές του text mining κυρίως στην περιοχή του ασφαλιστικού χώρου. Στην πρώτη εφαρμογή παρουσιάζεται αναλυτικά η ομαδοποίηση που οργανώνει τις αδόμητες πληροφορίες σε ομάδες βοηθώντας καθοριστικά στην ανάλυση τους και στην εξαγωγή χρήσιμων συμπερασμάτων ενώ στην δεύτερη χρησιμοποιούνται τεχνικές πρόβλεψης σε κείμενα όπως παραδείγματός χάριν αν ένα σχόλιο είναι αρνητικό ή θετικό ή αν μία ασφαλιστική δήλωση είναι απάτη ή όχι. Συγχρόνως παρουσιάζονται οι σημαντικότερες έννοιες και μέθοδοι που χρησιμοποιούνται κατά τη διάρκεια της ομαδοποίησης και πρόβλεψης. Σκοπός της διπλωματικής εργασίας είναι, εξηγώντας τις μεθόδους του text mining, να καταδείξει πόσο χρήσιμο εργαλείο είναι για κάθε ασφαλιστική επιχείρηση και με πόσο απλό και εύκολο τρόπο μπορεί να προβεί στην εξαγωγή σημαντικών συμπερασμάτων από αδόμητα και δύσκολα στη χρήση τους αρχεία.