Fraud detection in car insurance using unsupervised machine learning
Ανίχνευση απάτης στις ασφάλειες αυτοκινήτου με χρήση μη-εποπτευόμενης μηχανικής μάθησης
Master Thesis
Συγγραφέας
Michelakis, Charalampos - Panagiotis
Μιχελάκης, Χαράλαμπος - Παναγιώτης
Ημερομηνία
2024-06Επιβλέπων
Bersimis, SotirisΜπερσίμης, Σωτήριος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Unsupervised machine learning ; Fraud detection ; Auto insuranceΠερίληψη
Η ανίχνευση απάτης στις ασφάλειες αυτοκινήτων αποτελεί ένα ζήτημα με σημαντικές οικονομικές και ηθικές επεκτάσεις. Μελέτες δείχνουν ότι οι δόλιες αξιώσεις αποζημίωσης στις ασφάλειες αυτοκινήτων αποτελούν το 10%-20% των συνολικών ασφαλιστικών αξιώσεων που υποβάλλονται στην Κεντρική και Ανατολική Ευρώπη. Για το λόγο αυτό, θα διερευνήσουμε τις δυνατότητες αξιοποίησης μεθόδων μη εποπτευόμενης μηχανικής μάθησης για την αντιμετώπιση αυτού του προβλήματος. Συγκεκριμένα, αυτό το προς έρευνα αντικείμενο παραμένει σχετικά ανεξερεύνητο στη βιβλιογραφία ανίχνευσης ασφαλιστικής απάτης, η οποία κατά κύριο λόγο επικεντρώνεται σε ένα περιορισμένο σύνολο μεθόδων μη εποπτευόμενης μηχανικής μάθησης. Η δουλειά μας υιοθετεί μια ευρύτερη προσέγγιση όσον αφορά τις μεθόδους που χρησιμοποιούνται, αντλώντας έμπνευση από τον γενικότερο και ταχέως εξελισσόμενο τομέα της ανίχνευσης ανώμαλων/εκτρόπων παρατηρήσεων. Όσον αφορά την αξιολόγηση αυτών των μεθόδων, αυτή θα διεξαχθεί μέσω μελέτης προσομοίωσης, καθώς η εύρεση δημόσια διαθέσιμων πραγματικών συνόλων δεδομένων, (λόγω του εμπιστευτικού χαρακτήρας τους), είναι εξαιρετικά δύσκολη κα ι αποτελεί σημαντική πρόκληση στην έρευνα του της ανίχνευσης απάτης στις ασφάλειες αυτοκινήτων. Η επιλογή μιας μελέτης προσομοίωσης είναι ο τρόπος με τον οποίο θα «παρακάμψουμε» αυτό το εμπόδιο. Τα προσομοιωμένα σύνολα δεδομένων μας θα είναι το αποτέλεσμα μιας «συνθετικής ανακατασκευής» ενός συνόλου δεδομένων πραγματικού κόσμου, το οποίο χρησιμοποιείται ως "πηγή" για τη δημιουργία τυπικών/μη -δόλιων δειγμάτων δεδομένων, τα οποία στη συνέχεια αναμιγνύονται με πολλούς διαφορετικούς τύπους παραμετρικά δημιουργημένων συνθετικών εκτρόπων παρατηρήσεων. Η δουλειά μας, λοιπόν, θα ολοκληρωθεί με την σύγκριση της απόδοσης σχεδόν τριάντα διαφορετικών αλγορίθμων ανίχνευσης εκτρόπων παρατηρήσεων σε πέντε διαφορετικά (συνθετικά) σενάρια τέτοιων τιμών, η οποία θα μπορούσε να παράσχει νέες πληροφορί ες για την καταπολέμηση της απάτης στις ασφάλειες αυτοκινήτων χρησιμοποιώντας μη εποπτευόμενη μηχανική μάθηση.