H λογιστική παλινδρόμηση για γεγονότα με χαμηλή συχνότητα εμφάνισης
Logistic regression in rare events data
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Λογιστική παλινδρόμηση ; Σπάνια γεγονότα ; Logistic regression ; Rare eventsΠερίληψη
Στην εργασία αυτή εξετάζεται το στατιστικό πρόβλημα της εκτίμησης των σπάνιων γεγονότων με την κλασσική λογιστική παλινδρόμηση. Σπάνια γεγονότα θεωρούνται αυτά που έχουν συχνότητα εμφάνισης μικρότερη του 5%. Αρχικά, έγινε περιγραφή των βασικών χαρακτηριστικών και των ιδιοτήτων της λογιστικής παλινδρόμησης. Στην συνέχεια αναπτύχθηκαν τα δυο βασικά προβλήματα που συναντάμε σε τέτοιου είδους δεδομένα, τα οποία είναι η ελλιπής στρατηγικές που υπάρχουν για την συλλογή τέτοιων δεδομένων καθώς επίσης και η δυσκολία στο να εξηγηθούν και να προβλέψουν. Έπειτα καταγράφηκαν αναλυτικά οι διορθώσεις που πρότειναν οι King Gary και Langche Zeng (2001) και με την βοήθεια προσομοιώσεων έγινε σύγκριση των μεθόδων και διαπιστώθηκε πως οι διορθώσεις αυτές βελτιώνουν αρκετά την ακρίβεια των εκτιμήσεων. Τέλος, χρησιμοποιώντας τις παραπάνω μεθόδους σε ένα πραγματικό σετ δεδομένων που αναφέρεται στον σακχαρώδη διαβήτη έγινε ξεκάθαρη η χρησιμότητα τους και σε πραγματικά δεδομένα.