Στατιστική μελέτη προβλημάτων με μη πλήρη δεδομένα

Master Thesis
Συγγραφέας
Καποδίστριας, Νικόλαος Σ.
Ημερομηνία
2008-11-03Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Μαθηματική στατιστική ; Missing observations (Statistics)Περίληψη
Οι ελλιπείς τιμές αποτελούν ένα σημαντικό πρόβλημα κατά την ανάλυση πραγματικών δεδομένων, διότι συχνά οδηγούν σε εκτιμήτριες οι οποίες δεν έχουν την ιδιότητα της αμεροληψίας ενώ και τα αντίστοιχα συμπεράσματα δεν είναι τόσο ακριβή όσο στην περίπτωση πλήρων δεδομένων. Οι στατιστικές μέθοδοι χειρισμού ελλιπών δεδομένων περιλαμβάνουν την αντικατάσταση, την χρήση εκτιμητριών μέγιστης πιθανοφάνειας και τη μέθοδο βαρών. Κάθε μέθοδος λειτουργεί διαφορετικά λαμβάνοντας υπόψη τον εκάστοτε μηχανισμό ελλιπών τιμών και το είδος των μεταβλητών (συνεχείς, διακριτές). Τα τελευταία χρόνια είναι ευρέως διαδεδομένα μοντέλα παλινδρόμησης για την εκτίμηση των ελλιπών τιμών, ενώ και τα σύγχρονα στατιστικά πακέτα έχουν συμπεριλάβει στις βιβλιοθήκες τους ρουτίνες για το χειρισμό τους. Η ανάλυση επιβίωσης είναι ιδιαίτερα σημαντική στη βιοστατιστική, αναλογισμό και σε πολλά άλλα πεδία. Όταν χρησιμοποιούνε μεθόδους ανάλυσης επιβίωσης αρκετά συχνά εμφανίζονται λογοκριμένα δεδομένα. Τότε είναι απαραίτητο να αναγνωρίζουνε τη μορφή λογοκρισίας που εμφανίζεται στο δείγμα , και να εφαρμόζουνε την κατάλληλη μέθοδο για την εκτίμηση της συνάρτησης επιβίωσης και της βαθμίδας αποτυχίας. Στην εργασία αυτή παρουσιάζουνε τις μεθόδους εκτίμησης των Kaplan-Meier, Flemming-Harrington, τον αλγόριθμο Turnbull και τις εκτιμήτριες μέγιστης πιθανοφάνειας. Τέλος έχουνε καταγράψει πως μπορούν να χρησιμοποιηθούν τα συνήθη στατιστικά πακέτα για την ανάλυση τόσο ελλιπών όσο και λογοκριμένων δεδομένων.