Γραμμικά μοντέλα για τον συντελεστή συσχέτισης του Pearson
Linear models for Pearson correlation coefficient

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Συντελεστής συσχέτισης Pearson ; Γενικευμένα γραμμικά μοντέλαΠερίληψη
Στην στατιστική ανάλυση, ο συντελεστής συσχέτισης αντιμετωπίζεται ως σταθερή παράμετρος και ως μέτρο για την συμπερασματολογία της γραμμικής σχέσης μεταξύ δύο μεταβλητών. Η χρήση αυτή περιορίζει τη δυνατότητα να ενσωματωθούν περαιτέρω επεξηγηματικές μεταβλητές που να επηρεάζουν την εξάρτηση των δύο μεταβλητών απόκρισης. Στην παρούσα διπλωματική εργασία εξετάζεται η μοντελοποίηση του συντελεστή συσχέτισης Pearson ενσωματώνοντας επεξηγηματικές μεταβλητές σε ένα πλαίσιο παλινδρόμησης. Δεδομένου ότι ο συντελεστής συσχέτισης είναι φραγμένος στο διάστημα (-1,1), απαιτείται η χρήση κατάλληλων συναρτήσεων σύνδεσης, καθώς το κλασικό γραμμικό μοντέλο δεν είναι κατάλληλο. Σκοπός της εργασίας είναι να εξεταστούν και συγκριθούν διάφορες συναρτήσεις σύνδεσης για την μοντελοποίηση του συντελεστή συσχέτισης υπό διάφορες συνθήκες.
Η διπλωματική εργασία αποτελείται από 6 κεφάλαια. Στο 1ο Κεφάλαιο παρουσιάζεται το θεωρητικό πλαίσιο των γενικευμένων γραμμικών μοντέλων και ειδικότερα μοντέλα με τις τέσσερις συναρτήσεις σύνδεσης που εξετάζονται (tanh, logit, probit & complementary log-log). Έπειτα, στο 2ο Κεφάλαιο γίνεται εισαγωγή του συντελεστή συσχέτισης Pearson και αναλύεται το θεωρητικό υπόβαθρό του. Ακολουθεί το 3ο Κεφάλαιο όπου περιγράφεται η μεθοδολογία και η δομή των μοντέλων για την στατιστική ανάλυση. Στη συνέχεια στο 4ο Κεφάλαιο παρουσιάζονται τα αποτελέσματα από την μελέτη προσομοιώσεων καθώς και η σύγκριση των μοντέλων για διάφορα διαστήματα φραγμών του συντελεστή συσχέτισης, στο διάστημα (0,1) και στο φυσικό του φράγμα (-1,1), και για διάφορες κατανομές των μεταβλητών αποκρίσεων των οποίων η συσχέτιση μοντελοποιείται, διδιάστατη κανονική κατανομή και διδιάστατη δυαδική κατανομή. Στο 5ο Κεφάλαιο παρουσιάζονται τα αποτελέσματα των μοντέλων εφαρμοσμένα σε πραγματικά δεδομένα. Tέλος, το 6ο Κεφάλαιο αναφέρει τα συμπεράσματα μετά την συνολική σύγκριση των μοντέλων και τους περιορισμούς της παρούσας διπλωματικής εργασίας. Για την στατιστική ανάλυση των δεδομένων χρησιμοποιείται η γλώσσα προγραμματισμού R.


