Στατιστικές τεχνικές παλινδρόμησης για την ανάλυση μεγάλων δεδομένων

Σταθόπουλος, Γεώργιος Α.

Regression techniques for the analysis of big data

Master Thesis

Συγγραφέας

Σταθόπουλος, Γεώργιος Α.

Ημερομηνία

2017-07

Περίληψη

Στη σύγχρονη εποχή, η δυνατότητα συλλογής μεγάλων όγκων δεδομένων τα οποία συνήθως αφορούν πολλά χαρακτηριστικά έχει οδηγήσει στην ανάγκη εφαρμογής και ανάπτυξης ειδικών στατιστικών τεχνικών που θα βοηθήσουν στη μελέτη της δομής τους και την εξαγωγή χρήσιμων συμπερασμάτων. Έχει διαπιστωθεί ότι, για την ανάλυση τέτοιων δεδομένων, απαιτείται είτε κάποια ειδική προσαρμογή των διαθέσιμων κλασσικών στατιστικών τεχνικών είτε η ανάπτυξη εναλλακτικών τεχνικών. Στα πλαίσια της παρούσας εργασίας θα γίνε ι σύντομη παρουσίαση τεχνικών που χρησιμοποιούνται για την ανάλυση μεγάλων δεδομένων, προγραμματισμός των αντίστοιχων αλγορίθμων σε περιβάλλον R και σύγκριση των διάφορων τεχνικών με τη χρήση πραγματικών δεδομένων. Πιο συγκεκριμένα θα χρησιμοποιηθούν τεχνικές που βασίζονται στα δέντρα παλινδρόμησης και μέσω αλγορίθμων μηχανικής μάθησης βελτιώνεται η ακρίβεια των τους. Ακόμη θα χρησιμοποιηθούν τεχνικές που βασίζονται στο κλασσικό μοντέλο γραμμικής παλινδρόμησης, στο οποίο όμως εφαρμόζετα ι ένας περιορισμός (ποινή) στους συντελεστές του μοντέλου, ώστε αντιμετωπιστεί το φαινόμενο της πολυσυγγραμμικότητας, να μειωθεί η διασπορά των συντελεστών και να επιτευχθεί μεγαλύτερη ακρίβεια πρόβλεψης.

Τίτλος Προγράμματος Μεταπτυχιακών Σπουδών

Εφαρμοσμένη Στατιστική

Τμήμα

Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης

Αριθμός σελίδων

Γλώσσα

Ελληνικά

URI

https://dione.lib.unipi.gr/xmlui/handle/unipi/10283

Συλλογή

Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης

Εμφάνιση πλήρους εγγραφής

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές