dc.contributor.advisor | Κούτρας, Μάρκος | |
dc.contributor.author | Σταθόπουλος, Γεώργιος Α. | |
dc.date.accessioned | 2017-12-11T10:02:55Z | |
dc.date.available | 2017-12-11T10:02:55Z | |
dc.date.issued | 2017-07 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/10283 | |
dc.description.abstract | Στη σύγχρονη εποχή, η δυνατότητα συλλογής μεγάλων όγκων δεδομένων τα οποία
συνήθως αφορούν πολλά χαρακτηριστικά έχει οδηγήσει στην ανάγκη εφαρμογής και
ανάπτυξης ειδικών στατιστικών τεχνικών που θα βοηθήσουν στη μελέτη της δομής
τους και την εξαγωγή χρήσιμων συμπερασμάτων. Έχει διαπιστωθεί ότι, για την
ανάλυση τέτοιων δεδομένων, απαιτείται είτε κάποια ειδική προσαρμογή των
διαθέσιμων κλασσικών στατιστικών τεχνικών είτε η ανάπτυξη εναλλακτικών
τεχνικών.
Στα πλαίσια της παρούσας εργασίας θα γίνε ι σύντομη παρουσίαση τεχνικών που
χρησιμοποιούνται για την ανάλυση μεγάλων δεδομένων, προγραμματισμός των
αντίστοιχων αλγορίθμων σε περιβάλλον R και σύγκριση των διάφορων τεχνικών με τη
χρήση πραγματικών δεδομένων.
Πιο συγκεκριμένα θα χρησιμοποιηθούν τεχνικές που βασίζονται στα δέντρα
παλινδρόμησης και μέσω αλγορίθμων μηχανικής μάθησης βελτιώνεται η ακρίβεια των
τους. Ακόμη θα χρησιμοποιηθούν τεχνικές που βασίζονται στο κλασσικό μοντέλο
γραμμικής παλινδρόμησης, στο οποίο όμως εφαρμόζετα ι ένας περιορισμός (ποινή)
στους συντελεστές του μοντέλου, ώστε αντιμετωπιστεί το φαινόμενο της
πολυσυγγραμμικότητας, να μειωθεί η διασπορά των συντελεστών και να επιτευχθεί
μεγαλύτερη ακρίβεια πρόβλεψης. | el |
dc.format.extent | 66 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Στατιστικές τεχνικές παλινδρόμησης για την ανάλυση μεγάλων δεδομένων | el |
dc.title.alternative | Regression techniques for the analysis of big data | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
dc.description.abstractEN | In modern times, the collection of large amounts of data which usually involves a
lot of features has led to the need for the development of specific statistical techniques
that will help studying their structure and extracting useful conclusions for them. It
has been found that, for such an analysis it is required either a special adaptation of
available conventional statistical techniques or the development of alternative
techniques.
In this paper we will provide a brief presentation of techniques used for the analysis
of large amounts of data, and describe the respective algorithms along with the codes
in R environment. In addition a comparison study of those techniques on real data is
carried out.
Specifically there will be used tree based regression techniques which are improved
by exploiting machine learning algorithms. Furthermore there be used techniques
based on classical linear regression model, in which a restriction (penalty) is applied
on the model coefficients in order to address the phenomenon of multicollinearity,
reduce the variance of the coefficients and achieve greater prediction accuracy. | el |
dc.contributor.master | Εφαρμοσμένη Στατιστική | el |
dc.subject.keyword | Ανάλυση παλινδρόμησης | el |
dc.subject.keyword | Γραμμική παλινδρόμηση | el |
dc.subject.keyword | Μεγάλα δεδομένα | el |
dc.subject.keyword | Στατιστική ανάλυση | el |
dc.subject.keyword | Linear regression | el |
dc.subject.keyword | Big data | el |