dc.contributor.advisor | Πολίτης, Κωνσταντίνος | |
dc.contributor.author | Καλλιακμάνης, Διονύσιος Γ. | |
dc.date.accessioned | 2020-05-25T07:39:34Z | |
dc.date.available | 2020-05-25T07:39:34Z | |
dc.date.issued | 2020 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/12717 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/140 | |
dc.description.abstract | Στις μέρες μας παράγονται, επεξεργάζονται και αποθηκεύονται συνεχώς όλο και περισσότερα δεδομένα με ραγδαίους ρυθμούς. Αυτή η έκρηξη του όγκου των δεδομένων έχει επηρεάσει σαφώς και τον χώρο του αθλητισμού, και πιο συγκεκριμένα τον χώρο της καλαθοσφαίρισης. Η ανάλυση δεδομένων και ο αθλητισμός συμβαδίζουν εδώ και καιρό. Η στατιστική αναφέρεται σε ένα σύνολο εργαλείων για την μοντελοποίηση και την κατανόηση σύνθετων συνόλων δεδομένων. Οι αθλητικές αναλύσεις είναι μια συλλογή σχετικών, ιστορικών στατιστικών στοιχείων τα οποία, όταν εφαρμόζονται σωστά, μπορούν να προσφέρουν ένα ανταγωνιστικό πλεονέκτημα σε μία ομάδα ή και σε ατομικό επίπεδο. Μέσω της συλλογής και της ανάλυσης αυτών των στοιχείων, οι αθλητικές αναλύσεις ενημερώνουν τους παίχτες, τους προπονητές και το υπόλοιπο προσωπικό, για να διευκολύνουν τη λήψη αποφάσεων τόσο κατά την διάρκεια όσο και πριν από τα αθλητικά γεγονότα.
Σε αυτή την μελέτη, χρησιμοποιώντας πραγματικά δεδομένα από το πιο διάσημο Ευρωπαϊκό πρωτάθλημα καλαθοσφαίρισης, θα αναλύσουμε με τεχνικές στατιστικής και μηχανικής μάθησης, ποιες στατιστικά στοιχεία είναι καθοριστικά για την απόδοση της ομάδας, σε ετήσια βάση. Επιπλέον, θα παρουσιάσουμε μια περιγραφική ανάλυση και θα απεικονίσουμε τα αποτελέσματα μέσω γραφικών παραστάσεων, γραφημάτων και πινάκων. Στη συνέχεια, θα εφαρμόσουμε μοντέλα λογιστικής παλινδρόμησης με σκοπό να βρούμε τα βασικά χαρακτηριστικά που επηρεάζουν το τελικό αποτέλεσμα ενός παιχνιδιού. Τέλος, θα προβλέψουμε το ποσοστό ορθής ταξινόμησης και θα αξιολογήσουμε την απόδοση αυτών των μοντέλων μέσα από διαφορετικά κριτήρια, όπως πίνακες ταξινόμησης, την περιοχή κάτω από την καμπύλη και τον αλγόριθμο random forest. | el |
dc.format.extent | 190 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Στατιστικά μοντέλα για την απόδοση μιας ομάδας μπάσκετ: ποια στατιστικά στοιχεία είναι καθοριστικά για την απόδοση της ομάδας, σε ετήσια βάση | el |
dc.title.alternative | Statistical models for the performance of a basketball team: which statistics in the boxscore determine the team's season-long success | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
dc.description.abstractEN | Nowadays, more and more data is being produced, processed and stored at a rapid pace. This explosion in the volume of data has clearly affected the field of sports, and more specifically the field of basketball. Data analytics and sports are going hand-in-hand for some time now. Statistical learning refers to a set of tools for modeling and understanding complex datasets. Sports analytics are a collection of relevant, historical, statistics that when properly applied can provide a competitive advantage to a team or individual. Through the collection and analyzation of these data, sports analytics inform players, coaches and other staff in order to facilitate decision making both during and prior to sporting events.
In this study, using actual data from the most prestigious European Basketball Tournament, we will analyze with statistical and machine learning techniques, which statistics in the box-score determine the team’s season-long success. Additionally, we will perform a descriptive analysis and visualize the results through graphs, charts and tables. Afterwards, we will employ logit, probit, cauchit and cloglog models aiming to found the key characteristics affecting the final outcome of a game. Finally, we will predict the accuracy and evaluate the performance of those models through different criteria, such as confusion matrix, area under curve (AUC) and random forest algorithm. | el |
dc.contributor.master | Εφαρμοσμένη Στατιστική | el |
dc.subject.keyword | Basketball | el |
dc.subject.keyword | Statistical analysis | el |
dc.subject.keyword | Predictive analytics | el |
dc.subject.keyword | Logistic regression | el |
dc.date.defense | 2020-05-15 | |