Στατιστικά μοντέλα για την απόδοση μιας ομάδας μπάσκετ: ποια στατιστικά στοιχεία είναι καθοριστικά για την απόδοση της ομάδας, σε ετήσια βάση
Statistical models for the performance of a basketball team: which statistics in the boxscore determine the team's season-long success
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Basketball ; Statistical analysis ; Predictive analytics ; Logistic regressionΠερίληψη
Στις μέρες μας παράγονται, επεξεργάζονται και αποθηκεύονται συνεχώς όλο και περισσότερα δεδομένα με ραγδαίους ρυθμούς. Αυτή η έκρηξη του όγκου των δεδομένων έχει επηρεάσει σαφώς και τον χώρο του αθλητισμού, και πιο συγκεκριμένα τον χώρο της καλαθοσφαίρισης. Η ανάλυση δεδομένων και ο αθλητισμός συμβαδίζουν εδώ και καιρό. Η στατιστική αναφέρεται σε ένα σύνολο εργαλείων για την μοντελοποίηση και την κατανόηση σύνθετων συνόλων δεδομένων. Οι αθλητικές αναλύσεις είναι μια συλλογή σχετικών, ιστορικών στατιστικών στοιχείων τα οποία, όταν εφαρμόζονται σωστά, μπορούν να προσφέρουν ένα ανταγωνιστικό πλεονέκτημα σε μία ομάδα ή και σε ατομικό επίπεδο. Μέσω της συλλογής και της ανάλυσης αυτών των στοιχείων, οι αθλητικές αναλύσεις ενημερώνουν τους παίχτες, τους προπονητές και το υπόλοιπο προσωπικό, για να διευκολύνουν τη λήψη αποφάσεων τόσο κατά την διάρκεια όσο και πριν από τα αθλητικά γεγονότα.
Σε αυτή την μελέτη, χρησιμοποιώντας πραγματικά δεδομένα από το πιο διάσημο Ευρωπαϊκό πρωτάθλημα καλαθοσφαίρισης, θα αναλύσουμε με τεχνικές στατιστικής και μηχανικής μάθησης, ποιες στατιστικά στοιχεία είναι καθοριστικά για την απόδοση της ομάδας, σε ετήσια βάση. Επιπλέον, θα παρουσιάσουμε μια περιγραφική ανάλυση και θα απεικονίσουμε τα αποτελέσματα μέσω γραφικών παραστάσεων, γραφημάτων και πινάκων. Στη συνέχεια, θα εφαρμόσουμε μοντέλα λογιστικής παλινδρόμησης με σκοπό να βρούμε τα βασικά χαρακτηριστικά που επηρεάζουν το τελικό αποτέλεσμα ενός παιχνιδιού. Τέλος, θα προβλέψουμε το ποσοστό ορθής ταξινόμησης και θα αξιολογήσουμε την απόδοση αυτών των μοντέλων μέσα από διαφορετικά κριτήρια, όπως πίνακες ταξινόμησης, την περιοχή κάτω από την καμπύλη και τον αλγόριθμο random forest.