Δείκτες για την αξιολόγηση της απόδοσης παικτών και ομάδων σε αγώνες μπάσκετ και παράγοντες που τους επηρεάζουν
Indices for evaluating player and team performance in basketball games, and factors affecting these indices
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Μπάσκετ ; Στατιστική ανάλυση ; Δείκτης αξιολόγησης ; Λογιστική παλινδρόμηση ; Μηχανική μάθησηΠερίληψη
Σε μια εποχή που είναι άρρηκτα συνδεδεμένη με τα δεδομένα, ο τομέας της ανάλυσης δεδομένων έχει αναδειχθεί σε ισχυρό εργαλείο σε διάφορους κλάδους, συμπεριλαμβανομένου και του αθλητισμού. Με την εκθετική ανάπτυξη της τεχνολογίας και τη διαθεσιμότητα τεράστιων ποσοτήτων δεδομένων, οι ομάδες και οι οργανισμοί είναι πλέον σε θέση να εξάγουν πολύτιμες πληροφορίες και να λαμβάνουν τεκμηριωμένες αποφάσεις για να αποκτήσουν ανταγωνιστικό πλεονέκτημα σε βάρος των αντιπάλων τους. Η ανάλυση δεδομένων στον αθλητισμό περιλαμβάνει τη συλλογή, την ερμηνεία και την οπτικοποίηση πολύπλοκων συνόλων δεδομένων, επιτρέποντας στις ομάδες να βελτιστοποιήσουν την απόδοση τους, να ενισχύσουν τις στρατηγικές ανάπτυξης των παικτών, να βελτιώσουν τις στρατηγικές του παιχνιδιού και τελικά να αποκτήσουν μεγαλύτερη επιτυχία εντός του αγωνιστικού χώρου. Από τα στατιστικά στοιχεία των παικτών έως τις μετρήσεις απόδοσης των αγώνων, η ανάλυση δεδομένων έχει φέρει επανάσταση στον τρόπο με τον οποίο παίζονται και αναλύονται τα αθλήματα, ανοίγοντας νέες ευκαιρίες για τις ομάδες και τους αθλητές να ξεκλειδώσουν τις πλήρεις δυνατότητες τους. Στην παρούσα διπλωματική, χρησιμοποιώντας πραγματικά δεδομένα από την Ευρωλίγκα (EuroLeague), οποία θεωρείται η κορυφαία διασυλλογική διοργάνωση καλαθοσφαίρισης στην Ευρώπη, αναλύουμε με τεχνικές στατιστικής και εξετάζοντας όλες τις σεζόν από την δημιουργία της, ποιοι είναι οι σημαντικοί, προβλεπτικοί παράγοντες στη πρόκριση των ομάδων στα Playoffs και στο Final Four, καθώς και ποια είναι η συνεισφορά των καλύτερων παικτών με βάση το δείκτη αξιολόγησης της απόδοσης (Performance Index Rating - PIR) στη πορεία των ομάδων τους. Επιπροσθέτως, παρουσιάζουμε μια περιγραφική ανάλυση των μεταβλητών μας και απεικονίζουμε τα αποτελέσματα μας μέσω γραφικών παραστάσεων, γραφημάτων και πινάκων. Στη συνέχεια, εφαρμόζουμε μοντέλα λογιστικής παλινδρόμησης με σκοπό να βρούμε τις βασικές μεταβλητές που επηρεάζουν τη πρόκριση (ή μη) μιας ομάδας στις δύο φάσεις που εξετάζουμε. Τέλος, μέσω κατάλληλων τεχνικών μηχανικής μάθησης, διερευνούμε αν υπάρχουν ήδη υπάρχουσες κλάσεις στα δεδομένα μας με παρόμοια χαρακτηριστικά (clustering), και επιχειρούμε να φτιάξουμε αποτελεσματικά μοντέλα ταξινόμησης (classification), για να εξετάσουμε τη πρόκριση των ομάδων στις επιμέρους φάσης της διοργάνωσης.