Η κανονική περίοδος και τα πλέι-οφς του NBA : σύγκριση και προβλέψεις με στατιστικές μεθόδους
Regular season and playoffs at the NBA : comparison and predictions using statistical methods
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
NBA basketball ; Μπάσκετ ; Λογιστική παλινδρόμηση ; Μηχανική μάθηση ; Χρονοσειρές ; Στατιστική ανάλυσηΠερίληψη
Τη σημερινή εποχή τα δεδομένα αποτελούν τη βάση της σύγχρονης κοινωνίας, αποτυπώνοντας τον ψηφιακό κόσμο και τις αλληλεπιδράσεις μας με αυτόν. Η συλλογή τους αποτελεί ένα σημαντικό βήμα στη διαδικασία ανάλυσης και εξαγωγής σημαντικών πληροφοριών. Από τη βιομηχανία μέχρι τον αθλητισμό, η τεχνολογία έχει δημιουργήσει μια μεγάλη συλλογή δεδομένων. Στον αθλητισμό και ειδικότερα στις διοργανώσεις της καλαθοσφαίρισης η ανάλυση δεδομένων έχει αλλάξει θεμελιωδώς τον τρόπο που οι ομάδες και οι προπονητές σχεδιάζουν τους αγώνες και αντιδρούν στον αγωνιστικό χώρο. Με τη συνεχή ροή στατιστικών δεδομένων, τόσο για τους παίκτες όσο και για τις ομάδες, δίνεται η δυνατότητα στους προπονητές να βελτιώσουν τα αδύναμα σημεία της ομάδας τους και να επαναπροσδιορίσουν τις στρατηγικές τους. Μέσω αυτών των δυνατοτήτων η ανάλυση δεδομένων αναδεικνύει ένα νέο επίπεδο προηγμένης προετοιμασίας και ανταγωνιστικότητας στα πρωταθλήματα.
Στην παρούσα διπλωματική εργασία εκτός από τις κλασικές μεταβλητές που συλλέγονται στους αγώνες καλαθοσφαίρισης της διοργάνωσης του National Basketball Association (NBA), όπως οι πόντοι ανά παιχνίδι και οι ασίστ, δημιουργήθηκαν και ορισμένες νέες στατιστικές μεταβλητές, όπως οι κατοχές και ο δείκτης DRt, ώστε να επιτευχθούν οι στόχοι που τέθηκαν εξαρχής. Αρχικά, παρουσιάζεται μέσω πινάκων και κατάλληλων γραφημάτων μια περιγραφική ανάλυση όλων των μεταβλητών για τα δεδομένα που συλλέχθηκαν από τις τελευταίες δεκαπέντε (15) σεζόν της διοργάνωσης. Έπειτα ακολουθούν ορισμένοι έλεγχοι, κανονικότητας και συσχέτισης, που εκτελέστηκαν προτού εφαρμοστούν τα κατάλληλα γενικευμένα γραμμικά μοντέλα, ώστε να βρεθούν οι σημαντικότερες μεταβλητές που επηρεάζουν την κατάκτηση του πρωταθλήματος και την πρόκριση (ή μη) μιας ομάδας στην φάση των Playoffs. Ακόμα, γίνεται μια ανάλυση των δεδομένων βάσει χρονοσειρών ώστε να παρουσιαστούν προβλέψεις για τις επόμενες δύο (2) σεζόν. Στη συνέχεια, χρησιμοποιούνται κατάλληλες τεχνικές μηχανικής μάθησης, ώστε να δημιουργηθούν ορισμένα μοντέλα ταξινόμησης (classification) και να διερευνηθεί αν υπάρχουν ανάμεσα στα δεδομένα κλάσεις με κοινά χαρακτηριστικά (clustering), για να εξεταστεί η πρόκριση των ομάδων στη φάση των Playoffs. Τέλος, παρουσιάζονται τα τελικά συμπεράσματα της εργασίας και τυχόν ομοιότητες με προηγούμενες αναλύσεις που έχουν γίνει.