Αναλυτική δεδομένων αγώνων καλαθοσφαίρισης για την πρόβλεψη αποτελεσμάτων και εξαγωγή γνώσης

Γαρδέλης, Σταύρος

dc.contributor.advisor	Μαγκλογιάννης, Ηλίας
dc.contributor.author	Γαρδέλης, Σταύρος
dc.date.accessioned	2021-07-16T08:24:42Z
dc.date.available	2021-07-16T08:24:42Z
dc.date.issued	2021-06
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/13576
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/999
dc.description.abstract	Η παρούσα Διπλωματική εργασία ασχολείται με την Aναλυτική αθλητικών δεδομένων (Sports Analytics). Όπως σε πολλούς άλλους κλάδους, έτσι και στον αθλητισμό ο ρυθμός συλλογής δεδομένων αυξάνεται συνεχώς τα τελευταία χρόνια. Χρησιμοποιήθηκαν δεδομένα απο το άθλημα της καλαθοσφαίρησης (Basketball) . Πιο συγκεκριμένα αναλύθηκαν 2 σύνολα δεδομένων (dataset) απο τα δύο μεγαλύτερα πρωταθλήματα του κόσμου, του NBA και της Euroleague. Κάθε dataset περιέχει στατιστικά δεδομένα ομάδων για τις χρονιές 2005-06 έως και 2018-19. Εκτός απο τα πολλά στατιστικά που αφορούν δεδομένα ενός αγώνα όπως πόντοι , ασιστ , ριμπάουντ, κλεψίματα κ.α. δίνεται και η επιτυχία εισαγωγής ή όχι στα playoff του αντίστοιχου πρωταθλήματος. Δεδομένο με το οποίο θα ασχοληθούμε, μιας και είναι η κλάση του dataset. Χρησιμοποιήθηκαν οι παρακάτω αλγόριθμοι επιβλεπόμενης μηχανική μάθησης (Supervised Learning) , ώστε να παρουσιαστεί πιο μοντέλο μπορεί να κάνει αποδοτικότερη πρόβλεψη ανα πρωτάθλημα. Οι αλγόριθμοι ειναι Logistic Regression, k-nearest neighbors (KNN), Support Vector Machine (SVM), Random Forest, Νευρωνικό δίκτυο(Multi-layer Perceptron) . Χρησιμοποιήθηκαν σε 3 διαφορετικά σενάρια που αφόρούσαν επεξεργασμένα δεδομένα με διάφορες τεχνικές όπως standardization, Pearson correlation και στατιστικά μεσης τιμής . Απότερος στόχος ήταν να κάνουμε πρόβλεψη της τελευταίας 5ετίας με τους παραπανω κατηγοριοποιητές , βάσει των προηγούμενων χρόνων για κάθε σύνολο δεδομένων. Ως τελευταίο κομμάτι αυτής της διπλωματικής ήταν να χρησιμοποιήσουμε το καλύτερο μοντέλο ανα πρωτάθλημα και να το εφαρμόσουμε (fit) στο αντίθετο πρωτάθλημα.	el
dc.format.extent	76	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.title	Αναλυτική δεδομένων αγώνων καλαθοσφαίρισης για την πρόβλεψη αποτελεσμάτων και εξαγωγή γνώσης	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	The present thesis deals with Sports Analytics. As in many other domains, also in sports the rate of data collection has been steadily increasing in recent years. Basketball Data were used. More specifically, two datasets from the two largest leagues in the world, the NBA and the Euroleague, were analyzed. Each dataset contains statistics for the seasons 2005-06 up to 2018-19. Apart from the many statistics that concern data of a match such as points, assists, rebounds, steals, etc. is given the success of admission or not in playoffs of the respective league. Attribute that we will deal with, since it is the class of each dataset. The following Supervised Machine Learning algorithms were used to present a model that can make more efficient predictions per league. The algorithms are Logistic Regression, k-nearest neighbors (KNN), Support Vector Machine (SVM), Random Forest, Neural Network (Multi-layer Perceptron). They were used in 3 different scenarios involving processed data with different techniques such as standardization, Pearson correlation and average statistics. Another goal was to make a forecast of the last 5 years with the above classifiers, based on previous years for each dataset. As the last part of this thesis was to use the best model/classifier per league/dataset and fit it to the opposite league.	el
dc.contributor.master	Προηγμένα Συστήματα Πληροφορικής	el
dc.subject.keyword	Μηχανική μάθηση	el
dc.subject.keyword	Aναλυτική αθλητικών δεδομένων	el
dc.subject.keyword	Κατηγοριοποίηση	el
dc.subject.keyword	Πρόβλεψη μπάσκετ	el
dc.subject.keyword	Euroleague	el
dc.subject.keyword	NBA	el
dc.subject.keyword	Multi-layer perceptron	el
dc.subject.keyword	k-nearest neighbors	el
dc.subject.keyword	Logistic regression	el
dc.subject.keyword	Support Vector Machines (SVM)	el
dc.subject.keyword	Random forest	el
dc.subject.keyword	Pearson correlation	el
dc.subject.keyword	Machine learning	el
dc.subject.keyword	Classification	el
dc.subject.keyword	Sports analytics	el
dc.date.defense	2021-07-09

Αρχεία σε αυτό το τεκμήριο

Name:: Gardelis_ΜΕ1922.pdf
Μέγεθος:: 1.551Mb
Τύπος:: PDF
Description:: Μεταπτυχιακή διατριβή

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής