dc.contributor.advisor | Μαγκλογιάννης, Ηλίας | |
dc.contributor.author | Γαρδέλης, Σταύρος | |
dc.date.accessioned | 2021-07-16T08:24:42Z | |
dc.date.available | 2021-07-16T08:24:42Z | |
dc.date.issued | 2021-06 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/13576 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/999 | |
dc.description.abstract | Η παρούσα Διπλωματική εργασία ασχολείται με την Aναλυτική αθλητικών δεδομένων (Sports Analytics). Όπως σε πολλούς άλλους κλάδους, έτσι και στον αθλητισμό ο ρυθμός συλλογής δεδομένων αυξάνεται συνεχώς τα τελευταία χρόνια. Χρησιμοποιήθηκαν δεδομένα απο το άθλημα της καλαθοσφαίρησης (Basketball) .
Πιο συγκεκριμένα αναλύθηκαν 2 σύνολα δεδομένων (dataset) απο τα δύο μεγαλύτερα πρωταθλήματα του κόσμου, του NBA και της Euroleague. Κάθε dataset περιέχει στατιστικά δεδομένα ομάδων για τις χρονιές 2005-06 έως και 2018-19. Εκτός απο τα πολλά στατιστικά που αφορούν δεδομένα ενός αγώνα όπως πόντοι , ασιστ , ριμπάουντ, κλεψίματα κ.α. δίνεται και η επιτυχία εισαγωγής ή όχι στα playoff του αντίστοιχου πρωταθλήματος. Δεδομένο με το οποίο θα ασχοληθούμε, μιας και είναι η κλάση του dataset.
Χρησιμοποιήθηκαν οι παρακάτω αλγόριθμοι επιβλεπόμενης μηχανική μάθησης (Supervised Learning) , ώστε να παρουσιαστεί πιο μοντέλο μπορεί να κάνει αποδοτικότερη πρόβλεψη ανα πρωτάθλημα. Οι αλγόριθμοι ειναι Logistic Regression, k-nearest neighbors (KNN), Support Vector Machine (SVM), Random Forest, Νευρωνικό δίκτυο(Multi-layer Perceptron) . Χρησιμοποιήθηκαν σε 3 διαφορετικά σενάρια που αφόρούσαν επεξεργασμένα δεδομένα με διάφορες τεχνικές όπως standardization, Pearson correlation και στατιστικά μεσης τιμής .
Απότερος στόχος ήταν να κάνουμε πρόβλεψη της τελευταίας 5ετίας με τους παραπανω κατηγοριοποιητές , βάσει των προηγούμενων χρόνων για κάθε σύνολο δεδομένων.
Ως τελευταίο κομμάτι αυτής της διπλωματικής ήταν να χρησιμοποιήσουμε το καλύτερο μοντέλο ανα πρωτάθλημα και να το εφαρμόσουμε (fit) στο αντίθετο πρωτάθλημα. | el |
dc.format.extent | 76 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Αναλυτική δεδομένων αγώνων καλαθοσφαίρισης για την πρόβλεψη αποτελεσμάτων και εξαγωγή γνώσης | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | The present thesis deals with Sports Analytics. As in many other domains, also in sports the rate of data collection has been steadily increasing in recent years. Basketball Data were used.
More specifically, two datasets from the two largest leagues in the world, the NBA and the Euroleague, were analyzed. Each dataset contains statistics for the seasons 2005-06 up to 2018-19. Apart from the many statistics that concern data of a match such as points, assists, rebounds, steals, etc. is given the success of admission or not in playoffs of the respective league. Attribute that we will deal with, since it is the class of each dataset.
The following Supervised Machine Learning algorithms were used to present a model that can make more efficient predictions per league. The algorithms are Logistic Regression, k-nearest neighbors (KNN), Support Vector Machine (SVM), Random Forest, Neural Network (Multi-layer Perceptron). They were used in 3 different scenarios involving processed data with different techniques such as standardization, Pearson correlation and average statistics.
Another goal was to make a forecast of the last 5 years with the above classifiers, based on previous years for each dataset.
As the last part of this thesis was to use the best model/classifier per league/dataset and fit it to the opposite league. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |
dc.subject.keyword | Μηχανική μάθηση | el |
dc.subject.keyword | Aναλυτική αθλητικών δεδομένων | el |
dc.subject.keyword | Κατηγοριοποίηση | el |
dc.subject.keyword | Πρόβλεψη μπάσκετ | el |
dc.subject.keyword | Euroleague | el |
dc.subject.keyword | NBA | el |
dc.subject.keyword | Multi-layer perceptron | el |
dc.subject.keyword | k-nearest neighbors | el |
dc.subject.keyword | Logistic regression | el |
dc.subject.keyword | Support Vector Machines (SVM) | el |
dc.subject.keyword | Random forest | el |
dc.subject.keyword | Pearson correlation | el |
dc.subject.keyword | Machine learning | el |
dc.subject.keyword | Classification | el |
dc.subject.keyword | Sports analytics | el |
dc.date.defense | 2021-07-09 | |