Πρόβλεψη και ανάλυση της απόδοσης σε αγώνες αυτοκίνητου Formula 1
Prediction and analysis of performance in Formula 1 races

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Data Analysis ; Prediction ; Timeseries ; Classification ; Clustering ; Machine Learning ; Regression ; Formula 1Περίληψη
Η Φόρμουλα 1, γνωστή και ως η κορυφή του μηχανοκίνητου αθλητισμού, συνδυάζει την αιχμή της τεχνολογίας με το ταλέντο παγκόσμιας κλάσης των οδηγών και τις στρατηγικές τακτικές των ομάδων, σε ένα άθλημα όπου τα χιλιοστά του δευτερολέπτου κάνουν τη διαφορά μεταξύ νίκης και ήττας. Καθώς οι αγώνες εξελίσσονται με απρόβλεπτο τρόπο λόγω των καιρικών συνθηκών, των στρατηγικών ελαστικών, των περιστατικών στην πίστα και της μεταβαλλόμενης απόδοσης των μονοθέσιων, η Φόρμουλα 1 προσφέρει ένα εύφορο πεδίο για ανάλυση δεδομένων. Οι ομάδες αξιοποιούν προηγμένα αναλυτικά εργαλεία για να μεγιστοποιήσουν τη στρατηγική τους, να βελτιώσουν την απόδοση του μονοθέσιου και να βελτιστοποιήσουν τα pit stops. Πέρα από αυτό, η αυξανόμενη διαθεσιμότητα δεδομένων αγώνων έχει δώσει τη δυνατότητα σε ερευνητές και αναλυτές να χρησιμοποιούν προηγμένες στατιστικές μεθόδους για την αναγνώριση τάσεων, την ανάλυση της απόδοσης οδηγών και ομάδων και την ανάπτυξη προγνωστικών μοντέλων. Μέσω της χρήσης της μηχανικής μάθησης και της εφαρμοσμένης στατιστικής, είναι δυνατό να ξεπεραστούν οι παραδοσιακές προσεγγίσεις κατανόησης των αγώνων και να αποκαλυφθούν βαθύτερα πρότυπα που ορίζουν την επιτυχία στο άθλημα.
Η παρούσα διπλωματική εργασία εστιάζει στην εφαρμογή στατιστικών και μεθόδων μηχανικής μάθησης για τη μελέτη και πρόβλεψη της απόδοσης στους αγώνες της Φόρμουλα 1. Η έρευνα προηγείται από εκτενή προετοιμασία δεδομένων και δημιουργία χαρακτηριστικών, όπως διερευνητική ανάλυση μέσω περιγραφικών στατιστικών, ανάλυση συσχετίσεων και έλεγχοι κανονικότητας. Οι τεχνικές χρονοσειρών και παλινδρόμησης διευκολύνουν την παρακολούθηση και πρόβλεψη τάσεων απόδοσης μέσω ιστορικών δεδομένων. Η μείωση διαστατικότητας επιτυγχάνεται με την εφαρμογή της Ανάλυσης Κύριων Συνιστωσών (PCA) στο κεφάλαιο της μηχανικής μάθησης. Τα μοντέλα ταξινόμησης Random Forest και Support Vector Machines (SVM) χρησιμοποιούνται για την πρόβλεψη των αποτελεσμάτων των αγώνων. Τεχνικές συσταδοποίησης όπως τα K-Means και Ιεραρχική Συσταδοποίηση (Hierarchical Clustering) αναγνωρίζουν πρότυπα στην απόδοση των οδηγών. Τα αποτελέσματα αναδεικνύουν την αποτελεσματικότητα αυτών των μεθόδων στον εντοπισμό βασικών δεικτών απόδοσης και τάσεων, καταδεικνύοντας πώς οι στατιστικές και οι μεθοδολογίες μηχανικής μάθησης μπορούν να ενισχύσουν την κατανόησή μας γύρω από την ανάλυση του μηχανοκίνητου αθλητισμού, προσφέροντας δεδομενοκεντρική κατανόηση της απόδοσης και του ανταγωνισμού στους αγώνες.