| dc.contributor.advisor | Φιλιππάκης, Μιχαήλ | |
| dc.contributor.author | Παπαθανασίου, Σπυρίδων | |
| dc.date.accessioned | 2026-05-25T12:14:06Z | |
| dc.date.available | 2026-05-25T12:14:06Z | |
| dc.date.issued | 2026-05 | |
| dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/19377 | |
| dc.description.abstract | Η παρούσα διπλωματική εργασία εστιάζει στην εφαρμογή αλγόριθμων πρόβλεψης σε δεδομένα ποιότητας αέρα. Συγκεκριμένα, η εργασία χρησιμοποιεί το σύνολο δεδομένων γνωστό ως «UCI Air Quality», διαθέσιμο από το αποθετήριο UCI, και εστιάζει στην προβλεπτική του μονοξείδιου του άνθρακα (CO). Τα δεδομένα ποιότητας αέρα μπορούν να χαρακτηριστούν ως δύσκολα προς πρόβλεψη καθώς συχνά παρουσιάζουν ασταθή διακύμανση και ακραίες τιμές σε ασταθή διαστήματα ενώ παράλληλα το συγκεκριμένο σύνολο δεδομένων παρουσιάζει σημαντικό αριθμό ελλιπών τιμών, πράγμα που το καθιστά δύσκολο ως προς την χρήση του, καθώς είναι αναγκαία η κατάλληλη προ -επεξεργασία ώστε να μπορούν να εφαρμοστούν οι διάφοροι προβλεπτικοί αλγόριθμοι. Για αυτόν τον λόγο, στην εργασία δόθηκε ιδιαίτερη έμφαση στην ανίχνευση και αντιμετώπιση των ελλιπών τιμών, μέσω εφαρμογής και αξιολόγησης διαφορετικών τρόπων αντιμετώπισης του προαναφερόμενου προβλήματος. Πέρα από αυτά, η εργασία παρουσιάζει 4 επίπεδα ερωτημάτων - συγκρίσεων σχετικά με τους προβλεπτικούς αλγόριθμους που εφαρμόστηκαν: Την σύγκριση στατιστικών μοντέλων (SARMA – SARIMA) με μοντέλα μηχανικής μάθησης (Random Forest), την σύγκριση προσεγγίσεων “multi-step” και “single-step” για τα προαναφερόμενα μοντέλα, που οδηγούν στην σύγκριση των δημιουργούμενων “βραχυπρόθεσμων” και “μεσοπρόθεσμων” οριζόντων πρόβλεψης, καθώς και την σύγκριση “μονομεταβλητών” και “πολυμεταβλητών” προσεγγίσεων των προαναφερόμενων αλγορίθμων. Ο ορίζοντας πρόβλεψης ορίστηκε ως 1 εβδομάδα, όπου οι προσεγγίσεις “singe-step” εστιάζουν στην πρόβλεψη μίας ώρας για διάρκεια μίας εβδομάδας ενώ οι προσεγγίσεις “multi-step” εστιάζουν στην πρόβλεψη τιμών μιας εβδομάδας.
Ως προς τα αποτελέσματα, αξιολογήθηκαν κυρίως με βάση τις μετρικές Mean Absolute Error (MAE) και Root Mean Square Error (RMSE). Γενικά, επιβεβαιώθηκε ότι οι προσεγγίσεις single – step υπερτερούν σε σχέση με τις multi – step προσεγγίσεις ενώ πιο συγκεκριμένα τα μοντέλα Random Forest παρήγαγαν τις χαμηλότερες μετρικές σφαλμάτων. Το μονοδιάστατο (univariate) μοντέλο Random Forest, με προσέγγιση single – step παρήγαγε τις χαμηλότερες μετρικές σφάλματος, καθώς το MAE βρέθηκε ως 0,34 και το RMSE ως 0,53. | el |
| dc.format.extent | 115 | el |
| dc.language.iso | el | el |
| dc.publisher | Πανεπιστήμιο Πειραιώς | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.title | Σύγκριση προβλεπτικών προσεγγίσεων και αλγορίθμων για το μονοξείδιο του άνθρακα | el |
| dc.type | Master Thesis | el |
| dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
| dc.description.abstractEN | This MSc dissertation focuses on the application of forecasting algorithms to air quality data. Specifically, the study uses the dataset known as the “UCI Air Quality” dataset, available from the UCI repository, and focuses on forecasting carbon monoxide (CO). Air quality data can be considered difficult to predict, as they often exhibit unstable variability and extreme values over irregular intervals. In addition, the specific dataset contains a significant number of missing values, making it challenging to use, as appropriate preprocessing is required before applying forecasting algorithms. For this reason, particular emphasis is placed on the detection and handling of missing values, through the application and evaluation of different imputation techniques. Beyond this, the study presents four levels of comparisons regarding the forecasting algorithms applied: the comparison of statistical models (SARMA – SARIMA) with machine learning models (Random Forest), the comparison of “multi-step” and “single-step” forecasting approaches for these models, which leads to the comparison of “short-term” and “medium-term” forecasting horizons, as well as the comparison between “univariate” and “multivariate” modeling approaches. The forecasting horizon is defined as one week, where “single-step” approaches focus on predicting one hour ahead iteratively over a one-week period, while “multi-step” approaches focus on directly predicting values for the entire one-week horizon.
Regarding the results, model performance is primarily evaluated using the Mean Absolute Error (MAE) and Root Mean Square Error (RMSE). In general, it is confirmed that single-step approaches outperform multi-step approaches. More specifically, Random Forest models produce the lowest error metrics. The univariate Random Forest model, using a single-step approach, achieves the best performance, with an MAE of 0,34 and an RMSE of 0,53. | el |
| dc.contributor.master | Πληροφοριακά Συστήματα και Υπηρεσίες | el |
| dc.subject.keyword | Προβλέψεις | el |
| dc.subject.keyword | Ποιότητα αέρα | el |
| dc.subject.keyword | Single step | el |
| dc.subject.keyword | Χρονοσειρές | el |
| dc.subject.keyword | Multi step | el |
| dc.date.defense | 2026-05-21 | |