Εμφάνιση απλής εγγραφής

dc.contributor.advisorΦιλιππάκης, Μιχαήλ
dc.contributor.authorΠαπαθανασίου, Σπυρίδων
dc.date.accessioned2026-05-25T12:14:06Z
dc.date.available2026-05-25T12:14:06Z
dc.date.issued2026-05
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/19377
dc.description.abstractΗ παρούσα διπλωματική εργασία εστιάζει στην εφαρμογή αλγόριθμων πρόβλεψης σε δεδομένα ποιότητας αέρα. Συγκεκριμένα, η εργασία χρησιμοποιεί το σύνολο δεδομένων γνωστό ως «UCI Air Quality», διαθέσιμο από το αποθετήριο UCI, και εστιάζει στην προβλεπτική του μονοξείδιου του άνθρακα (CO). Τα δεδομένα ποιότητας αέρα μπορούν να χαρακτηριστούν ως δύσκολα προς πρόβλεψη καθώς συχνά παρουσιάζουν ασταθή διακύμανση και ακραίες τιμές σε ασταθή διαστήματα ενώ παράλληλα το συγκεκριμένο σύνολο δεδομένων παρουσιάζει σημαντικό αριθμό ελλιπών τιμών, πράγμα που το καθιστά δύσκολο ως προς την χρήση του, καθώς είναι αναγκαία η κατάλληλη προ -επεξεργασία ώστε να μπορούν να εφαρμοστούν οι διάφοροι προβλεπτικοί αλγόριθμοι. Για αυτόν τον λόγο, στην εργασία δόθηκε ιδιαίτερη έμφαση στην ανίχνευση και αντιμετώπιση των ελλιπών τιμών, μέσω εφαρμογής και αξιολόγησης διαφορετικών τρόπων αντιμετώπισης του προαναφερόμενου προβλήματος. Πέρα από αυτά, η εργασία παρουσιάζει 4 επίπεδα ερωτημάτων - συγκρίσεων σχετικά με τους προβλεπτικούς αλγόριθμους που εφαρμόστηκαν: Την σύγκριση στατιστικών μοντέλων (SARMA – SARIMA) με μοντέλα μηχανικής μάθησης (Random Forest), την σύγκριση προσεγγίσεων “multi-step” και “single-step” για τα προαναφερόμενα μοντέλα, που οδηγούν στην σύγκριση των δημιουργούμενων “βραχυπρόθεσμων” και “μεσοπρόθεσμων” οριζόντων πρόβλεψης, καθώς και την σύγκριση “μονομεταβλητών” και “πολυμεταβλητών” προσεγγίσεων των προαναφερόμενων αλγορίθμων. Ο ορίζοντας πρόβλεψης ορίστηκε ως 1 εβδομάδα, όπου οι προσεγγίσεις “singe-step” εστιάζουν στην πρόβλεψη μίας ώρας για διάρκεια μίας εβδομάδας ενώ οι προσεγγίσεις “multi-step” εστιάζουν στην πρόβλεψη τιμών μιας εβδομάδας. Ως προς τα αποτελέσματα, αξιολογήθηκαν κυρίως με βάση τις μετρικές Mean Absolute Error (MAE) και Root Mean Square Error (RMSE). Γενικά, επιβεβαιώθηκε ότι οι προσεγγίσεις single – step υπερτερούν σε σχέση με τις multi – step προσεγγίσεις ενώ πιο συγκεκριμένα τα μοντέλα Random Forest παρήγαγαν τις χαμηλότερες μετρικές σφαλμάτων. Το μονοδιάστατο (univariate) μοντέλο Random Forest, με προσέγγιση single – step παρήγαγε τις χαμηλότερες μετρικές σφάλματος, καθώς το MAE βρέθηκε ως 0,34 και το RMSE ως 0,53.el
dc.format.extent115el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΣύγκριση προβλεπτικών προσεγγίσεων και αλγορίθμων για το μονοξείδιο του άνθρακαel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENThis MSc dissertation focuses on the application of forecasting algorithms to air quality data. Specifically, the study uses the dataset known as the “UCI Air Quality” dataset, available from the UCI repository, and focuses on forecasting carbon monoxide (CO). Air quality data can be considered difficult to predict, as they often exhibit unstable variability and extreme values over irregular intervals. In addition, the specific dataset contains a significant number of missing values, making it challenging to use, as appropriate preprocessing is required before applying forecasting algorithms. For this reason, particular emphasis is placed on the detection and handling of missing values, through the application and evaluation of different imputation techniques. Beyond this, the study presents four levels of comparisons regarding the forecasting algorithms applied: the comparison of statistical models (SARMA – SARIMA) with machine learning models (Random Forest), the comparison of “multi-step” and “single-step” forecasting approaches for these models, which leads to the comparison of “short-term” and “medium-term” forecasting horizons, as well as the comparison between “univariate” and “multivariate” modeling approaches. The forecasting horizon is defined as one week, where “single-step” approaches focus on predicting one hour ahead iteratively over a one-week period, while “multi-step” approaches focus on directly predicting values for the entire one-week horizon. Regarding the results, model performance is primarily evaluated using the Mean Absolute Error (MAE) and Root Mean Square Error (RMSE). In general, it is confirmed that single-step approaches outperform multi-step approaches. More specifically, Random Forest models produce the lowest error metrics. The univariate Random Forest model, using a single-step approach, achieves the best performance, with an MAE of 0,34 and an RMSE of 0,53.el
dc.contributor.masterΠληροφοριακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordΠροβλέψειςel
dc.subject.keywordΠοιότητα αέραel
dc.subject.keywordSingle stepel
dc.subject.keywordΧρονοσειρέςel
dc.subject.keywordMulti stepel
dc.date.defense2026-05-21


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»