Εμφάνιση απλής εγγραφής

Forecasting S&P 500 using technical analysis, macro indicators and machine learning. a hybrid approach

dc.contributor.advisorFilippakis, Michael
dc.contributor.advisorΦιλιππάκης, Μιχαήλ
dc.contributor.authorPapavasileiou, Nikolaos
dc.contributor.authorΠαπαβασιλείου, Νικόλαος
dc.date.accessioned2025-09-08T09:46:52Z
dc.date.available2025-09-08T09:46:52Z
dc.date.issued2025-06
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18111
dc.description.abstractΗ παρούσα διπλωματική εργασία διερευνά την εφαρμογή τεχνικών μηχανικής μάθησης για την πρόβλεψη κατευθυντικών κινήσεων στο SPY ETF, ένα διαπραγματεύσιμο αμοιβαίο κεφάλαιο που παρακολουθεί τον δείκτη S&P 500. Ο κύριος στόχος είναι να αξιολογηθεί κατά πόσο ο συνδυασμός μακροοικονομικών δεικτών με τεχνική ανάλυση μπορεί να βελτιώσει την προγνωστική απόδοση και τη χρηματοοικονομική αποδοτικότητα μοντέλων συναλλαγών βασισμένων στην ταξινόμηση. Τα παραδοσιακά μοντέλα βασίζονται συχνά είτε σε τεχνικούς είτε σε θεμελιώδεις δείκτες απομονωμένα, όμως πρόσφατες έρευνες υποδηλώνουν ότι οι υβριδικές προσεγγίσεις ενδέχεται να προσφέρουν μεγαλύτερη ανθεκτικότητα και γενίκευση σε ευμετάβλητα χρηματοοικονομικά περιβάλλοντα. Συγκεντρώθηκε ένα εκτενές σύνολο δεδομένων για την περίοδο από τον Φεβρουάριο του 2003 έως τον Ιούνιο του 2025, το οποίο περιλαμβάνει πάνω από 230 χαρακτηριστικά, όπως μακροοικονομικά μεγέθη (π.χ. επιτόκια, ποσοστά ανεργίας, δεδομένα πληθωρισμού και νομισματικά μεγέθη), καθώς και τεχνικούς δείκτες όπως Bollinger Bands, MACD, RSI και TSI. Χρησιμοποιήθηκε Ανάλυση Κύριων Συνιστωσών (PCA) για τη μείωση της διαστασιμότητας, ενώ δοκιμάστηκαν διάφοροι αλγόριθμοι μηχανικής μάθησης — συμπεριλαμβανομένων των K-Nearest Neighbors (KNN), Τυχαίων Δασών (Random Forests), Ενισχυτικής Μάθησης (Gradient Boosting) και Λογιστικής Παλινδρόμησης — για την αξιολόγηση της ακρίβειας ταξινόμησης. Οι ετικέτες δημιουργήθηκαν βάσει των μελλοντικών αποδόσεων του SPY σε διάφορους χρονικούς ορίζοντες (π.χ. 3, 7, 30 και 90 ημερών) και κατηγοριοποιήθηκαν σε τρία σήματα συναλλαγών: ΑΓΟΡΑ, ΟΥΔΕΤΕΡΟ και ΠΩΛΗΣΗ. Εκτός από την αξιολόγηση της ακρίβειας ταξινόμησης, η εργασία δίνει ιδιαίτερη έμφαση στη δοκιμή των στρατηγικών μέσω αναδρομικών προσομοιώσεων (backtesting) χρησιμοποιώντας βασικούς δείκτες όπως η σωρευτική απόδοση και ο δείκτης Sharpe. Τα ευρήματα δείχνουν ότι τα μοντέλα που χρησιμοποιούν μόνο μακροοικονομικούς ή μόνο τεχνικούς δείκτες έχουν χαμηλότερη απόδοση, ενώ τα υβριδικά μοντέλα βελτιώνουν σημαντικά τόσο την ποιότητα πρόβλεψης όσο και τα αποτελέσματα των συναλλαγών. Η καλύτερη απόδοση επιτεύχθηκε με τον ταξινομητή KNN, χρησιμοποιώντας 20 επιλεγμένες κύριες συνιστώσες (PCA) και ορίζοντα πρόβλεψης 90 ημερών, αποδίδοντας ακρίβεια ταξινόμησης περίπου 85% και δείκτη Sharpe άνω του 1,2. Τα αποτελέσματα αυτά υποστηρίζουν την υπόθεση ότι τα ενοποιημένα σύνολα χαρακτηριστικών, σε συνδυασμό με κατάλληλη επιλογή μοντέλου και ρύθμιση κατωφλίων, μπορούν να ενισχύσουν την οικονομική πρόβλεψη σε σύνθετες συνθήκες αγοράς.el
dc.format.extent55el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/gr/*
dc.titleForecasting S&P 500 using technical analysis, macro indicators and machine learning. a hybrid approachel
dc.title.alternativeΠροβλέψεις για τον S&P 500, χρησιμοποιώντας τεχνική ανάλυση, μακροοικονομικούς δείκτες και μηχανική μάθηση. Μία υβριδική προσέγγισηel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENThis thesis investigates the application of machine learning techniques to predict directional movements in the SPY ETF, an exchange-traded fund tracking the S&P 500 index. The primary objective is to evaluate whether combining macroeconomic indicators with technical analysis features can improve the predictive performance and financial profitability of classification-based trading models. Traditional models often rely on either technical or fundamental indicators in isolation, but recent research suggests that hybrid approaches may offer better robustness and generalization in volatile financial environments. A comprehensive dataset was compiled covering the period from February 2003 to June 2025, incorporating over 230 features, including macroeconomic metrics such as interest rates, unemployment figures, inflation data, and monetary aggregates, alongside technical indicators like Bollinger Bands, MACD, RSI, and TSI. Principal Component Analysis (PCA) was used to reduce dimensionality, while various machine learning algorithms — including K-Nearest Neighbors (KNN), Random Forests, Gradient Boosting, and Logistic Regression — were tested for their classification accuracy. Labels were generated based on future SPY returns over multiple time horizons (e.g., 3, 7, 30, and 90 days), and categorized into three trading signals: BUY, NEUTRAL, and SELL. In addition to evaluating classification accuracy, the thesis places significant emphasis on backtesting strategy performance using key metrics such as cumulative return and Sharpe ratio. The findings reveal that models using only macroeconomic or only technical indicators tend to underperform, while hybrid models substantially improve both prediction quality and trading outcomes. The best-performing configuration was achieved using the KNN classifier with 20 selected PCA components and a 90-day prediction horizon, yielding a classification accuracy of approximately 85% and a Sharpe ratio exceeding 1.2. These results support the hypothesis that integrated feature sets combined with proper model selection and threshold tuning can enhance financial forecasting in complex market conditions.el
dc.contributor.masterΠληροφοριακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordSPY predictionel
dc.subject.keywordMachine learningel
dc.subject.keywordTechnical analysisel
dc.subject.keywordMacroeconomic indicatorsel
dc.subject.keywordPrincipal component analysisel
dc.subject.keywordk-nearest neighborsel
dc.subject.keywordStock forecastingel
dc.subject.keywordSharpe ratioel
dc.subject.keywordHybrid modelsel
dc.subject.keywordFinancial time seriesel
dc.date.defense2025-07-16


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»