Δημιουργία μοντέλου για την αξιολόγηση αποφάσεων επενδύσεων στηριζόμενοι σε τεχνικές sentiment analysis και στατιστικές μεθόδους
Creating a model for evaluating investment decisions based on sentiment analysis and statistics methods
Master Thesis
Συγγραφέας
Τσόπελας, Θωμάς
Tsopelas, Thomas
Ημερομηνία
2022-07-02Επιβλέπων
Φιλιππάκης, ΜιχαήλFilippakis, Michael
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Predictive analytics ; Μετοχές ; Χρονοσειρές ; Προβλέψεις ; Efficient market hypothesis ; Μοντέλα ARIMA ; Python ; NLP ; Neural network ; VADERΠερίληψη
Η παρούσα διπλωματική εργασία περιέχει μια μελέτη στην ερευνητική περιοχή των Predictive Analytics, κάνοντας χρήση των δυνατοτήτων της γλώσσας Python και των διαθέσιμων βιβλιοθηκών καθώς
γίνεται μια προσπάθεια πρόβλεψης της τιμής μιας μετοχής ως χρονοσειρά σε αρχικό χρόνο.
Ως προς το περιεχόμενο, αρχικά παρουσιάζονται κάποιες βασικές έννοιες που συνδέονται με τις
μετοχές και τις επενδύσεις, όπως είναι η αναμενόμενη απόδοση,efficient market hypothesis, η
πραγματική απόδοση μιας επένδυσης, ο κίνδυνος που ενέχει μια επένδυση η ανάλυση φυσικής
γλώσσας και συναισθήματος και πώς αυτά τα δύο πεδία έχουν εφαρμογή στην σύγχρονη οικονομία
και καθημερινότητα.
Γίνεται ανάλυση της έννοιας της χρονοσειράς και των βασικότερων χαρακτηριστικών της σε
θεωρητικό επίπεδο, όπως η στασιμότητα, η αυτοσυσχέτιση, η περιοδικότητα. Παρουσιάζονται,
επίσης, τα γραμμικά μοντέλα AR(p), MA (q) και ARIMA (p,d,q), τα οποία δύνανται να
«προσαρμοστούν» στα δεδομένα μιας στάσιμης χρονοσειράς και να παρέχουν προβλέψεις με μια
σχετική ακρίβεια.
Τέλος, το θεωρητικό υπόβαθρο των χρονοσειρών και των γραμμικών μοντέλων εφαρμόζεται στην
πράξη σε μια μελέτη πραγματικής μετοχής για την περίοδο 17/11/2016 – 16/11/2021. Η έρευνα αφορά
τις μετοχές των εταιρειών «Home Depot» η οποίa είναι εισηγμένη στο Αμερικανικό Χρηματιστήριο
Dow Jones.
Η ανάπτυξη του παγκόσμιου ιστού έχει οδηγήσει στην ραγδαία αύξηση των δεδομένων όπου είναι
διαθέσιμα προς επεξεργασία και ανάλυση για την εξαγωγή συμπερασμάτων, για το λόγο αυτό έχουν
κατασκευαστεί εργαλεία για την άντληση και επεξεργασία των δεδομένων αυτών. Η ανάλυση της
προσωπικής άποψης και πεποίθησης αποτελεί ένα βασικό σημείο όπου μπορεί να πραγματοποιηθεί
μέσω των παραπάνω δεδομένων.
Στη συνέχεια γίνεται χρήση ενός ήδη εκπαιδευμένου νευρωνικού δίκτυο για την συσχέτιση
δημοσιεύσεων έγκυρων οικονομικών πηγών με την πορεία της μετοχής μέσω ανάλυσης φυσικής
γλώσσας και στη προσπάθεια εξαγωγής αποτελεσμάτων στον τομέα της ανάλυσης συναισθήματος
του οικονομικού site ενημέρωσης finviz,με τη χρήση της τεχνικής ενός διαθέσιμου λεξικού.
Για την ανάπτυξη των μοντέλων ανάλυσης χρνοσειρών και ανάλυσης συναισθήματος,
χρησιμοποιήθηκε η γλώσσα προγραμματισμού Python, η οποία τα τελευταία χρόνια Οι βασικότερες
βιβλιοθήκες που χρησιμοποιήθηκαν είναι οι Pandas, NumPy, Seaborn και Vader, οι οποίες
προσφέρουν τις απαραίτητες τεχνικές που απαιτούνται για την παρούσα εργασία.