Πρόβλεψη χρηματιστηριακών δεικτών με τεχνικές εξόρυξης δεδομένων σε υβριδικές πηγές δεδομένων
Prediction of stock market indices with data mining techniques in hybrid data sources
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Χρονοσειρές ; Εξόρυξη δεδομένων ; Χρηματιστήριο Αξιών Αθηνών ; Προβλέψεις ; Χρηματιστηριακοί δείκτεςΠερίληψη
Στις μέρες μας η πρόβλεψη χρονοσειρών και μάλιστα αποτελούμενων από χρηματοοικονομικά δεδομένα αποτελεί αναμφισβήτητα αντικείμενο εκτεταμένης ερευνητικής δραστηριότητας. Πράγματι, στη χρηματοοικονομική επιστήμη η ανάλυση χρονοσειρών εφαρμόζεται ευρέως για την πρόβλεψη των τιμών των διεθνών και εθνικών χρηματαγορών αλλά και σε εφαρμογές που σχετίζονται με τη διαδικασία πρόβλεψης είτε χρηματοοικονομικών κρίσεων είτε επενδυτικών στρατηγικών.
Είναι γεγονός, ακόμη, ότι τα σύγχρονα συστήματα υποστήριξης λήψης αποφάσεων βασίζονται σε πληροφόρηση που προέρχεται κυρίως από δομημένα δεδομένα αγνοώντας τα αδόμητα, τα οποία δύναται να προσφέρουν σημαντική πληροφόρηση. Αυτό, σε συνδυασμό με τη ραγδαία ανάπτυξη της τεχνολογίας συντέλεσε στη δημιουργία νέων δυναμικών εργαλείων μετατροπής των αδόμητων δεδομένων σε δομημένη πληροφορία, η οποία σε συνδυασμό με τη πληροφόρηση από τα δομημένα θα ωφελήσει τους επενδυτές, προκειμένου για λήψη βέλτιστης απόφασης. Την ανάγκη αυτή καλείται να καλύψει ένας νέος κλάδος της επιστήμης, η εξόρυξη δεδομένων, που αποτελεί ένας συνδυασμό ετερόκλητων επιστημονικών πεδίων όπως της στατιστικής, της μηχανικής μάθησης, της θεωρίας της πληροφορίας και των υπολογιστικών διαδικασιών.
Στη παρούσα εργασία παρουσιάζουμε ένα καινοτόμο σύστημα επεξεργασίας υβριδικών δεδομένων προκειμένου για πρόβλεψη της τάσης τραπεζικών μετοχών του Χρηματιστηρίου Αθηνών για το έτος 2014. Για το λόγο αυτό εξετάζονται τρεις εφαρμογές του συστήματος σε διαφορετικά σύνολα δεδομένων (αριθμητικά, κειμενικά και υβριδικά) και αξιολογούνται προκειμένου να εντοπιστεί η αποτελεσματικότερη εφαρμογή. Στο σύστημα εφαρμόζονται τεχνικές κατηγοριοποίησης και συσταδοποίησης σε σύνολα κατηγορικών δεδομένων ενώ συγχρόνως παρουσιάζονται οι βασικότερες έννοιες και μέθοδοι που χρησιμοποιούνται κατά τη διάρκεια της κατηγοριοποίησης, ομαδοποίησης και πρόβλεψης.
Σκοπός της εργασίας είναι εξηγώντας τις μεθόδους της εξόρυξης δεδομένων, να αναδειχθεί η χρησιμότητά της στα χρηματοοικονομικά δεδομένα καθώς και η σημασία της για την εξαγωγή σημαντικών συμπερασμάτων από αδόμητα και δύσκολα στη χρήση τους δεδομένα.