Χρήση ανατροφοδοτούμενου νευρωνικού δικτύου και χρονοσειρών για την πρόβλεψη δεδομένων
Using recurrent neural networks and time series for data prediction
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Νευρωνικά δίκτυα ; Χρονοσειρές ; Δεδομένα twitter ; Πρόβλεψη ; LTSM ; Neural networks ; Time series ; Twitter data ; PredictionΠερίληψη
Δεν υφίσταται καμία αμφιβολία πως το να γνωρίζει κανείς το μέλλον μπορεί να
αποτελέσει το μεγαλύτερο πλεονέκτημα αυτής της ζωής. Ο άνθρωπος που διαθέτει
την ικανότητα να προβλέψει το τι έχει να του προσφέρει το αύριο καθίσταται
ικανός να προσεγγίσει αποτελεσματικότερα τους στόχους του. Δεν υφίσταται
επίσης καμία αμφιβολία για την συνδρομή των νευρωνικών δικτύων στην σημερινή
εποχή αλλά και το πλήθος ερευνητικών εφαρμογών που έχει προσδώσει. Τα
νευρωνικά δίκτυα αποτελούν ισχυρά εργαλεία για την πρόβλεψη μέσω της
ανάλυσης χρονοσειρών και αυτό αποτελεί και τον πυρήνα της παρούσας
διπλωματικής εργασίας. Παρόλο που γνωρίζουμε ότι είναι αδύνατο να γνωρίζουμε
το μέλλον, πλήρως, μπορούμε να προσπαθήσουμε να προβλέψουμε το τι έρχεται.
Τόσο τα νευρωνικά δίκτυα όσο και η ανάλυση κοινωνικών δικτύων είναι δύο
διακριτά πεδία, παρόλα αυτά είναι δυνατό να συσχετιστούν με διάφορους τρόπους,
όπως θα αποδειχθεί με την εν λόγω προσέγγιση, θέτοντας ως σημείο εστίασης την
ανάλυση όπως και την αποσαφήνιση της δομής των κοινωνικών δικτύων. Το twitter
ως ένας από τους βασικότερους πυλώνες του των κοινωνικών δικτύων θα
αποτελέσει την πηγή δεδομένων της υλοποίησης του συγκεκριμένου ερευνητικού
σχεδιασμού προκειμένου να επιτευχθούν οι στόχοι της παρούσας εργασίας.
Στην παρούσα διπλωματική εργασία πρόκειται να πραγματοποιηθεί οπτικοποίηση
του ημερησίου όγκου αναρτήσεων περιορίζοντας το σύνολο χρηστών σε εκείνους
που έχουν κάνει παραπάνω από έναν αριθμό tweets, πρόβλεψη του αριθμού των
tweets που δημοσιεύονται κάθε λεπτό βασισμένο στα δεδομένα των
προηγούμενων 24 ωρών και τέλος πρόβλεψη του αριθμού των tweets ανά λεπτό
βασισμένο σε ιστορικά δεδομένα, χρησιμοποιώντας το μοντέλο βαθιάς μάθησης
που ονομάζεται LSTM (Long Short-Term Memory). Έπειτα θα γίνει γνωστοποίηση
των μεθόδων πρόβλεψης χρονοσειρών με χρήση ανατροφοδοτούμενου νευρωνικού
δικτύου, η διαδικασία δημιουργίας του dataset καθώς και τα αποτελέσματα των
προβλέψεων των δύο μελετών περίπτωσης.