Αναγνώριση τάσης σε ροές δεδομένων κειμένου
Sentiment analysis in text data streams
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Sentiment analysis ; Twitter ; Marching learning ; Neural networks ; RNN ; CNN ; Naive Bayes ; Random forest ; Gradient boosting ; SVM ; GhatGtpΠερίληψη
Η παρούσα διατριβή διερευνά την ακρίβεια της μηχανικής μάθησης και των μοντέλων νευρωνικών δικτύων στην ανάλυση συναισθήματος σε δεδομένα του Twitter κατά τη διάρκεια της πανδημίας COVID-19. Με την αυξανόμενη σημασία των δεδομένων των μέσων κοινωνικής δικτύωσης για τις επιχειρήσεις και την κοινωνία, η ανάλυση συναισθήματος έχει γίνει ένα κρίσιμο εργαλείο για την κατανόηση της κοινής γνώμης και τη λήψη τεκμηριωμένων αποφάσεων. Η μελέτη επικεντρώνεται στην ανάλυση συναισθήματος αγγλικών tweets και συγκρίνει τις επιδόσεις πέντε μοντέλων μηχανικής μάθησης - Naive Bayes, Decision Tree, Random Forest, SVM, Gradiaent Boost- και δύο μοντέλων νευρωνικών δικτύων - RNN ,CNN - με βάση την συνολική ακρίβεια, την ακρίβεια, την ανάκληση και το F1 score. Η μεθοδολογία περιλαμβάνει τη συλλογή και προ επεξεργασία δεδομένων, την εξαγωγή χαρακτηριστικών και την αξιολόγηση των μοντέλων με τη χρήση διαφόρων μετρικών αξιολόγησης. Στόχος της μελέτης είναι να συμβάλει στη βιβλιογραφία σχετικά με την ανάλυση συναισθήματος στο Twitter με χρήση μηχανικής μάθησης και νευρωνικών δικτύων και να παράσχει πληροφορίες σχετικά με την απόδοση διαφόρων μοντέλων στην ανάλυση συναισθήματος δεδομένων Twitter. Τα αποτελέσματα της μελέτης θα μπορούσαν να είναι χρήσιμα για επιχειρήσεις, κυβερνητικές υπηρεσίες και άλλους οργανισμούς στην κατανόηση της κοινής γνώμης που σχετίζεται με το COVID-19 και στη λήψη τεκμηριωμένων αποφάσεων με βάση την ανάλυση συναισθήματος.