The impact of distributed neural machine translation in sentiment analysis
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Sentiment analysis ; Neural machine translation ; Natural language processing ; Multilingual sentiment analysis ; Deep learning ; Deep neural networks ; Convolutional neural networks ; Recurrent neural networksΠερίληψη
Τα τελευταία χρόνια παρατηρείται σταθερή αύξηση του ενδιαφέροντος της ερευνητικής και επιχειρηματικής κοινότητας στον τομέα της Τεχνητής Νοημοσύνης (AI). Η ικανότητα των σύγχρονων συσκευών να εφαρμόζουν εξαιρετικά εξελιγμένες τεχνικές μηχανικής μάθησης μηχανών έχει αυξήσει τη σημασία της χρήσης και ανάπτυξης εφαρμογών που θα χρησιμοποιούν τεχνικές και αλγόριθμους μηχανικής μάθησης με σκοπό την επεξεργασία και την ανάλυση των δεδομένων των χρηστών.
Αναμφισβήτητα, η πρόοδος στην ανάπτυξη ηλεκτρονικών υπολογιστών πιο φιλικών προς τον άνθρωπο απαιτεί τη συμπερίληψη της Φυσικής Γλώσσας ως αναπόσπαστο μέσο της ευρύτερης επικοινωνίας. Σήμερα, ο πρωταρχικός στόχος της έρευνας για τη φυσική γλώσσα είναι να επιτρέψει την επικοινωνία μεταξύ ανθρώπων και μηχανών χωρίς να καταφεύγει σε πολύπλοκες και χρονοβόρες διαδικασίες.
Τα σύγχρονα chatbots, οι αυτόματες μηχανές μετάφρασης, οι μηχανές αναζήτησης και άλλα περιλαμβάνονται σε αυτές τις εφαρμογές. Αυτές οι εφαρμογές εφαρμόζουν αλγόριθμους και τεχνικές στον τομέα της Επεξεργασίας Φυσικής Γλώσσας (NLP), η οποία αποτελεί επίσης υποσύνολο της Μηχανικής Μάθησης. Είναι μία από τις πιο εξελιγμένες ερευνητικές και επιχειρηματικές περιοχές της Μηχανικής Μάθησης. Ενώ η επεξεργασία φυσικής γλώσσας δεν είναι ένα νέο πεδίο έρευνας, η έκρηξη της τεχνολογίας και η ανάγκη για πιο αποτελεσματική επικοινωνία και κατανόηση μεταξύ ανθρώπων-μηχανών καθώς και η αυξημένη διαθεσιμότητα μεγάλων δεδομένων, ισχυρών υπολογιστών και ενισχυμένων αλγορίθμων οδήγησε τα τελευταία πέντε χρόνια στην αύξηση του ενδιαφέροντος για την παραγωγή νέων αλγορίθμων και εφαρμογών που θα φέρουν τους ανθρώπους πιο κοντά στις μηχανές.
Η επεξεργασία της φυσικής γλώσσας χρησιμοποιείται ευρέως στην ανάπτυξη εξελιγμένων διεπαφών χρηστών, όπως μπορούμε να δούμε στο πλήθος των σύγχρονων εφαρμογών για κινητά και web, παρακάμπτοντας το κλασσικό μοντέλο οθόνης πληκτρολογίου και ποντικιού. Σε ένα τέτοιο περιβάλλον, η αποδοτικότητα και η ταχύτητα των εφαρμογών αυξάνονται σημαντικά καθώς γίνεται πιο φιλική προς το χρήστη, ενώ νέες δυνατότητες όπως η διασύνδεση φωνητικών εντολών και η αυτόματη απάντηση εμφανίζονται συνεχώς.
Η επεξεργασία της φυσικής γλώσσας βοηθά τους υπολογιστές να επικοινωνούν με τους ανθρώπους, αυξάνοντας έτσι την αποτελεσματικότητα σε εργασίες που περιλαμβάνουν τη χρήση γραπτού ή προφορικού λόγου. Για παράδειγμα, το NLP επιτρέπει στους υπολογιστές να διαβάσουν κείμενο, να αναγνωρίσουν την ομιλία, να ερμηνεύσουν, να εξάγουν το συναίσθημα και να καθορίσουν γενικά ποια μέρη της γραπτής ή προφορικής ομιλίας είναι πιο σημαντικά.
Σήμερα, τα μηχανήματα μπορούν να αναλύσουν περισσότερα γλωσσικά δεδομένα σε ανθρώπους χωρίς ιδιαίτερο κόστος και με συνεκτικό, αμερόληπτο τρόπο. Δεδομένης της κλιμακούμενης και συνεχώς αυξανόμενης ποσότητας μη-δομημένων δεδομένων που παράγονται καθημερινά από τα ιατρικά αρχεία έως και τα κοινωνικά μέσα, η αυτοματοποίηση της επεξεργασίας τους θα είναι κρίσιμη για την αποτελεσματική ανάλυση αυτών.
Το συνεχές ενδιαφέρον της επιστημονικής και επιχειρηματικής κοινότητας για την ανάλυση του αισθήματος των χρηστών των εφαρμογών οδήγησε σε αύξηση της αναζήτησης ικανοποιητικών τεχνικών και αλγορίθμων που θα βοηθήσουν τους χρήστες να παρέχουν υπηρεσίες πιο αποτελεσματικά και αποδοτικά. Η ερευνητική κοινότητα έχει προτείνει και αναπτύξει αποτελεσματικά μεθόδους για τον εντοπισμό και την κατηγοριοποίηση των απόψεων και των συναισθημάτων των χρηστών όπως εκφράζονται σε διάφορα είδη κειμένων, όπως blogs, κριτικές, tweets και πολλά άλλα.
Οι ανάγκες και οι τάσεις των σύγχρονων διαπολιτισμικών και πολύγλωσσων κοινωνιών αποδεικνύουν όλο και περισσότερο την ανάγκη δημιουργίας πολύγλωσσων λύσεων και εφαρμογών που θα λειτουργούν σε ευρύτερο πλαίσιο και θα κάνουν πλήρη και αποτελεσματική χρήση των τεχνικών της μηχανικής μετάφρασης. Παρά την πρόοδο στην αναγνώριση των συναισθημάτων σε μεμονωμένες γλώσσες υψηλής συχνότητας και χρήσης, όπως τα Αγγλικά, λίγες εφαρμογές και μελέτες έχουν πραγματοποιηθεί σε λιγότερο χρησιμοποιούμενες και πιο δύσκολες γλώσσες, όπως τα Ελληνικά, και μάλιστα ακόμα λιγότερες για το πώς να μεταφραστεί μηχανικά ένα κείμενο, από μια μικρότερης χρήσης γλώσσα (Ελληνική) σε μια ευρύτερα χρησιμοποιούμενη γλώσσα (Αγγλική). Εσφαλμένη ή με σφάλμα μετάφραση μπορεί να οδηγήσει σε παραποίηση της κατηγοριοποίησης αυτού του κειμένου και της ανάλυσης του συναισθήματος μέσα από αυτό. Πολλές εταιρείες κολοσσοί π.χ. Το TripAdvisor, το Facebook, η Google, το NetFlix κλπ. εστιάζουν τα προϊόντα και τις υπηρεσίες τους προς αυτήν την κατεύθυνση. Τα τελευταία χρόνια, οι ερευνητικές ομάδες των εταιρειών αυτών προσπαθούν να εφαρμόσουν και να παρέχουν σύγχρονα μηχανικά συστήματα μετάφρασης. Αλλά το αποτέλεσμα της μετάφρασης είναι πάντα σωστό; Για παράδειγμα μια κριτική σε μια ταινία και το συναίσθημα που προέρχεται από τη μετάφραση πάνω από το αρχικό κείμενο; Μπορεί - και σε ποιο βαθμό - η ανάλυση του συναισθήματος να παραποιηθεί εάν προχωρήσουμε στη μηχανική μετάφραση ενός κειμένου;
Σκοπός αυτής της εργασίας είναι να διερευνήσει τις επιπτώσεις της Μηχανικής Μετάφρασης με χρήση Νευρωνικών δικτύων στην Ανάλυση Συναισθήματος εφαρμόζοντας τεχνικές βαθιάς μάθησης όπως τα Deep Neural Networks και τα εργαλεία ανάλυσης πολύγλωσσης ανίχνευσης. Οι πρόσφατες εξελίξεις στον τομέα της Μηχανικής Μετάφρασης αυξάνουν το ενδιαφέρον της χρήσης της στην Ανάλυση Συναισθήματος. Στην παρούσα διπλωματική εργασία θα εξεταστεί μια συγκριτική ανάλυση των διαφορετικών προσεγγίσεων και των open source υπηρεσιών μετάφρασης με χρήση νευρωνικών δικτύων για την πολυγλωσσική ανάλυση συναισθημάτων.