Αυτόματη δημιουργία περιγραφών εικόνων : ποιοτική ανάλυση των περιγραφών
Natural language description of images : a Qualitative analysis
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Image captioning ; Neural networks (Computer science) ; Deep learning ; PerceptronΠερίληψη
H αυτόματη δημιουργία προτάσεων που περιγράφουν το περιεχόμενο μιας εικόνας, αποτελεί ένα
σημαντικό πρόβλημα της τεχνητής νοημοσύνης. Συγκεκριμένα, βρίσκεται στην ένωση των επιστημονικών
πεδίων της Υπολογιστής Όρασης και της επεξεργασίας φυσικής γλώσσας με μια σειρά από σημαντικές
εφαρμογές όπως η αλληλεπίδραση ανθρώπου- ρομπότ.
Η επιτυχία αυτού του νέου επιστημονικού πεδίου έχει χαρακτηριστεί ως μια από τις σημαντικότερες
επιτυχίες της τεχνητής νοημοσύνης έως τώρα. Συγκεκριμένα, δημοσιευμένες εργασίες παρουσιάζουν
αποτελέσματα τα οποία είναι καλύτερα από αυτά που έχουν επιτύχει άνθρωποι. Επομένως, αξίζει κάνεις
να αναρωτηθεί αν πλέον τα ευφυή συστήματα έχουν ισάξιες γλωσσικές ικανότητες με αυτές των
ανθρώπων.
Πολλές μελέτες, στο πεδίο της γλωσσολογίας έχουν αποδείξει ότι οι άνθρωποι παράγουν διαφορετικές
περιγραφές για μια εικόνα. Στην πραγματικότητα, ο ίδιος άνθρωπος μπορεί να παράξει διαφορετικές
περιγραφές ανάλογα με την περίπτωση. Όπως είναι αντιληπτό, αυτή η ποικιλότητα στην παραγωγή
γλώσσας δημιουργεί μια σειρά από προβλήματα στην δημιουργία αλγορίθμων αλλά κυρίως στο πως
αυτοί οι αλγόριθμοι θα αξιολογηθούν. Αυτή η διπλωματική εργασία επιχειρεί να ερευνήσει ποιες αρχές
διέπουν τους αλγορίθμους αυτόματης δημιουργίας περιγραφών εικόνας. Συγκεκριμένα προσπαθεί να
απαντήσει την ερώτηση αν οι αλγόριθμοι μιμούνται η προβλέπουν την συμπεριφορά των ανθρώπων
δεδομένης μιας εικόνας. Για να απαντηθεί αυτή η ερώτηση υλοποιήθηκε ένα μοντέλο περιγραφής
εικόνας του οποίου τα αποτελέσματα εξετάστηκαν ποιοτικά και ποσοτικά ως προς το αν αναπαράγουν
τις περιγραφές πάνω στις οποίες εκπαιδεύτηκε το μοντέλο και αν καλύτερες αναπαραστάσεις εικόνας
βελτιώνουν το γλωσσικό αποτέλεσμα.