| dc.contributor.advisor | Maglogiannis, Ilias | |
| dc.contributor.advisor | Μαγκλογιάννης, Ηλίας | |
| dc.contributor.author | Skourogiannis, Konstantinos | |
| dc.contributor.author | Σκουρογιάννης, Κωνσταντίνος | |
| dc.date.accessioned | 2025-10-15T09:19:11Z | |
| dc.date.available | 2025-10-15T09:19:11Z | |
| dc.date.issued | 2025-09 | |
| dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/18234 | |
| dc.description.abstract | Η παρούσα εργασία εξετάζει το πρόβλημα της αναγνώρισης απομονωμένων συμβόλων στην Ελληνική Νοηματική Γλώσσα (ΕΝΓ) με χρήση βαθιάς μάθησης. Η ΕΝΓ, όπως και πολλές νοηματικές γλώσσες, στερείται μεγάλων επισημειωμένων συνόλων δεδομένων, γεγονός που καθιστά την αυτόματη αναγνώριση απαιτητική. Για την αντιμετώπιση αυτού του ζητήματος χρησιμοποιούμε το δημόσια διαθέσιμο σύνολο δεδομένων GSL RGB+D, το οποίο περιέχει επισημειωμένες βιντεοσκοπήσεις που καταγράφηκαν με κάμερα βάθους Intel RealSense. Υλοποιούμε και αξιολογούμε τρεις διακριτές νευρωνικές αρχιτεκτονικές: Συνελικτικό Νευρωνικό Δίκτυο (CNN), δίκτυο Long Short-Term Memory (LSTM) και Συνελικτικό Δίκτυο σε Γράφους (GCN). Κάθε μοντέλο έχει σχεδιαστεί ώστε να χειρίζεται διαφορετικά χαρακτηριστικά των δεδομένων της νοηματικής γλώσσας: οπτικά, χρονικά και χωρικά. Τα πειράματά μας, που πραγματοποιήθηκαν στο υποσύνολο των απομονωμένων gloss (ετικετών συμβόλων) του συνόλου δεδομένων, δείχνουν ότι το μοντέλο LSTM επιτυγχάνει τη μεγαλύτερη συνολική ακρίβεια, ενώ τα μοντέλα CNN και GCN επιδεικνύουν ενισχυμένη επίδοση σε συγκεκριμένες κατηγορίες. Τα ευρήματα υπογραμμίζουν τη σημασία της χρονικής και δομικής πληροφορίας στην αναγνώριση νοημάτων. Η εργασία συνεισφέρει μια συγκριτική μελέτη μοντέλων αναγνώρισης, προσαρμοσμένων στην Ελληνική Νοηματική Γλώσσα και αναδεικνύει το δυναμικό τους σε περιβάλλοντα περιορισμένων πόρων. | el |
| dc.format.extent | 73 | el |
| dc.language.iso | en | el |
| dc.publisher | Πανεπιστήμιο Πειραιώς | el |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.title | Pose-based deep learning approaches for recognizing isolated signs in Greek sign language | el |
| dc.type | Master Thesis | el |
| dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
| dc.description.abstractEN | This thesis explores the task of isolated sign recognition in Greek Sign Language (GSL) using deep learning. GSL, like many sign languages, lacks large-scale annotated datasets, making automatic recognition a challenging problem. To address this, we use the publicly available GSL RGB+D dataset, which contains annotated video recordings captured with an Intel RealSense depth camera. We implement and evaluate three distinct neural architectures: a Convolutional Neural Network (CNN), a Long Short-Term Memory (LSTM) network, and a Graph Convolutional Network (GCN). Each model is designed to handle different characteristics of sign language data, visual, temporal, and spatial. Our experiments, conducted on the isolated gloss subset of the dataset, show that the LSTM model achieves the highest overall accuracy, while the CNN and GCN models demonstrate strength in specific categories. These findings underline the importance of temporal and structural information in sign recognition. This work contributes a comparative study of recognition models tailored to Greek Sign Language and highlights their potential in low-resource language contexts. | el |
| dc.corporate.name | National Center of Scientific Research "Demokritos" | el |
| dc.contributor.master | Τεχνητή Νοημοσύνη - Artificial Intelligence | el |
| dc.subject.keyword | Greek Sign Language (GSL) | el |
| dc.subject.keyword | Sign language recognition | el |
| dc.subject.keyword | Isolated gloss recognition | el |
| dc.subject.keyword | Hand skeletal landmarks | el |
| dc.subject.keyword | Sequence classification | el |
| dc.subject.keyword | Deep learning | el |
| dc.subject.keyword | Long short-term memory | el |
| dc.subject.keyword | Graph convolutional networks | el |
| dc.date.defense | 2025-10-03 | |