Εμφάνιση απλής εγγραφής

dc.contributor.advisorΜαγκλογιάννης, Ηλίας
dc.contributor.authorΕυαγγελιδάκης, Λέανδρος
dc.date.accessioned2021-07-20T08:15:32Z
dc.date.available2021-07-20T08:15:32Z
dc.date.issued2021-07
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/13583
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1006
dc.description.abstractΗ Υπολογιστική Όραση και η Μηχανική Μάθηση είναι δύο μεγάλοι κλάδοι της Τεχνητής Νοημοσύνης που συνδυαστικά έχουν δώσει στα υπολογιστικά συστήματα την ικανότητα της τεχνητής όρασης και της αντίληψης. Πλέον, είναι εφικτή η αλληλεπίδραση ανθρώπου-υπολογιστή μέσω καμερών καθώς και η οπτική ανάλυση της ανθρώπινης συμπεριφοράς. Το αντικείμενο της παρούσας εργασίας είναι η υλοποίηση ενός συστήματος για την αυτόματη αναγνώριση στατικών χειρονομιών σε ακολουθίες βίντεο πραγματικού χρόνου, μέσω καμερών, χρησιμοποιώντας σύγχρονες τεχνικές και αλγορίθμους της κλασσικής Μηχανικής Μάθησης και της Βαθιάς Μάθησης. Αρχικά γίνεται μια εισαγωγή στην Υπολογιστική Όραση και στις εφαρμογές της και περιγράφουμε το πρόβλημα της αναγνώρισης χειρονομιών. Έπειτα αναφερόμαστε στο πεδίο της Μηχανικής Μάθησης και στα είδη των προβλημάτων που πραγματεύεται. Περιγράφουμε τον τρόπο εκπαίδευσης ενός μοντέλου και τρόπους αξιολόγησης της απόδοσής του εστιάζοντας στην επίλυση προβλημάτων Κατηγοριοποίησης. Στη συνέχεια, κάνουμε μια εισαγωγή στη Βαθιά Μάθηση και στα Τεχνητά Νευρωνικά Δίκτυα. Αναφέρουμε τις βασικές αρχιτεκτονικές δικτύων που χρησιμοποιούνται σήμερα και τη διαδικασία εκπαίδευσης ενός Νευρωνικού Δικτύου καθώς και τεχνικές βελτιστοποίησής του. Επίσης, γίνεται αναφορά στη χρήση Συνελικτικών Νευρωνικών Δικτύων για την επίλυση προβλημάτων Υπολογιστικής Όρασης και παρουσιάζουμε κάποιους γνωστούς αλγορίθμους. Τέλος, παρουσιάζεται η υλοποίηση ενός συστήματος αναγνώρισης στατικών χειρονομιών, χρησιμοποιώντας τη γλώσσα προγραμματισμού Python. Εφαρμόζουμε καινοτόμους αλγορίθμους με συνελικτικά νευρωνικά δίκτυα για την αναγνώριση σημείων του σκελετού του χεριού και στη συνέχεια εκπαιδεύουμε Μηχανές Διανυσμάτων Υποστήριξης και Νευρωνικά Δίκτυα Εμπρόσθιας Τροφοδότησης, για να κατηγοριοποιήσουμε τα σημεία αυτά ανάμεσα σε προκαθορισμένες στατικές χειρονομίες. Η υλοποίηση προορίζεται για εφαρμογές πραγματικού χρόνου, χρησιμοποιεί μόνο τον επεξεργαστή του υπολογιστή και λειτουργεί με απλές κάμερες RGB.el
dc.format.extent70el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nd/3.0/gr/*
dc.titleΑναγνώριση χειρονομιών σε βίντεο πραγματικού χρόνου με αλγορίθμους μηχανικής μάθησης και βαθιάς μάθησηςel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENComputer Vision and Machine Learning are two branches of Artificial Intelligence which in combination have granted computational systems the ability of artificial vision and perception. Nowadays, human-machine interaction and the analysis of human behavior can be achieved using cameras. The subject of the current thesis is the implementation of a system for automatic recognition of static hand gestures in real-time videos with cameras, using modern techniques and algorithms of Machine Learning and Deep Learning. To begin with, we make an introduction into Computer Vision and its applications and we describe the problem of hand gesture recognition. Next, we refer to the field of Machine Learning and the main categories of the problems it includes. We describe the methodology of training a model and ways to measure its performance, focusing on Classification problems. Also, we introduce Deep Learning and Artificial Neural Networks. We present the most common network architectures used nowadays and the procedure of training a Neural Network and methods for optimization. Also, we mention the use of Convolutional Neural Networks for solving Computer Vision problems and we present some of the most known algorithms used for this task. Finally, we present our implementation of the hand gesture recognition tool, using Python programming language. We apply innovative algorithms of Convolutional Neural Networks for the detection of several key points of the hand and we train a Support Vector Machine and a Feedforward Neural Network model for the classification of those points into several predetermined static gestures. The implementation is targeted for practical real-time applications, runs using the CPU of the computer and requires a common RGB camera.el
dc.contributor.masterΠληροφοριακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordΜηχανική μάθησηel
dc.subject.keywordΒαθιά μάθησηel
dc.subject.keywordΥπολογιστική όρασηel
dc.subject.keywordΑναγνώριση χειρονομιώνel
dc.date.defense2021-07-15


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»