Πρόβλεψη δράσης ανθρώπου από την κίνηση του χεριού για συνεργασία ανθρώπου-ρομπότ
Master Thesis
Συγγραφέας
Μπαζάκος, Γεώργιος
Ημερομηνία
2021-04Επιβλέπων
Δαγιόγλου, ΜαρίαΓιαννακόπουλος, Θεόδωρος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Αλληλεπίδραση ανθρώπου - ρομπότ ; Τεχνητή νοημοσύνη ; Αλγόριθμοι μηχανικής μάθησηςΠερίληψη
Στην σημερινή εποχή έχει παρατηρηθεί ραγδαία ανάπτυξη στον κλάδο της ρομποτικής και της τεχνητής νοημοσύνης και αυτό έχει ως αποτέλεσμα την αύξηση της χρήσης των ρομπότ σε διάφορους τομείς της καθημερινότητας του ανθρώπου. Για να επιτευχθεί η χρήση των ρομπότ σε καθημερινές εργασίες πρέπει αυτά να είναι σε θέση να αντιμετωπίσουν μη δομημένα, απρόβλεπτα και συνεχώς μεταβαλλόμενα περιβάλλοντα. Συνεπώς απαιτείται να ενεργούν αυτόνομα, να μαθαίνουν πως να αντιδρούν σε διάφορες μεταβολές του περιβάλλοντος, καθώς και τις επιπτώσεις που έχουν οι ενέργειες τους στο περιβάλλον.
Η παρούσα εργασία μελετά τη συνεργασία ανθρώπου - ρομπότ σε ένα κοινό εργασιακό περιβάλλον. Συγκεκριμένα, για την επίτευξη μιας καλύτερης και πιο φυσικής συνεργασίας βασική προϋπόθεση είναι να μπορούν τα ρομπότ να προβλέψουν τις ενέργειες των ανθρώπων. Σε αυτό βοηθάει η παρατήρηση ότι η αρχή της κίνησης του ανθρώπου περιέχει χρήσιμες πληροφορίες ικανές για την πρόβλεψη της τελικής δράσης αυτού. Για παράδειγμα, η πόζα της παλάμης διαφοροποιείται από την αρχή μιας κίνησης ανάλογα με το μέγεθος του αντικειμένου που πρόκειται να πιάσει κάποιος.
Στα πλαίσια της εργασίας έγινε συλλογή κατάλληλων δεδομένων και αναζητήθηκε κατάλληλη μέθοδος Τεχνητής Νοημοσύνης που θα επιτρέπει σε ένα ρομπότ να προβλέψει πως θα δράσει ο άνθρωπος στον κοινό εργασιακό χώρο μέσα από οπτική πληροφορία (κάμερα) των κινήσεων του χεριού και της παλάμης.
Αρχικά τα δεδομένα τα οποία συλλέχθηκαν αφορούσαν τις κινήσεις διάφορων ανθρώπων οι οποίοι είχαν σαν στόχο να πιάσουν και να μετακινήσουν τρία διαφορετικού μεγέθους αντικείμενα. Από αυτά τα δεδομένα κατασκευάστηκαν δυο σύνολα δεδομένων. Το πρώτο αφορούσε την τρισδιάστατη πληροφορία και το δεύτερο τη δισδιάστατη πληροφορία κάθε κίνησης. Για το δεύτερο σύνολο δεδομένων πέραν από τις τρεις κλάσεις μια για κάθε αντικείμενο δοκιμάστηκε και η προβλέψει ανάμεσα σε δυο κλάσεις για όλους τους πιθανούς συνδυασμούς των τριών κλάσεων. Μετά από την επεξεργασία των δεδομένων για καθαρισμό του θορύβου καθώς και για την οριοθέτηση του κομματιού της κινήσεως προς μελέτη ακολούθησε η εφαρμογή αλγορίθμων μηχανικής μάθησης στα επεξεργασμένα δεδομένα. Οι πέντε αλγόριθμοι μηχανικής μάθησης που εφαρμόστηκαν είναι οι: SVM, Decision Tree, Random Forest, Extra Tree και ο Gradient boosting. Η διαδικασία της εκτίμησης των αποτελεσμάτων έγινε μέσω της διαδικασίας του K-Fold Cross validation. Τα αποτελέσματα έδειξαν ότι ο καλύτερος αλγόριθμος με ποσοστό επιτυχίας 94% ήταν ο Gradient boosting για το δισδιάστατο σύνολο δεδομένων με δυο κλάσεις αυτές του μικρού και του μεγάλου αντικειμένου.