Comparison of neurosymbolic programming frameworks in human activity recognition
Master Thesis
Συγγραφέας
Evangelinos, Iraklis
Ευαγγελινός, Ηρακλής
Ημερομηνία
2024-06Επιβλέπων
Katzouris, NikolaosΚατζούρης, Νικόλαος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Artificial intelligence ; Deep learning ; Neurosymbolic AI ; Complex event recognition ; Human activity recognitionΠερίληψη
Η αναγνώριση της ανθρώπινης δραστηριότητας (HAR) είναι ένα θεμελιώδες έργο στην τεχνητή νοημοσύνη, με εφαρμογές στην υγειονομική περίθαλψη, τα έξυπνα σπίτια και την επιτήρηση. Οι παραδοσιακές προσεγγίσεις Βαθιάς Μάθησης έχουν επιτύχει κορυφαίες επιδόσεις σε εργασίες HAR, αλλά συχνά στερούνται ερμηνευσιμότητας και δυσκολεύονται να συλλάβουν πολύπλοκες σημασιολογικές σχέσεις μεταξύ δραστηριοτήτων. Η νευρο-συμβολική τεχνητή νοημοσύνη (NeuroSymbolic AI), η οποία συνδυάζει τα πλεονεκτήματα της συμβολικής συλλογιστικής και της βαθιάς μάθησης, προσφέρει μια πολλά υποσχόμενη εναλλακτική λύση.
Η παρούσα διπλωματική εργασία διερευνά την εφαρμογή της νευρο-συμβολικής τεχνητής νοημοσύνης σε αναγνώριση ανθρώπινης δραστηριότητας χρησιμοποιώντας το DeepProbLog, ένα δημοφιλές νευρο-συμβολικό framework που ενσωματώνει πιθανολογική μοντελοποίηση βασισμένη στη λογική με βαθιά μάθηση. Επικεντρωνόμαστε στο DeepProbLog, καθώς χρησιμοποιείται εκτενέστερα στον τομέα και έχει δείξει δυνατότητα να εφαρμοστεί σε διάφορα πεδία. Πρωταρχικός μας στόχος είναι να διερευνήσουμε πόσο καλά αποδίδει το DeepProbLog στην αναγνώριση ανθρώπινων δραστηριοτήτων και να συγκρίνουμε τα αποτελέσματά του λαμβάνουμε με παραδοσιακές προσεγγίσεις βαθιάς μάθησης.
Αρχικά παρουσιάζουμε το DeepProbLog και συζητάμε τις βασικές αρχές του, συμπεριλαμβανομένης της ενσωμάτωσης της λογικής-πιθανοτικής μοντελοποίησης με τα νευρωνικά δίκτυα. Στη συνέχεια παρουσιάζουμε μια ολοκληρωμένη αξιολόγηση των επιδόσεων του DeepProbLog σε εργασίες HAR, επισημαίνοντας τα δυνατά σημεία και τους περιορισμούς του. Τα πειράματά μας καταδεικνύουν ότι το DeepProbLog υπερτερεί έναντι των παραδοσιακών μεθόδων βαθιάς μάθησης όσον αφορά την ακρίβεια και την ερμηνευσιμότητα, ιδίως όταν πρόκειται για συγκριτικά περίπλοκες εφαρμογές.