Show simple item record

Depression recognition from speech

dc.contributor.advisorMaglogiannis, Ilias
dc.contributor.advisorΜαγκλογιάννης, Ηλίας
dc.contributor.authorGeorgiadou, Aikaterini
dc.contributor.authorΓεωργιάδου, Αικατερίνη
dc.description.abstractΗ κατάθλιψη, γνωστή επίσης ως μείζων καταθλιπτική διαταραχή, είναι μια σημαντική διαταραχή ψυχικής υγείας που επηρεάζει όλο και περισσότερες ζωές παγκοσμίως. Έχει αρνητικό αντίκτυπο στη συναισθηματική, σωματική και ψυχολογική κατάσταση ενός ατόμου. Για να διαγνωστεί ένα άτομο με κατάθλιψη, πρέπει να πραγματοποιηθεί μια σειρά εξετάσεων, ενώ μια σειρά συμπτωμάτων πρέπει να είναι παρούσα για τουλάχιστον 2 συνεχείς εβδομάδες. Τα πιο κοινά συμπτώματα της κατάθλιψης περιλαμβάνουν κακή διάθεση, αίσθηση απελπισίας, έλλειψη ενδιαφέροντος για τις καθημερινές δραστηριότητες, άγχος, ευερεθιστότητα, και μειωμένη όρεξη. Ωστόσο, η κατάθλιψη είναι δυνατόν να θεραπευτεί και η έγκαιρη ανίχνευση αυξάνει εκθετικά τη δυνατότητα ελέγχου της κατάστασης. Η πολυπλοκότητα της διαδικασίας αναγνώρισης της κατάθλιψης θέτει προκλήσεις για τους κλινικούς ιατρούς όσον αφορά τόσο την ακρίβεια της διάγνωσης όσο και την έγκαιρη θεραπεία, δεδομένου ότι η ασθένεια μπορεί να είναι αδιάγνωστη για πολλούς μήνες ή ακόμη και χρόνια, καθώς και το γεγονός ότι οι καθυστερήσεις στην αναγνώριση και τη θεραπεία μπορεί να είναι ζωτικής σημασίας για τη ζωή του ασθενούς. Για το σκοπό αυτό, η μηχανική μάθηση έχει εισαχθεί στον ιατρικό τομέα για να παρέχει εργαλεία ικανά να βελτιώσουν τον απαιτούμενο χρόνο καθώς και την ακρίβεια της διαδικασίας αναγνώρισης, ελαχιστοποιώντας παράλληλα τις ανθρώπινες παρεμβολές. Για το σκοπό αυτό, η παρούσα πτυχιακή εργασία μελετά τη χρήση μοντέλων μηχανικής μάθησης για την αναγνώριση της κατάθλιψης χρησιμοποιώντας ηχητικά δεδομένα από την γνωστή βάση δεδομένων DAIC-WOZ, η οποία περιέχει κλινικές συνεντεύξεις που έχουν σχεδιαστεί ειδικά για να υποστηρίξουν τη διάγνωση καταστάσεων ψυχολογικής δυσφορίας. Όσον αφορά τις ηχητικές πληροφορίες, χρησιμοποιήθηκαν οι δυνατότητες του συνεργατικού αποθετηρίου ανάλυσης φωνής (COVAREP) που παρέχονται από το dataset. Η ταξινόμηση πραγματοποιείται χρησιμοποιώντας τα παρακάτω μοντέλα Decision Tree, Random Forest, AdaBoost, Support Vector Machine and Multilayer Perceptron . Το μοντέλο AdaBoost πέτυχε τα καλύτερα αποτελέσματα και θεωρείται ένα καλό μοντέλο για την πρόβλεψη της κατάθλιψης.el
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.titleDepression recognition from speechel
dc.title.alternativeΑνάλυση ηχητικών εγγραφών ή βίντεο για την αναγνώριση της κατάθλιψηςel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENDepression, also known as major depressive disorder, is a major mental health disorder that is affecting ever more lives worldwide. It has a negative impact on the emotional, physical, and psychological state of a person. For a person to be diagnosed with depression, a series of tests must be performed while a series of symptoms must be present for at least 2 continuous weeks. Depression’s most common symptoms include feeling down or feeling worthless, lack of interest in daily activities, anxiety, irritability, and reduced appetite. However, depression is possible to cure, and early detection increases exponentially the possibility of controlling the condition. The complexity of the depression recognition process poses challenges for clinicians regarding both the accuracy of the diagnosis and the timely treatment, given that the disease can be undiagnosed for many months or years, and the fact that delays in the recognition and the treatment can be vital on the life of the patient. To that end, machine learning has been introduced to the medical field to provide tools capable of enhancing the time needed as well as the accuracy and precision of the recognition process, while minimizing human interference. For this purpose, this thesis studies the use of machine learning models for Depression Recognition using audio data from the widely known database DAIC-WOZ which contains clinical interviews designed specifically to support the diagnosis of psychological distress conditions. Regarding the audio information, the collaborative voice analysis repository (COVAREP) features provided by the dataset were used. Classification is performed using the following models Decision Tree, Random Forest, AdaBoost, Support Vector Machine, and Multilayer Perceptron. AdaBoost achieved the best results and is considered a good model for depression prediction.el
dc.contributor.masterΨηφιακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordDepression recognitionel
dc.subject.keywordDaic-Wox datasetel
dc.subject.keywordAudio classificationel
dc.subject.keywordMachine learningel
dc.subject.keywordAudio analysisel
dc.subject.keywordΑναγνώριση κατάθλιψηςel
dc.subject.keywordΚατηγοριοποίηση ηχητικών δεδομένωνel
dc.subject.keywordΜηχανική μάθησηel
dc.subject.keywordΙατρικά δεδομέναel

Files in this item


This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»