Show simple item record

dc.contributor.advisorΜαγκλογιάννης, Ηλίας
dc.contributor.authorΦασιανού, Ζαΐρα
dc.date.accessioned2020-02-28T11:27:09Z
dc.date.available2020-02-28T11:27:09Z
dc.date.issued2020-02
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/12636
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/59
dc.description.abstractΟ κόσμος είναι γεμάτος από ήχους. Μετά την όραση, η ακοή είναι η σημαντικότερη αίσθηση, με την οποία αντιλαμβανόμαστε το περιβάλλον. Εκ πρώτης όψεως, όλοι οι ήχοι φαίνεται να είναι διαφορετικοί μεταξύ τους. Eν τούτοις έχουν κάποια όμοια χαρακτηριστικά, όπως το γεγονός ότι μεταφέρουν ενέργεια και κατά συνέπεια μεταδίδουν κάποια πληροφορία από μια περιοχή σ’ άλλη, ώστε να επικοινωνούμε με τους άλλους ανθρώπους. Η παρούσα διπλωματική εργασία πραγματεύεται τη μελέτη και την ανάλυση των ήχων σ’ ένα αστικό περιβάλλον. Συγκεκριμένα, ο σκοπός είναι η εφαρμογή και η αξιολόγηση μεθόδων μηχανικής μάθησης πάνω σ’ ένα σύνολο περιβαλλοντικών ήχων. Αρκετή έρευνα έχει ήδη διεξαχθεί στον τομέα της ανάλυσης ήχου. Ωστόσο οι περισσότεροι ερευνητές έχουν καταπιαστεί με την αναγνώριση ανθρώπινης ομιλίας είτε με την κατηγοριοποίηση διαφόρων ειδών μουσικής. Στην παρούσα μελέτη θα εξετάσουμε, πως κάποιοι από τους δημοφιλείς αλγορίθμους ταξινόμησης ανταποκρίνονται σε αστικά ηχητικά δεδομένα. Στο πρώτο στάδιο της διαδικασίας έγινε η συλλογή των δειγμάτων ήχου, με σκοπό τη δημιουργία μιας βιβλιοθήκης, η οποία θα συμπεριλάμβανε πιθανές δραστηριότητες για κάθε μία από τις οχτώ κλάσεις που μελετήθηκαν. Στη συνέχεια, τα ηχητικά δεδομένα καταχωρήθηκαν στην κατάλληλη κλάση, αφού χωρίστηκαν στις επιθυμητές χρονικές διάρκειες και κάθε ηχητικό αρχείο διαιρέθηκε περαιτέρω μετά την εφαρμογή των συναρτήσεων πλαισίου. Επίσης για κάθε ήχο εξάχθηκαν κάποια χαρακτηριστικά, προκειμένου να δημιουργηθούν διανύσματα χαρακτηριστικών συγκεκριμένης διάστασης με τις πληροφορίες, που ήταν απαραίτητες για την ταξινόμηση. Στο επόμενο στάδιο πραγματοποιήθηκε η εφαρμογή των αλγορίθμων μηχανικής μάθησης στα επεξεργασμένα, πλέον, ηχητικά δεδομένα. Το σύνολο χαρακτηριστικών χωρίστηκε σε σύνολο εκπαίδευσης και σε σύνολο δοκιμής, προκειμένου να αξιολογηθεί η απόδοση του κάθε αλγορίθμου. Επιπλέον, ο αλγόριθμος με την υψηλότερη ακρίβεια δοκιμάστηκε σ’ ένα άγνωστο σύνολο ηχητικών δεδομένων διαφορετικής μεταξύ τους χρονικής διάρκειας, για να διερευνηθεί η ικανότητα του να γενικεύει.el
dc.format.extent68el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.titleΑνάλυση ηχητικών εγγραφών αστικού περιβάλλοντος και αναγνώριση πλαισίουel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENAt this thesis we tried to apply and evaluate some classification techniques through machine learning algorithms aiming at the automatic recognition of an unknown set of urban sounds. So far, the majority of the researchers have investigate the recognition of the human speech or the categorization of different music types. In this study, we tried to examine how some of the most popular classification algorithms correspond to an urban audio library. The first step of the process was the creation of an audio library that would include different activities for each of the eight classes studied. Then followed the manipulation of the audio data, such as splitting into the desired lengths of time and further subdividing after applying the frame functions. After labeling every sound data, we convert the audio signal to small dimension vectors of audio features in order to be able to be classified. The next step was to apply the machine learning algorithms to the processed audio data. The audio attributes were divided into a training and a test set for the estimation of the audio recognition performance. Finally, the machine learning algorithm with the highest accuracy was applied on an unknown set of audio data of varying lengths of time. By this step we tried to investigate its generalization ability.el
dc.contributor.masterΨηφιακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordMachine learningel
dc.subject.keywordClassificationel
dc.subject.keywordAudio analysisel
dc.subject.keywordAudio classificationel
dc.subject.keywordUrban soundsel
dc.subject.keywordSound recognitionel
dc.date.defense2020-02-19


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record


Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»