Εμφάνιση απλής εγγραφής

dc.contributor.advisorΨαράκης, Μιχαήλ
dc.contributor.authorΚωστελίδης, Βασίλειος Η.
dc.date.accessioned2012-10-11T07:22:21Z
dc.date.available2012-10-11T07:22:21Z
dc.date.issued2012-10-11T07:22:21Z
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/5049
dc.description.abstractΔυο σημαντικά θέματα της ψηφιακής επεξεργασίας ανθρώπινης φωνής είναι η κατάτμηση σημάτων φωνής ώστε να ανιχνευθεί ομιλία και η εξαγωγή των θεμελιωδών συχνοτήτων της φωνής ενός ομιλητή. Ένα σύστημα κατάτμησης φωνής με σκοπό ανίχνευση ομιλίας (Voice Activity Detector – VAD) μπορεί να χρησιμοποιηθεί σε τηλεφωνικά κέντρα, σε συστήματα ασφαλείας, σε επαγγελματικά συστήματα τραγουδιστών, σε μεγάλο αριθμό ηλεκτρονικών παιχνιδιών και σε διάφορα άλλα προγράμματα. Η θεμελιώδης συχνότητα της ανθρώπινης φωνής (pitch) είναι από τα πιο σημαντικά χαρακτηριστικά της. Είναι ο ρυθμός με τον οποίο δονούνται οι φωνητικές χορδές κατά την ανθρώπινη ομιλία. Η εξαγωγή της θεμελιώδους συχνότητας (pitch extraction) μπορεί να χρησιμοποιηθεί για να αναγνωρίζονται ομιλητές σε συστήματα ασφαλείας, για την ανίχνευση της συναισθηματικής τους κατάστασης (emotion detection), για τη διόρθωση της ίδιας της συχνότητας (pitch correction) σε περιπτώσεις τραγουδιστών, για την προπόνηση επαγγελματιών τραγουδιστών, για ηλεκτρονικά παιχνίδια, για σύνθεση ήχου και για αρκετές άλλες εφαρμογές. Οι αλγόριθμοι εξαγωγής pitch είναι πολλοί. Για διαφορετικές εφαρμογές υπάρχουν αλγόριθμοι με πλεονεκτήματα και μειονεκτήματα πάνω στην ακρίβεια και τον χρόνο εκτέλεσης. Και τα δυο αυτά προβλήματα, η ακριβής κατάτμηση των σημάτων φωνής, σε ομιλία και θόρυβο και η εξαγωγή του pitch συμβάλλουν στην αναγνώριση λέξεων και στην αναγνώριση φωνής του ομιλητή. Για την κατάτμηση τμημάτων φωνής, η επιλογή ενός αλγορίθμου είναι εύκολη, είναι ο γνωστός αλγόριθμος του Rabiner. Για τη ανίχνευση pitch μελετήθηκαν μερικοί αλγόριθμοι μέσα από βιβλιογραφία και συγκρίθηκαν τα βασικά τους χαρακτηριστικά. Δυο από αυτούς επιλέχθηκαν για υλοποίηση. Για τους σκοπούς της πτυχιακής αυτής, ένα ενσωματωμένο σύστημα με έναν 8 – bit μικροελεγκτή προγραμματίστηκε με τους προαναφερθέντες αλγόριθμους για την ανίχνευση ομιλίας και εξαγωγή pitch.
dc.language.isoel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subjectΣυστήματα επεξεργασίας ομιλίας
dc.subjectΕπεξεργασία σημάτων
dc.subjectΘεωρία σημάτων (Τηλεπικοινωνία)
dc.subjectΑλγόριθμοι
dc.titleΚατάτμηση σημάτων φωνής και εξαγωγή θεμελιωδών συχνοτήτων σε ενσωματωμένη πλατφόρμα
dc.typeMaster Thesis
europeana.isShownAthttps://dione.lib.unipi.gr/xmlui/handle/unipi/5049
dc.identifier.call006.4'54 ΚΩΣ
dc.description.abstractENTwo important issues regarding human speech processing is the detection of the presence of a spoken word and the pitch extraction of a speaker’s voice. A system that detects if a word has been spoken (Voice Activity Detector – VAD) can be used in telephone centers, security systems, professional singing systems, in a large number of computer games and in many other applications. Pitch is one of the most distinguished characteristics of human voice. It is the rhythm by witch the vocal chords are vibrating during speech. A pitch extractor can be used for voice recognition in security systems, for the emotion detection [1] of a given speaker, the correction of the pitch in singers, training of singers, video games, speech synthesis etc. The existing pitch extraction algorithms are many. For different applications there are algorithms with advantages and disadvantages regarding the accuracy and the execution time. Both, an accurate voice activity detection and pitch detection in a sound system, are decisive elements for word recognition and speaker recognition. For the voice activity ase, the choice of the algorithm is easy, it is the well-known algorithm from Rabiner [2][3]. For the pitch extraction case, some algorithms were studied through bibliography and their basic characteristics were compared. Τwo of them were selected in order to be implemented. For the purposes of this thesis, an embedded system with an 8 – bit microcontroller was loaded with the fore mentioned algorithms that perform VAD and pitch detection.


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»