Εμφάνιση απλής εγγραφής

Επιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGA

dc.contributor.advisorΨαράκης, Μιχαήλ
dc.contributor.authorΦαρδής, Στέφανος-Αντώνιος Π.
dc.date.accessioned2015-08-08T20:45:47Z
dc.date.available2015-08-08T20:45:47Z
dc.date.issued2014
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/7007
dc.description.abstractΗ παρούσα εργασία αφορά την υλοποίηση ενός αλγόριθμου διαχωρισμού ομιλίας από μουσική. Με τον όρο αυτό εννοείται η αναγνώριση και κατηγοριοποίηση τμημάτων - ή αλλιώς πλαισίων - ήχου ως ομιλία ή μουσική. Ο υλοποιηθείς αλγόριθμος βασίζεται στην εξαγωγή από την ηχητική πληροφορία του χαρακτηριστικού της χρωματικής εντροπίας. Κατόπιν υπολογίζεται η μέση τιμή και η τυπική απόκλιση. Τα πλαίσια κατηγοριοποιούνται ανάλογα με το αν η τυπική απόκλιση έχει τιμή μεγαλύτερη από ένα προκαθορισμένο κατώφλι. Η μέθοδος υλοποιήθηκε στην αναπτυξιακή πλακέτα Xilinx ML403 η οποία διαθέτει FPGA της οικογένειας Virtex 4. Το σύστημα βασίζεται στον επεξεργαστή PowerPC ο οποίος υπάρχει εντός του FPGA. Τμήματα του αλγορίθμου, και συγκεκριμένα η συλλογή των δειγμάτων ήχου και ο υπολογισμός του φάσματος συχνοτήτων κάθε πλαισίου υλοποιήθηκαν απευθείας στο υλικό για λόγους απόδοσης.el
dc.format.extent68el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectΕπεξεργασία σημάτωνel
dc.subjectField programmable gate arrays -- Design and constructionel
dc.subjectSignal processingel
dc.subjectSignal processing -- Digital techniquesel
dc.titleΕπιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGAel
dc.title.alternativeFPGA-based acceleration of a speech / music discrimination algorithmen
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.identifier.call621.395 ΦΑΡel
dc.description.abstractENThis thesis objective is the implementation of a speech-music discrimination algorithm. This refers to the identification and classification of audio stream segments - or else frames - as speech or music. The implemented method is based on extracting from the audio recording, a feature called spectral entropy. As soon as spectral entropy has been extracted from an audio frame, mean value and standard deviation are calculated. Frames are classified depending on standard deviation's value, and specifically whether it is bigger than a predefined threshold. The method was implemented on Xilinx ML403 development board, which includes an FPGA of the Virtex 4 family. The developed system is based on the PowerPC processor that resides within the FPGA. Parts of the algorithm, and specifically audio frames sampling and frequency spectrum calculation are implemented directly in hardware for performance reasons.el
dc.contributor.masterΠροηγμένα Συστήματα Πληροφορικήςel


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»