Επιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGA

Φαρδής, Στέφανος-Αντώνιος Π.

dc.contributor.advisor	Ψαράκης, Μιχαήλ
dc.contributor.author	Φαρδής, Στέφανος-Αντώνιος Π.
dc.date.accessioned	2015-08-08T20:45:47Z
dc.date.available	2015-08-08T20:45:47Z
dc.date.issued	2014
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/7007
dc.description.abstract	Η παρούσα εργασία αφορά την υλοποίηση ενός αλγόριθμου διαχωρισμού ομιλίας από μουσική. Με τον όρο αυτό εννοείται η αναγνώριση και κατηγοριοποίηση τμημάτων - ή αλλιώς πλαισίων - ήχου ως ομιλία ή μουσική. Ο υλοποιηθείς αλγόριθμος βασίζεται στην εξαγωγή από την ηχητική πληροφορία του χαρακτηριστικού της χρωματικής εντροπίας. Κατόπιν υπολογίζεται η μέση τιμή και η τυπική απόκλιση. Τα πλαίσια κατηγοριοποιούνται ανάλογα με το αν η τυπική απόκλιση έχει τιμή μεγαλύτερη από ένα προκαθορισμένο κατώφλι. Η μέθοδος υλοποιήθηκε στην αναπτυξιακή πλακέτα Xilinx ML403 η οποία διαθέτει FPGA της οικογένειας Virtex 4. Το σύστημα βασίζεται στον επεξεργαστή PowerPC ο οποίος υπάρχει εντός του FPGA. Τμήματα του αλγορίθμου, και συγκεκριμένα η συλλογή των δειγμάτων ήχου και ο υπολογισμός του φάσματος συχνοτήτων κάθε πλαισίου υλοποιήθηκαν απευθείας στο υλικό για λόγους απόδοσης.	el
dc.format.extent	68	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Επεξεργασία σημάτων	el
dc.subject	Field programmable gate arrays -- Design and construction	el
dc.subject	Signal processing	el
dc.subject	Signal processing -- Digital techniques	el
dc.title	Επιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGA	el
dc.title.alternative	FPGA-based acceleration of a speech / music discrimination algorithm	en
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής	el
dc.identifier.call	621.395 ΦΑΡ	el
dc.description.abstractEN	This thesis objective is the implementation of a speech-music discrimination algorithm. This refers to the identification and classification of audio stream segments - or else frames - as speech or music. The implemented method is based on extracting from the audio recording, a feature called spectral entropy. As soon as spectral entropy has been extracted from an audio frame, mean value and standard deviation are calculated. Frames are classified depending on standard deviation's value, and specifically whether it is bigger than a predefined threshold. The method was implemented on Xilinx ML403 development board, which includes an FPGA of the Virtex 4 family. The developed system is based on the PowerPC processor that resides within the FPGA. Parts of the algorithm, and specifically audio frames sampling and frequency spectrum calculation are implemented directly in hardware for performance reasons.	el
dc.contributor.master	Προηγμένα Συστήματα Πληροφορικής	el

Αρχεία σε αυτό το τεκμήριο

Name:: Fardis_Stefanos.pdf
Μέγεθος:: 14.50Mb
Τύπος:: PDF
Description:: Μεταπτυχιακή εργασία

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Πληροφορικής
Department of Informatics

Εμφάνιση απλής εγγραφής

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές