dc.contributor.advisor | Ψαράκης, Μιχαήλ | |
dc.contributor.author | Φαρδής, Στέφανος-Αντώνιος Π. | |
dc.date.accessioned | 2015-08-08T20:45:47Z | |
dc.date.available | 2015-08-08T20:45:47Z | |
dc.date.issued | 2014 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/7007 | |
dc.description.abstract | Η παρούσα εργασία αφορά την υλοποίηση ενός αλγόριθμου διαχωρισμού ομιλίας από μουσική. Με τον όρο αυτό εννοείται η αναγνώριση και κατηγοριοποίηση τμημάτων - ή αλλιώς πλαισίων - ήχου ως ομιλία ή μουσική. Ο υλοποιηθείς αλγόριθμος βασίζεται στην εξαγωγή από την ηχητική πληροφορία του χαρακτηριστικού της χρωματικής εντροπίας. Κατόπιν υπολογίζεται η μέση τιμή και η τυπική απόκλιση. Τα πλαίσια κατηγοριοποιούνται ανάλογα με το αν η τυπική απόκλιση έχει τιμή μεγαλύτερη από ένα προκαθορισμένο κατώφλι. Η μέθοδος υλοποιήθηκε στην αναπτυξιακή πλακέτα Xilinx ML403 η οποία διαθέτει FPGA της οικογένειας Virtex 4. Το σύστημα βασίζεται στον επεξεργαστή PowerPC ο οποίος υπάρχει εντός του FPGA. Τμήματα του αλγορίθμου, και συγκεκριμένα η συλλογή των δειγμάτων ήχου και ο υπολογισμός του φάσματος συχνοτήτων κάθε πλαισίου υλοποιήθηκαν απευθείας στο υλικό για λόγους απόδοσης. | el |
dc.format.extent | 68 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Επεξεργασία σημάτων | el |
dc.subject | Field programmable gate arrays -- Design and construction | el |
dc.subject | Signal processing | el |
dc.subject | Signal processing -- Digital techniques | el |
dc.title | Επιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGA | el |
dc.title.alternative | FPGA-based acceleration of a speech / music discrimination algorithm | en |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.identifier.call | 621.395 ΦΑΡ | el |
dc.description.abstractEN | This thesis objective is the implementation of a speech-music discrimination algorithm. This refers to the identification and classification of audio stream segments - or else frames - as speech or music. The implemented method is based on extracting from the audio recording, a feature called spectral entropy. As soon as spectral entropy has been extracted from an audio frame, mean value and standard deviation are calculated. Frames are classified depending on standard deviation's value, and specifically whether it is bigger than a predefined threshold. The method was implemented on Xilinx ML403 development board, which includes an FPGA of the Virtex 4 family. The developed system is based on the PowerPC processor that resides within the FPGA. Parts of the algorithm, and specifically audio frames sampling and frequency spectrum calculation are implemented directly in hardware for performance reasons. | el |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |