Επιτάχυνση ενός αλγόριθμου διαχωρισμού ομιλίας/ μουσικής με χρήση FPGA
FPGA-based acceleration of a speech / music discrimination algorithm
Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Επεξεργασία σημάτων ; Field programmable gate arrays -- Design and construction ; Signal processing ; Signal processing -- Digital techniquesΠερίληψη
Η παρούσα εργασία αφορά την υλοποίηση ενός αλγόριθμου διαχωρισμού ομιλίας από μουσική. Με τον όρο αυτό εννοείται η αναγνώριση και κατηγοριοποίηση τμημάτων - ή αλλιώς πλαισίων - ήχου ως ομιλία ή μουσική. Ο υλοποιηθείς αλγόριθμος βασίζεται στην εξαγωγή από την ηχητική πληροφορία του χαρακτηριστικού της χρωματικής εντροπίας. Κατόπιν υπολογίζεται η μέση τιμή και η τυπική απόκλιση. Τα πλαίσια κατηγοριοποιούνται ανάλογα με το αν η τυπική απόκλιση έχει τιμή μεγαλύτερη από ένα προκαθορισμένο κατώφλι. Η μέθοδος υλοποιήθηκε στην αναπτυξιακή πλακέτα Xilinx ML403 η οποία διαθέτει FPGA της οικογένειας Virtex 4. Το σύστημα βασίζεται στον επεξεργαστή PowerPC ο οποίος υπάρχει εντός του FPGA. Τμήματα του αλγορίθμου, και συγκεκριμένα η συλλογή των δειγμάτων ήχου και ο υπολογισμός του φάσματος συχνοτήτων κάθε πλαισίου υλοποιήθηκαν απευθείας στο υλικό για λόγους απόδοσης.