Βαθιά νευρωνικά δίκτυα για τη σύνθεση μουσικών σημάτων και εφαρμογή στην ανάλυση ηχογραφήσεων
Deep neural networks for synthesizing music signals with an application on the analysis of audio recordings

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Artificial Intelligence ; Music genre classifiers ; AI music generation ; Python ; Music information retrieval ; Music tagging ; Domain adaptation ; Generative musicΠερίληψη
Το 2022 έλαβε μέρος ένα γεγονός που σημάδεψε την καθημερινότητα. Αυτό ήταν η κυκλοφορία του ChatGPT, το οποίο έκανε προσιτή και γνωστή την τεχνητή νοημοσύνη (AI) στο ευρύ κοινό. Το AI, είναι ένας ταχύτατα αναπτυσσόμενος τομέας, που προσφέρει συνεχώς νέες δυνατότητες για τη διευκόλυνση της ζωής του ανθρώπου. Μία από τις χρήσεις του είναι η σύνθεση μουσικών σημάτων. Η παρούσα εργασία επικεντρώνεται στη χρήση Βαθέων Νευρωνικών Δικτύων (Deep Neural Networks) για τη σύνθεση μουσικών σημάτων και την ανάλυση ηχογραφήσεων. Ειδικότερα, μελετάται η εφαρμογή της MusicGen (Meta), ενός μοντέλου γεννητικής τεχνητής νοημοσύνης, για την παραγωγή τεχνητών μουσικών συνθέσεων. Τα παραγόμενα κομμάτια χρησιμοποιούνται ως δεδομένα για την εκπαίδευση ενός ταξινομητή, που αναλαμβάνει την ανάλυση και την κατηγοριοποίηση των ηχητικών σημάτων ανάλογα με το μουσικό είδος.
Στην συνέχεια, πραγματοποιείται σύγκριση με πραγματικά δεδομένα από ένα σύνολο δεδομένων , τα οποία ταξινομούνται με την χρήση του ίδιου ταξινομητή.
Η μεθοδολογία παρέχει ένα ισχυρό εργαλείο για την ανάλυση ηχογραφήσεων, ειδικά σε περιπτώσεις όπου τα δεδομένα πραγματικών ηχογραφήσεων είναι περιορισμένα. Η χρήση τεχνητών δεδομένων από το MusicGen διευρύνει το πεδίο εφαρμογών, όπως η βελτίωση μοντέλων ανίχνευσης, η κατηγοριοποίηση μεγάλων μουσικών αρχείων, και η ανάλυση ήχου με βάση το είδος σε ποικίλα περιβάλλοντα.
Η εργασία αυτή ερευνά αν η ενσωμάτωση γεννητικών μοντέλων για την παραγωγή αρχείων ήχου στην εκπαίδευση ταξινομητών μπορεί να αποτελέσει μια αποτελεσματική πηγή δεδομένων, ενισχύοντας τη βελτίωση της κατανόησης και της ανάλυσης ηχητικών δεδομένων σε ένα διαρκώς εξελισσόμενο πεδίο.