Εμφάνιση απλής εγγραφής

Βαθιά νευρωνικά δίκτυα για τη σύνθεση μουσικών σημάτων και εφαρμογή στην ανάλυση ηχογραφήσεων

dc.contributor.advisorΠικράκης, Άγγελος
dc.contributor.authorΜανδαλάκης, Χρήστος
dc.date.accessioned2025-09-08T05:31:05Z
dc.date.available2025-09-08T05:31:05Z
dc.date.issued2025-06
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18104
dc.description.abstractΤο 2022 έλαβε μέρος ένα γεγονός που σημάδεψε την καθημερινότητα. Αυτό ήταν η κυκλοφορία του ChatGPT, το οποίο έκανε προσιτή και γνωστή την τεχνητή νοημοσύνη (AI) στο ευρύ κοινό. Το AI, είναι ένας ταχύτατα αναπτυσσόμενος τομέας, που προσφέρει συνεχώς νέες δυνατότητες για τη διευκόλυνση της ζωής του ανθρώπου. Μία από τις χρήσεις του είναι η σύνθεση μουσικών σημάτων. Η παρούσα εργασία επικεντρώνεται στη χρήση Βαθέων Νευρωνικών Δικτύων (Deep Neural Networks) για τη σύνθεση μουσικών σημάτων και την ανάλυση ηχογραφήσεων. Ειδικότερα, μελετάται η εφαρμογή της MusicGen (Meta), ενός μοντέλου γεννητικής τεχνητής νοημοσύνης, για την παραγωγή τεχνητών μουσικών συνθέσεων. Τα παραγόμενα κομμάτια χρησιμοποιούνται ως δεδομένα για την εκπαίδευση ενός ταξινομητή, που αναλαμβάνει την ανάλυση και την κατηγοριοποίηση των ηχητικών σημάτων ανάλογα με το μουσικό είδος. Στην συνέχεια, πραγματοποιείται σύγκριση με πραγματικά δεδομένα από ένα σύνολο δεδομένων , τα οποία ταξινομούνται με την χρήση του ίδιου ταξινομητή. Η μεθοδολογία παρέχει ένα ισχυρό εργαλείο για την ανάλυση ηχογραφήσεων, ειδικά σε περιπτώσεις όπου τα δεδομένα πραγματικών ηχογραφήσεων είναι περιορισμένα. Η χρήση τεχνητών δεδομένων από το MusicGen διευρύνει το πεδίο εφαρμογών, όπως η βελτίωση μοντέλων ανίχνευσης, η κατηγοριοποίηση μεγάλων μουσικών αρχείων, και η ανάλυση ήχου με βάση το είδος σε ποικίλα περιβάλλοντα. Η εργασία αυτή ερευνά αν η ενσωμάτωση γεννητικών μοντέλων για την παραγωγή αρχείων ήχου στην εκπαίδευση ταξινομητών μπορεί να αποτελέσει μια αποτελεσματική πηγή δεδομένων, ενισχύοντας τη βελτίωση της κατανόησης και της ανάλυσης ηχητικών δεδομένων σε ένα διαρκώς εξελισσόμενο πεδίο.el
dc.format.extent45el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc/3.0/gr/*
dc.titleΒαθιά νευρωνικά δίκτυα για τη σύνθεση μουσικών σημάτων και εφαρμογή στην ανάλυση ηχογραφήσεωνel
dc.title.alternativeDeep neural networks for synthesizing music signals with an application on the analysis of audio recordingsel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENIn 2022, an event took place that marked our daily lives. This was the release of ChatGPT, which made artificial intelligence (AI) accessible and known to the public. AI is a fast-growing field, constantly offering new possibilities to make our lives easier. One of its uses is the synthesis of musical signals. This paper focuses on the use of Deep Neural Networks (DNN) for music signal synthesis and analysis of recordings. In particular, the application of MusicGen (Meta), a generative artificial intelligence model, for the generation of artificial music tracks is studied. The generated tracks are used as data for training a classifier, which undertakes the analysis and categorization of audio signals according to the musical genre. A comparison is then made with real data from a dataset, which are classified using the same classifier. The methodology provides a powerful tool for the analysis of sound recordings, especially in cases where real sound recording data is limited. The use of artificial data from MusicGen broadens the scope of applications such as improving detection models, categorizing large music files, and genre-based audio analysis in a variety of contexts. This thesis investigates whether incorporating generative models for generating audio files into classifier training can be an effective source of data, enhancing the understanding and analysis of audio data in an ever-evolving field.el
dc.subject.keywordArtificial Intelligenceel
dc.subject.keywordMusic genre classifiersel
dc.subject.keywordAI music generationel
dc.subject.keywordPythonel
dc.subject.keywordMusic information retrievalel
dc.subject.keywordMusic taggingel
dc.subject.keywordDomain adaptationel
dc.subject.keywordGenerative musicel
dc.date.defense2025-06-20


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»