Deep learning methods for cover song identification
Master Thesis
Συγγραφέας
Μητσέας, Πέτρος
Mitseas, Petros
Ημερομηνία
2023-04Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Deep learning ; Music Information Retrieval ; CNN ; CSIΠερίληψη
Η αναγνώριση διασκευών τραγουδιών (Cover Song Identification, CSI) αφορά την ανίχνευση του κατά πόσον ένα τραγούδι αποτελεί επανεκτέλεση ενός αρχικού κομματιού. Η αυτόματη ανίχνευση διασκευών έχει πολλές εφαρμογές στη μουσική βιομηχανία καθώς και στη νομοθεσία περί πνευματικών δικαιωμάτων. Σε αυτή τη Διπλωματική Εργασία παρουσιάζουμε μια σχετική μεθοδολογία που βασίζεται στα Συνελικτικά Νευρωνικά Δίκτυα (CNN) και τη Μετρική Μάθηση. Το μοντέλο εκπαιδεύεται σε datasets διασκευών τραγουδιών χρησιμοποιώντας μια παραλλαγή του Triplet Loss, που ονομάζεται Angular Loss. Τα πειράματα παρουσιάζουν την απόδοση του προτεινόμενου μοντέλου σε αγγλικά και ελληνικά datasets, σε σύγκριση με άλλες προσεγγίσεις που βασίζονται στη βαθιά μηχανική μάθηση. Τα ευρήματά μας δείχνουν ότι η προτεινόμενη μέθοδος ενδείκνυται για τη συγκεκριμένη περίπτωση χρήσης, επιτυγχάνοντας υψηλά scores στα classification και ranking tasks. Αυτό, μαζί με το γεγονός ότι το μοντέλο μπορεί να εκτελεστεί με ελάχιστες hardware απαιτήσεις, καθιστούν τη μέθοδό μας ιδανική για εφαρμογές πραγματικού κόσμου. Συνεπώς σχεδιάσαμε και ένα λειτουργικό proof of concept, που επιδεικνύει μια end-to-end πλατφόρμα για αναγνώριση διασκευών με χρήση του μοντέλου μας. Τέλος, ως μέρος αυτής της Εργασίας, δημιουργήσαμε δύο νέα σύνολα δεδομένων ανοιχτού κώδικα για το CSI, τα οποία μπορούν να χρησιμοποιηθούν για εκπαίδευση ή αξιολόγηση.