Εμφάνιση απλής εγγραφής

Meta-learning for few-shot audio classification problems

dc.contributor.advisorPikrakis, Angelos
dc.contributor.advisorΠικράκης, Άγγελος
dc.contributor.authorMarmaras, Georgios
dc.contributor.authorΜαρμαράς, Γεώργιος
dc.date.accessioned2025-10-22T10:28:43Z
dc.date.available2025-10-22T10:28:43Z
dc.date.issued2025-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18248
dc.format.extent50el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleMeta-learning for few-shot audio classification problemsel
dc.title.alternativeΤεχνικές μετα-μάθησης σε προβλήματα ταξινόμησης ήχου λίγων παραδειγμάτωνel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENAs the demand for intelligent systems capable of fast generalization from minimal training data continues to grow, few-shot learning and meta-learning have emerged as key paradigms for data-efficient model adaptation. This work introduces a modular and extensible meta-learning framework for few-shot audio and image classification, designed to support reproducible experimentation and systematic evaluation across diverse datasets and neural architectures. It provides components for data handling, episodic task construction, neural network integration, adaptation routines, evaluation metrics management, checkpointing and visualization, thereby enabling flexible experimentation and rapid prototyping of meta-learning algorithms. The proposed framework is applied to environmental sound classification, where, gradient-based meta-learning methods, MAML and ProtoMAML, were evaluated on ESC-50, UrbanSound8K and FSC22 datasets under multiple N-way K-shot scenarios, with ProtoMAML consistently outperforming MAML by combining prototype-based initialization with gradient-based inner-loop adaptation. Meta-training significantly improved cross-dataset generalization, demonstrating the framework’s ability to facilitate rapid adaptation to unseen acoustic environments. Comparisons with a frozen pretrained Audio Spectrogram Transformer backbone paired with a Prototypical Network classifier showed that while pretrained embeddings provide strong baselines, explicit meta-learning remains essential for robust few-shot classification performance, particularly in extreme low-shot or high-way configurations.el
dc.subject.keywordFew-shot learningel
dc.subject.keywordMeta-learningel
dc.subject.keywordAudio classificationel
dc.subject.keywordEnvironmental sound classificationel
dc.subject.keywordModel agnostic meta-learningel
dc.subject.keywordAudio spectrogram transformerel
dc.subject.keywordPrototypical networksel
dc.subject.keywordCross-domain generalizationel
dc.subject.keywordEpisodic learningel
dc.subject.keywordModular frameworkel
dc.date.defense2025-09-30


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»