Μεταφορά γνώσης με χρήση νευρωνικών δικτύων και συστήματα συστάσεων
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Συστήματα συστάσεων ; Συνελικτικά νευρωνικά δίκτυα ; Μεταφορά γνώσης ; Αναγνώριση εικόναςΠερίληψη
Τα συνελικτικά νευρωνικά δίκτυα (CNN) είναι η ραχοκοκαλιά της κατηγοριοποίησης
εικόνων, ένα φαινόμενο βαθιάς μάθησης που παίρνει μια εικόνα και της αποδίδει μια
κλάση και μια ετικέτα που την κάνει μοναδική. Η ταξινόμηση εικόνων με χρήση CNN
αποτελεί σημαντικό μέρος των πειραμάτων μηχανικής μάθησης.
Μαζί με τη χρήση των συνελικτικών νευρωνικών δικτύων και των επαγόμενων
δυνατοτήτων του, χρησιμοποιείται πλέον ευρέως για μια σειρά εφαρμογών - από την
προσθήκη ετικετών στο Facebook έως τις συστάσεις προϊόντων της Amazon και τις
εικόνες υγειονομικής περίθαλψης έως τα αυτόματα αυτοκίνητα. Ο λόγος που τα ΣΝΔ
είναι τόσο δημοφιλή είναι ότι απαιτούν πολύ λίγη προεπεξεργασία, που σημαίνει ότι
μπορούν να διαβάσουν 2D εικόνες εφαρμόζοντας φίλτρα που άλλοι συμβατικοί αλγόρι-
θμοι δεν μπορούν. Θα εμβαθύνουμε στη διαδικασία του πώς λειτουργεί η ταξινόμηση
εικόνων χρησιμοποιώντας ΣΝΔ.
Στην παρούσα διπλωματική εργασία, ερευνούμε τις εφαρμογές της μεταφοράς γνώσης
στο πεδίο των νευρωνικών δικτύων. Πιο συγκεκριμένα, προσπαθήσαμε να εφαρμό-
σουμε τεχνικές μεταφοράς γνώσης σε εργασίες κατηγοριοποίησης εικόνας και συστή-
ματα συστάσεων. Για την υλοποίηση, συγκρίναμε προεκπαιδευμένα μοντέλα (VGG19,
ResNet50, InceptionV3) με απλά συνελικτικά μοντέλα για να διαπιστώσουμε αν όντως
η μεταφορά γνώσης πραγματικά βελτιώνει αισθητά την απόδοση των μοντέλων και το
στόχο των εργασιών μας. Στο πεδίο της υπολογιστικής όρασης και πιο συγκεκριμένα
της αναγνώρισης εικόνας βρίσκουμε αρκετά τέτοια αποτελέσματα όπου μπορούμε να
καταλάβουμε ουσιαστικά τη βοήθεια που προσφέρει η μεταφορά γνώσης απο τα προεκ-
παιδευμένα μοντέλα. Η είσοδος στον αλγόριθμό μας θα είναι μια εικόνα οποιουδήποτε
αντικειμένου που ο πελάτης θέλει να αγοράσει. Οι δύο εργασίες που θέλουμε να
επιτύχουμε είναι:
• η κατηγοριοποίηση της φωτογραφίας ενός προϊόντος, σε σχέση με προϊόντα που
είναι πιθανότερο να μοιάζουν
• η σύσταση παρόμοιων προϊόντων με αυτό που έχουμε εισάγει
Ο στόχος μας είναι αφού εκτελέσουμε τα δύο διαφορετικά πειράματα, να συγκρίνουμε
τα προεκπαιδευμένα μοντέλα, δηλαδή αυτά τα μοντέλα που έχουν ήδη εκπαιδευτεί στο
σύνολο δεδομένων ImageNet, με αυτά που είναι μη προεκπαιδευμένα όσον αφορά την
ακρίβεια και την απώλεια και εν τέλει στο πόσες ”σωστές” προβλέψεις κάνουν και αν
επιτυγχάνεται ο τελικός στόχος κάθε εργασίας.