Αξιοποίηση νευρωνικών δικτύων γράφων για την πρόβλεψη του αλγορίθμου συσταδοποίησης με την καλύτερη επίδοση

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Μηχανική Μάθηση ; Βαθιά Μάθηση ; Γράφοι ; GNN ; AutoML ; Κατηγοριοποίηση ; ΣυσταδοποίησηΠερίληψη
Στον σημερινό ταχύτατα εξελισσόμενο κόσμο που ζούμε, η τεχνητή νοημοσύνη ενσωματώνεται καθημερινά όλο και περισσότερο στη ζωή μας, φέρνοντας επανάσταση στον τρόπο με τον οποίο αλληλοεπιδρούμε με την τεχνολογία. Ωστόσο η ανάπτυξη μοντέλων πρόβλεψης απαιτεί τεχνογνωσία και εξειδικευμένες γνώσεις, κάτι που την καθιστά απρόσιτη για την πλειονότητα των ανθρώπων. Αυτό το πρόβλημα προσπαθεί να επιλύσει η αυτοματοποιημένη μηχανική μάθηση, μειώνοντας σημαντικά την ανθρώπινη παρέμβαση, έχοντας ως αποτέλεσμα να γίνεται πιο προσιτή η χρήση μοντέλων πρόβλεψης από μεγαλύτερη μερίδα του κόσμου. Η παρούσα διπλωματική εργασία ασχολείται με τη δημιουργία ενός μοντέλου αυτοματοποιημένης μηχανικής μάθησης, το οποίο δέχεται σαν είσοδο ένα σύνολο δεδομένων και προσπαθεί να προβλέψει τον αλγόριθμο συσταδοποίησης με την καλύτερη απόδοση, χρησιμοποιώντας αρχιτεκτονικές νευρωνικών δικτύων για γράφους. Για τη υλοποίηση του παραπάνω μοντέλου, δημιουργήθηκε αρχικά η βιβλιοθήκη Dataset2Graph στη γλώσσα προγραμματισμού Python, η οποία παρέχει τη δυνατότητα μετατροπής ενός συνόλου δεδομένων σε γράφο, καθώς και τη χρήση αλγορίθμων για την διαχείριση και την απλοποίηση του παραγόμενου γράφου. Στη διάθεση μας είχαμε 50 σύνολα δεδομένων, τα οποία μετατράπηκαν σε γράφο. Χρησιμοποιώντας διαφορετικές τεχνικές απλοποίησης πάνω στους 50 γράφους, παράχθηκαν πάνω από 150 σύνολα δεδομένων γράφων. Στο τέλος, όλες αρχιτεκτονικές νευρωνικών δικτύων γράφων που αναπτύχθηκαν για το στάδιο της πρόβλεψης, αξιολογούνται πάνω στα διάφορα σύνολα γράφων και το βέλτιστο μοντέλο συγκρίνεται με τον κύριο ανταγωνιστή MARCO-GE.