R-GCN for drug repurposing in heterogeneous biomedical knowledge graph with contraindication-informed negative sampling

Master Thesis
Συγγραφέας
Kalogianni, Maria
Καλογιάννη, Μαρία
Ημερομηνία
2025-09Επιβλέπων
Filippakis, MichaelΦιλιππάκης, Μιχαήλ
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
GNN ; R-GCN ; Heterogeneous knowledge graph ; Drug repurposingΠερίληψη
Η επαναχρησιμοποίηση/αναπροσανατολισμός φαρμάκων αποτελεί μια οικονομικά αποδοτική στρατηγική για την ανάπτυξη θεραπειών, με υπολογιστικές μεθόδους που εφαρμόζονται όλο και περισσότερο για την ανακάλυψη νέων συσχετίσεων μεταξύ φαρμάκων και ασθενειών. Απλές προσεγγίσεις βασίζονται συχνά σε τυχαία αρνητική δειγματοληψία, παραβλέποντας κλινικά σημαντικούς περιορισμούς. Η παρούσα εργασία διερευνά μια υβριδική στρατηγική δειγματοληψίας που βασίζεται σε αντενδείξεις και ενσωματώνει 30.675 ανεπιθύμητες σχέσεις φαρμάκων-ασθενειών από το PrimeKG με τυχαία αρνητικά αποτελέσματα, επιτρέποντας την κλινικά τεκμηριωμένη αξιολόγηση της πρόβλεψης βιοϊατρικών συνδέσεων.
Αξιολογούμε συγκριτικάαυτό το πλαίσιο χρησιμοποιώντας Node2Vec embeddings με ταξινομητές μηχανικής μάθησης και αρχιτεκτονικές R-GCN υπό διαφορετικούς αρνητικούς λόγους δειγματοληψίας (1:3, 1:10). Το R-GCN μας επιτυγχάνει βαθμολογίες AUPRC 0,91-0,92, με ανταγωνιστική απόδοση σε σχέση με τις πιο σύγχρονες μεθόδους, όπως TxGNN και HGTDR. Η επικύρωση των νέων προβλέψεων με βάση τη βιβλιογραφία δείχνει ισχυρή συμφωνία με τα βιοϊατρικά στοιχεία, υπογραμμίζοντας το μεταφραστικό δυναμικό της προσέγγισης.
Ενσωματώνοντας τους κλινικούς περιορισμούς ασφάλειας απευθείας στη διαδικασία μοντελοποίησης, η εργασία αυτή παρέχει ένα πλαίσιο για την πρόβλεψη βιοϊατρικών συνδέσεων με γνώμονα την ασφάλεια. Τα ευρήματα υπογραμμίζουν τη σημασία των πρωτοκόλλων αξιολόγησης με βάση τον τομέα και επισημαίνουν μια πρακτική πορεία προς μια πιο αξιόπιστη επαναχρησιμοποίηση φαρμάκων με τη βοήθεια της τεχνητής νοημοσύνης.


