Ανάλυση βιοπληροφορικών δεδομένων με τεχνικές μηχανικής μάθησης
Bioinformatic data analysis with machine learning techniques
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Ontology ; Clustering ; Classification ; Genes ; Boosting ; Bagging ; Algorithms ; Single cell ; Acute myeloid leukemia ; Machine learning ; Gene ontology ; Biomedical ontologies ; Semantic similarity ; Graph analysis ; Data mining ; Pathway analysisΠερίληψη
Οι τεχνολογίες που έχουν εφευρεθεί για την ανάλυση ενός κυττάρου καθιέρωσαν ένα νέο πλαίσιο για τη διερεύνηση των προφίλ γονιδιακής έκφρασης στο επίπεδο των μεμονωμένων κυττάρων (single cell). Οι επιστήμονες είναι σε θέση να διερευνήσουν τη βιολογική μεταβλητότητα του ίδιου του ιστού, παράγοντας απομονωμένα μεταγραφικά δεδομένα (transcriptomic) για κάθε μεμονωμένο κύτταρο. Ως αποτέλεσμα, κάθε μεταγραφικό πείραμα (transcriptomic experiment) θα μπορούσε να εξάγει ένα μοναδικό προφίλ έκφρασης για κάθε κύτταρο, θέτοντας νέες προκλήσεις στην ανάλυση μετάφρασης όλων αυτών των προφίλ. Στην συγκεκριμένη εργασία η ανάλυση μονοπατιού (Pathway analysis) προσαρμόζεται, όχι μόνο για να αναλύσουν ταυτόχρονα πολλά από τα προφίλ γονιδιακής έκφρασης, αλλά και για την σύγκριση, ανιχνεύοντας λειτουργικές διαφορές και κοινά στοιχεία μεταξύ των παρομοίων κυττάρων, χωρίζοντάς τα σε λειτουργικές υπο-συστάδες. Σε αυτή τη μελέτη χρησιμοποιήσαμε τα αποτελέσματα ενός πειράματος κυττάρων στο αιμοποιητικό σύστημα, προκειμένου να προσδιορίσουμε ένα νέο πλαίσιο για τη λειτουργική σύγκριση των μεμονωμένων κυττάρων, βασιζόμενοι στην ανάλυση μονοπατιού με σχολιασμό της από την gene ontology όπου περιγράφεται παρακάτω. Χιλιάδες προφίλ έκφρασης μεμονωμένων κυττάρων συγκεντρωμένα στις 6 από τις 15 συνολικά διαφορετικές αιματοποιητικές κυτταρικές κατηγορίες, μεταφράστηκαν σε δίκτυα βιολογικών μηχανισμών πάνω στην γονιδιακή οντολογία (GO), μέσω της πλατφόρμας BioInfoMiner. Τέλος, προτείνεται ένα νέο πλαίσιο για την εκμετάλλευση αυτών των αποτελεσμάτων και την κατασκευή κατάλληλων χαρακτηριστικών (features) με σκοπό την εκμάθηση αλγόριθμων μηχανικής μάθησης σε διαφορετικούς καρκινικούς και μη καρκινικούς αιμοποιητικούς κυτταρικούς τύπους και τον διαχωρισμό των αντίστοιχων μεμονωμένων κυττάρων ανάλογα με το λειτουργικό τους προφίλ. Σκοπός είναι να δημιουργηθεί ένα μοντέλο εκμάθησης βασιζόμενο στην προβλεπτική του ικανότατα να διαχωρίσει εάν ένα κύτταρο είναι καρκινικό η όχι.