Show simple item record

dc.contributor.advisorΚυριαζής, Δημοσθένης
dc.contributor.authorΜαρίνος, Γεώργιος
dc.contributor.authorMarinos, George
dc.description.abstractΗ ανάλυση της επιβίωσης δεν έχει εφαρμογές μόνο για βιοϊατρικά προβλήματα για την εκτίμηση του χρόνου μέχρι την στιγμή του θανάτου και πρόσφατες μελέτες έχουν δείξει ότι είναι ένα ισχυρό εργαλείο για τη διαστρωμάτωση του κινδύνου γενικότερα. Η ανάλυση επιβίωσης είναι μια καθιερωμένη στατιστική τεχνική και τα τελευταία χρόνια υπήρξαν πολλές μελέτες που συνδύασαν την ανάλυση επιβίωσης με τεχνικές μηχανικής μάθησης και αλγόριθμους προκειμένου να επιτευχθούν καλύτερες επιδόσεις σε προβλέψεις. Επιπλέον, η χρήση διαφορετικών τύπων δεδομένων για το ίδιο υποκείμενο, αποδεικνύεται ότι βελτιώνει την απόδοση των μοντέλων μηχανικής μάθησης. Σε αυτήν τη μελέτη συνδυάζουμε κλινικά δεδομένα και δεδομένα έκφρασης γονιδίων για διαστρωμάτωση κινδύνου μιας ομάδας ασθενών με καρκίνο σύμφωνα με τους λανθάνοντες υποτύπους καρκίνου. Πρώτον, χρησιμοποιούμε κλινικά δεδομένα για την εξαγωγή χαρακτηριστικών που σχετίζονται με τον χρόνο επιβίωσης και με την παρουσία ή απουσία του συμβάντος θανάτου. Στη συνέχεια χρησιμοποιήστε αυτές τις δυνατότητες που επιλέχθηκαν για να προσδιορίσουμε τις λανθάνουσες υπο-ομάδες μεταξύ των ασθενών και έπειτα χρησιμοποιήσαμε τις ετικέτες για να προσδιορίσουμε ένα υποσύνολο σχετικών χαρακτηριστικών. Αυτή η επιλογή χαρακτηριστικών έκφρασης γονιδίων έγινε χρησιμοποιώντας τεχνικές επιλογής χαρακτηριστικών και μείωσης διαστάσεων. Τελικά εφαρμόσαμε ορισμένους ταξινομητές στο τελικό σύνολο δεδομένων και προσπαθούμε να προβλέψουμε σε ποια ομάδα ανήκει ένας μελλοντικός ασθενής. Εφαρμόζοντας αυτήν την προσέγγιση αναμένουμε ότι οι προσδιορισμένες υπο-ομάδες δεν είναι μόνο βιολογικά σημαντικές, αλλά και διαφέρουν ως προς την επιβίωση.el
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.titleAnalytics on clinical and gene expression data to provide risk stratification predictions for cancer subtypesel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENSurvival analysis is not only applicable to biomedical problems for time until death estimation and recent studies have shown that it is a powerful tool for risk stratification that can be used in various sectors. Survival analysis is a well-established statistical technique and last years there have been many studies that combined survival analysis with machine learning algorithms in order to capture non linear relationships among features and to obtain better performances. The usage of different data modalities has been proven to be effective for the enhancement of the performance of machine learning models. In this study even though our main purpose was not a classification task, we utilize two different data modalities (clinical and genes expression data) for risk stratification of a group of patients with cancer according to their latent cancer subtypes. Firstly, we utilize clinical data to extract features that are associated with survival time and with the presence or absence of the event of death. Next use these features selected to identify latent groups between patients and when this is done, we used the labels as ground truth to identify a subset of survival-associated genes. We tested three different features selection and dimensionality reduction techniques for genes expression data to examine if this will cause any differences in our results. We finally applied classifiers to the genes subset identified, and we tried to predict in which sub cancer group category would a future patient belong to. Implementing this approach, we expect that the identified subgroups are biologically meaningful or in other words they differ in terms of survival. The two contributions of the proposed approach were a) the discovery of a meaningful subset of genes that are associated with the survival of the patient and b) with the usage of this approach future patients will be able to be accurately categorized in a survival risk group even if the available data are not labeled from the very beginning.el
dc.contributor.masterΨηφιακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordClinical datael
dc.subject.keywordGenes expression datael
dc.subject.keywordCancer subtypes discoveryel
dc.subject.keywordCancer subtypes identificationel
dc.subject.keywordSurvival analysisel
dc.subject.keywordKaplan Meier curvesel
dc.subject.keywordSurvival clusteringel

Files in this item


This item appears in the following Collection(s)

Show simple item record

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»