dc.contributor.author | Παπά, Φραντζέσκα Δ. | |
dc.date.accessioned | 2007-07-13T07:44:20Z | |
dc.date.available | 2007-07-13T07:44:20Z | |
dc.date.issued | 2007-07-13T07:44:20Z | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/1659 | |
dc.description.abstract | Η έλικα του DNA αποτελεί ένα σηµαντικό κομµάτι μελέτης στο χώρο της Μοριακής Βιολογίας. Όλες οι λειτουργίες και τα κληρονοµικά γνωρίσµατα των οργανισµών αποκαλύπτονται µέσα από τη µελέτη των δοµικών λίθων του νουκλεϊνικού οξέος DNA. Για το λόγο αυτό έχουν αναπτυχθεί διάφορες Βάσεις Δεδοµένων, µία εκ των οποίων είναι η GenBank, οι οποίες διαχειρίζονται τον μεγάλο αριθµό ακολουθιακών δοµών που συλλέγουν καθηµερινά. Στη παρούσα εργασία γίνεται παρουσίαση των µαθηµατικών και των στατιστικών εργαλείων για την διαχείριση και την ανάλυση αυτών των δεδοµένων. Συγκεκριµένα, γίνεται σύγκριση δύο αλυσίδων DNA αντιστοιχίζοντας την ακολουθιακή τους δοµή προς εύρεση κοινών χαρακτηριστικών ή προέλευσης των οργανισµών. Η σύγκριση αυτή επιτυγχάνεται µε τη χρήση αλγορίθµων Δυναµικού Προγραµµατισµού για την εύρεση των βέλτιστων μεταξύ τους αντιστοιχίσεων. Οι αντιστοιχίες μεταξύ των αλυσίδων επιτρέπουν την εµφάνιση αντικαταστάσεων, προσθηκών ή διαγραφών βάσεων, ακόµα και αναστροφών που αφορούν την αντιστοίχιση µε το αντίστροφο συµπλήρωµα µιας ακολουθίας. Ακόµα περιγράφεται ένας σηµαντικός αλγόριθµος εύρεσης επαναλαµβανόµενων σχηµατισµών (tandem repeats) σε µία ακολουθία DNA που η συχνότητα εµφάνισής τους διαπιστώνει την παρουσία σηµαντικών γενετικών προβληµάτων. Με αφορµή τη σηµαντικότητα της εµφάνισης των επαναλαµβανόµενων σχηµατισµών γίνεται παρουσίαση ενός µοντέλου πιθανοτήτων. Πλέον, οι υπό µελέτη ακολουθίες DNA είναι ίσου µήκους και οδηγούν σε µια δίτιµη ακολουθία επιτυχιών και αποτυχιών για την οποία µελετάται η ακριβής κατανοµή του συνολικού αριθµού επιτυχιών στις ροές ενός τουλάχιστον επιθυµητού αριθµού επιτυχιών. Στην παρούσα εργασία περιγράφονται ορισµένα πρόσφατα δηµοσιευµένα αποτελέσµατα που αφορούν την ακριβή κατανοµή της προαναφερθείσας στατιστικής συνάρτησης. | |
dc.language.iso | el | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el | |
dc.subject | Διατριβές | |
dc.subject | Genetic algorithms | |
dc.subject | Sequence analysis | |
dc.title | Ακολουθιακή ανάλυση αλυσίδων DNA | |
dc.type | Master Thesis | |
europeana.isShownAt | https://dione.lib.unipi.gr/xmlui/handle/unipi/1659 | |
europeana.type | IMAGE | |
dc.identifier.call | 519.6'2 ΠΑΠ | |
dc.description.abstractEN | The helix of DNA has become an important area of study in the field of Molecular Biology. The performance and the heredity of several organisms may be revealed by the study of small molecules that the DNA consists of, the nucleotides. For this reason, lots of databases have been developed, such as GenBank, where all publicly available DNA sequences are collected on a daily basis. In the present study, mathematical and statistical models that have been developed for the DNA sequences analysis are presented. The comparison of two DNA molecules is usually carried out by aligning the single strands of the molecules one on top of the other. Dynamic programming algorithms are a useful framework where the sequence matching problems can be embedded in order to find the optimal alignments. In that case, substitutions, insertions or deletions, even inversions are allowed in the alignment process. An important algorithm is presented for finding tandem repeats which have been considered that offer a strong evidence for the occurrence of several genetic diseases. Given the prominent significance of tandem repeats in biological studies, an interesting statistic closely associated to them is described in some detail. In that case, the sequences under study are taken to have the same length, they are aligned one on top of the other and are converted into a sequence of successes/matches. In the new bistate sequence what we are looking at is the total number of successes in success runs of length k or longer. In the present thesis we present several recently published results on its exact distribution evaluation. | |