Ακολουθιακή ανάλυση αλυσίδων DNA
Master Thesis
Συγγραφέας
Παπά, Φραντζέσκα Δ.
Ημερομηνία
2007-07-13Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Διατριβές ; Genetic algorithms ; Sequence analysisΠερίληψη
Η έλικα του DNA αποτελεί ένα σηµαντικό κομµάτι μελέτης στο χώρο της Μοριακής Βιολογίας. Όλες οι λειτουργίες και τα κληρονοµικά γνωρίσµατα των οργανισµών αποκαλύπτονται µέσα από τη µελέτη των δοµικών λίθων του νουκλεϊνικού οξέος DNA. Για το λόγο αυτό έχουν αναπτυχθεί διάφορες Βάσεις Δεδοµένων, µία εκ των οποίων είναι η GenBank, οι οποίες διαχειρίζονται τον μεγάλο αριθµό ακολουθιακών δοµών που συλλέγουν καθηµερινά. Στη παρούσα εργασία γίνεται παρουσίαση των µαθηµατικών και των στατιστικών εργαλείων για την διαχείριση και την ανάλυση αυτών των δεδοµένων. Συγκεκριµένα, γίνεται σύγκριση δύο αλυσίδων DNA αντιστοιχίζοντας την ακολουθιακή τους δοµή προς εύρεση κοινών χαρακτηριστικών ή προέλευσης των οργανισµών. Η σύγκριση αυτή επιτυγχάνεται µε τη χρήση αλγορίθµων Δυναµικού Προγραµµατισµού για την εύρεση των βέλτιστων μεταξύ τους αντιστοιχίσεων. Οι αντιστοιχίες μεταξύ των αλυσίδων επιτρέπουν την εµφάνιση αντικαταστάσεων, προσθηκών ή διαγραφών βάσεων, ακόµα και αναστροφών που αφορούν την αντιστοίχιση µε το αντίστροφο συµπλήρωµα µιας ακολουθίας. Ακόµα περιγράφεται ένας σηµαντικός αλγόριθµος εύρεσης επαναλαµβανόµενων σχηµατισµών (tandem repeats) σε µία ακολουθία DNA που η συχνότητα εµφάνισής τους διαπιστώνει την παρουσία σηµαντικών γενετικών προβληµάτων. Με αφορµή τη σηµαντικότητα της εµφάνισης των επαναλαµβανόµενων σχηµατισµών γίνεται παρουσίαση ενός µοντέλου πιθανοτήτων. Πλέον, οι υπό µελέτη ακολουθίες DNA είναι ίσου µήκους και οδηγούν σε µια δίτιµη ακολουθία επιτυχιών και αποτυχιών για την οποία µελετάται η ακριβής κατανοµή του συνολικού αριθµού επιτυχιών στις ροές ενός τουλάχιστον επιθυµητού αριθµού επιτυχιών. Στην παρούσα εργασία περιγράφονται ορισµένα πρόσφατα δηµοσιευµένα αποτελέσµατα που αφορούν την ακριβή κατανοµή της προαναφερθείσας στατιστικής συνάρτησης.