Presentation is loading. Please wait.

Presentation is loading. Please wait.

Fülogeneesi rekonstrueerimine

Similar presentations


Presentation on theme: "Fülogeneesi rekonstrueerimine"— Presentation transcript:

1 Fülogeneesi rekonstrueerimine
Eva-Liis Loogväli Barton et al 2007 “Evolution” Cold Spring Harbor Laboratory Press Ridley 2004 “Evolution” Blackwell Publishing company

2 phylē (kr.k.) – hõim genesis (kr.k.) – sünd
Fülogeneetika (phylogenetics) – bioloogia haru, mis uurib organismi(rühma)de päritolu ja põlvnemiskäiku. Fülogenees (phylogeny) – organismi(rühma)de päritolu; fülogeneetiline puu ja selle teke phylē (kr.k.) – hõim genesis (kr.k.) – sünd Enamasti käsitletakse fülogeneesi kui liikide põlvnemist. Molekulaarne analüüs võimaldab aga uurida kõiki etappe – liigisisest fülogeneesi (genealoogiat), liikide ja kõrgemate taksonite fülogeneetilisi suhteid. Willi Hennig ( ) Grundzüge einer Theorie der phylogenetischen Systematik, 1950.

3 Fülogeneetika (kladistika) on selline bioloogiline süstemaatika, mis klassifitseerib organisme nende ühise päritolu põhjal. Fülogeneetika erineb teistest taksonoomilistest süsteemidest (nt feneetikast) selle poolest, et rõhk on ühiselt esivanemalt päritud uutel tunnustel. Feneetika klassifitseerib üldise sarnasuse alusel, eesmärgiks pole fülogeneesi rekonstrueerimine, kuigi feneetilisi meetodeid saab selleks kasutada.

4 Tree of Life Web: http://tolweb.org
Elu puu Tree of Life Web: Elu puu. Kõik elusolendid Maal on omavahel seotud põlvnemissuhetega (meeldetuletus: meil on ühine geneetiline kood). Kõigi kolme eluslooduse domääni, arhead, eubakterid ja eukarüoodid, ühist evolutsioonipuud nimetatakse elu puuks. Elu puu rekonstruktsioon on evolutsioonilise bioloogia peaeesmärke. Viimast seisu vaata Tree of Life Web: from: Carl Zimmer. Evolution (William Heinemann, 2002)

5 Tegelik puu – reaalselt toimunud fülogeneesi kujutis
Tegelik puu – reaalselt toimunud fülogeneesi kujutis. Enamasti pole teada. ÜKS ja ainus Tuletatud e. konstrueeritud puu – fülogeneesi mudel, hüpotees. Konstrueeritakse olemasolevate andmete põhjal. Võib, kuid ei pruugi olla identne tegeliku puuga. Tavaliselt saab andmetest tuletada mitu puud. Tegelik puu: Tegelik puu kujutab põlvnemissuhete tegelikku mustrit ja on reaalselt toimunud fülogeneesi ehk evolutsioonilise ajaloo kujutis. Fülogenees on unikaalne protsess, on ainult üks õige evolutsiooni puu. Enamasti pole tegelik puu teada. (Tegelikke puid on saadud labori organisme kasvatades ja uurides või kasutades arvutisimulatsioone.) Tuletatud e. konstrueeritud puu: Olemasolevate andmete, näiteks DNA või valgu järjestuste põhjal on puu konstrueerimise meetodiga võimalik konstrueerida puu. Seda puud nimetatakse konstrueeritud e. tuletatud puuks. Tuletatud puu kujutab põlvnemissuhteid, kuid ta pole tegelik puu vaid tegeliku puu hinnang. Sõltuvalt andmetest, puu konstrueerimise meetodist jne. vastab tuletatud puu rohkem või vähem tegelikule puule. Konstrueeritud puu võib olla, kuid ei pruugi olla identne tegeliku puuga. Kui antud organismide jaoks on ainult üks tegelik evolutsioonipuu, siis tuletatud puid võib olla mitu, isegi väga palju. Tuletatud puu on hüpotees, mis püüab seletada olemasolevaid andmeid, antud juhul organismide või järjestuste vahelisi põlvnemissuhteid.

6 Puu Taxonomic Unit, OTU välimine haru
=sisemine haru =sõlm =tipp e Operational Taxonomic Unit, OTU =juur (MRCA) Puu välimine haru Puu on matemaatiline struktuur, mida kasutame fülogeneesi mudelina. Puu moodustavad sõlmed ja harud (servad). Tipp e. leht e. OTU (Operational Taxonomic Unit ehk operatsiooniline taksonoomiline ühik) kujutab järjestusi või organisme, mille kohta meil on andmeid (sealhulgas fossiilseid andmeid). Sisesõlm on sageli hüpoteetiline eellane, kelle kohta andmed puuduvad (näit. pole nukleotiidset järjestust). Juur on kõigi antud puud moodustavate OTUde eellane, s.o. hiljutisim ühine eellane (most recent common ancestor MRCA). Puu on matemaatiline struktuur, mida kasutame fülogeneesi mudelina.

7 Puud on pööratavad, oluline on ainult lahknemiste järjekord
küülikud hiired kängurud Puud on pööratavad, oluline on ainult lahknemiste järjekord evolutsiooniline puu ehk fülogeneetiline puu ehk kladogramm ehk dendrogramm evolutsiooniline puu ehk fülogeneetiline puu ehk kladogramm ehk dendrogramm (Vahel on need mõisted defineeritud spetsiifilisemalt ja pole sellisel juhul sünonüümsed)

8 Klaad on monofüleetiline klaster
Nt karu ja inimese viimane ühine eellane ning kõik tema järglased. parafüleetiline polüfüleetiline monofüleetiline Fülogeneetilised klastrid jagunevad: monofüleetiline parafüleetiline polüfüleetiline Klaad on monofüleetiline klaster või rühm = A ja B viimane ühine eellane ning kõik tema järglased. Polüfüleetilises klastris puudub ühine eellane. Parafüleetilises klastris on küll ühine eellane, kuid puudub mõni järglastest.

9 imetajad kahepaiksed linnud kalad roomajad amnioodid tetrapoodid
Soojaverelised loomad on polüfüleetiline klaster. Roomajad on parafüleetiline klaster. roomajad amnioodid tetrapoodid selgroogsed

10 morfoloogilised (purihammaste kuju)
Kladistilised meetodid käsitlevad iga tunnust eraldi ja eeldusel, et need on sõltumatud ja diskreetsed, näiteks: morfoloogilised (purihammaste kuju) füsioloogilised (imetamine, munemine) molekulaargeneetilised (nukleotiidid DNA järjestuses). tunnused jagunevad diskreetseteks ehk loendatavateks ja pidevateks.

11 Tunnuse seisund on homoloogne, kui see on päritud ühiselt eellaselt ja homoplaasne, kui on tekkinud sõltumatult. homoplaasia homoloogia Kui tunnuse seisundid (character states) on identsed oma päritolu tõttu, s.t. need on päritud ühiselt eellaselt, siis on tegemist homoloogiaga. Kui sarnasus tunnuse seisundite vahel ei ole seotud pärandumisega ühiselt eellaselt, vaid esineb kahes organismis sõltumatult, siis on tegemist homoplaasiaga. Fülogeneetilisi suhteid peegeldavad ainult ühiselt eellaselt päritud tunnused ehk homoloogsed tunnused.

12 kehakatted jalgade arv soojasus kolju jalgade asend
lind krokodill sisalik kilpkonn kehakatted jalgade arv soojasus kolju jalgade asend Homoloogilised tunnused on koju kuju ja jalgade asend. Need peegeldavad lindude ja krokodillide ühisel esivanemal tekkinud uusi tunnusseisundeid.

13 Krokodill ja sisalik jagavad ürgseid, plesiomorfseid tunnuseid
aeg fenotüüp sisalik krokodill lind Krokodill ja sisalik jagavad ürgseid, plesiomorfseid tunnuseid Lindude evolutsioon on olnud kiirem

14 vanemad ja uuemad tunnuse seisundid
apomorfne plesiomorfne autapomorfne sünapomorfne homoplaasne homoloogne Tunnuse seisundeid saab jagada vanemateks ja uuemateks. See on fülogeneesi rekonstrueerimisel hädavajalik. Vanemad homoloogiad on need tunnusseisundid, mis olid olemas juba ühisel eellasel. Vanemaid tunnuseid nimetatakse plesiomorfseteks. Uuem seisund on kujunenud plesiomorfsest tunnusest ja annab infot põlvnemissuhete kohta. Evolutsiooniliselt nooremat tunnust nimetatakse apomorfseks tunnuseks. vanem seisund (ancestral state) uuem seisund (derived state)

15 Homoloogiate äratundmiseks on mitu võimalust:
samasugune anatoomiline põhistruktuur sarnased ühendused kõrvalasetsevate struktuuridega sarnane embrüoloogiline päritolu ja areng molekulaarsete andmete puhul tuleb lähtuda enamuskonsensusest ja statistikast.

16 paralleelne / konvergentne sekundaarne kaotus ehk reversioon
Homoplaasia põhjused paralleelne / konvergentne sekundaarne kaotus ehk reversioon Homoplaasia võib olla tingitud ka tagasipöördumisest eellastunnuse juurde, e. omandatud tunnuse kadumisest.

17 Lindude, pterosauruste ja nahkhiirte tiivad on homoloogsed kui esijäsemed, aga homoplaassed kui lennuvahendid! Lind Nahkhiir Konvergentsi tavaliseks näiteks on linnu ja nahkhiire tiib. Linnu ja nahkhiire tiib on väliselt sarnased ja täidavad sama funktsiooni, kuid nad ei ole seda pärinud ühiselt esivanemalt. Lindude ja nahkhiirte esivanemad olid väga erinevad loomad. Tiibade ehitus on samuti erinev. Linnu tiib toetub teisele sõrmele ja on kaetud sulgedega. Nahkhiire tiib toetub sõrmele ning on kaetud nahaga. Kuigi ka lindude esivanemad olid roomajad, omandasid pterosaurused lennuvõime sõltumatult. Putukate tiivad arenesid hoopis lõpusekaartest. tunnuse seisundid eri OTUdel fülogeneetiline puu tunnuse seisundid ja nende muutuse suund

18 Tunnuste polaarsuse määramiseks tuleb puud juurida
juurimata puu juuritud puu juur Juur annab puule ajalise mõõtme Õige puu rekonstrueerimiseks peame teadma tunnuste polaarsust ehk arengusuunda (plesiomorfne vs apomorfne). Selleks peame leidma fülogeneetilise puu juure asukoha, mis ühtlasi annab kogu puule ajalise mõõtme. Juuritud ja juurimata puud Juuritud puul on üks sõlmedest märgitud juureks. Mida lähemal mingi sõlm juurele on, seda vanem ta on. Juuritud puu võimaldab määratleda eellase-järglase suhte sõlmede vahel – servaga ühendatud sõlmede paaris on juurele lähemal paiknev sõlm eellane ja kaugemal paiknev on järglane. Juurimata puul pole juurt. Siit tulenevalt juurimata puul ei ole tunnusseisunditel suunda – ei saa määratleda eellast ega järglast. Juurimata puu sõsarklaadid võivad juuritud puul osutuda mittesõsarklaadideks. See on juhul, kui juur paikneb serval (harul), mis viib üheni neist klaadidest.

19 Näiteks imetajasarnaste roomajate fossiilseid leiud
Puude juurimiseks ja tunnuste polaarsuse määramiseks sobivad fossiilsed andmed, juhul kui neid on rikkalikult. Näiteks imetajasarnaste roomajate fossiilseid leiud evolutsioon suht.täielik suht.ebatäielik fossiilide seeria fossiilide seeria Puude juurimiseks ja tunnuste polaarsuse määramiseks sobivad fossiilsed andmed, juhul kui neid on rikkalikult. Näiteks on teada terve seeria imetajasarnaste roomajate fossiilseid leide ja imetajate varajane evolutsioon ning tunnuste kujunemine on hästi kirjeldatud. Paraku enamasti on fossiilide seeriad (väga) ebatäielikud ja tekitavad tunnuste polaarsuse määramisel segadust. Enamasti on fossiilide seeriad (väga) ebatäielikud ja tekitavad tunnuste polaarsuse määramisel segadust.

20 Juurimine välisrühma abil
Välisrühma kasutamine eeldab eelteadmisi fülogeneesist - lindude ja imetajate MRCA on vanem kui imetajate MRCA. Välisrühma abil juurimine kasutab parsimoonsuse ehk säästuprintsiipi välisrühm Puude juurimiseks on mitmeid meetodeid. Üheks levinuimaks on välisrühma abil juurimine. Välisrühmaks sobib evolutsiooniliselt lähedane liik, mille kohta on teada, et see on lahknenud uuritavate liikide ühisest eellasest varem. Välisrühmaga võrdlemine kasutab parsimoonsuse ehk säästuprintsiipi, mille kohaselt kõige tõenäolisemalt on evolutsioon kulgenud kõige väiksema arvu muutustega ehk kõige lühemat teed pidi. See oletus on põhjendatud, sest uue tunnuse kujunemine on vähetõenäoline, selle levimine ja fikseerumine samuti vähetõenäoline ja sageli aeganõudev. Seega on loogiline eeldada, et evolutsioonilisi muutusi on toimunud pigem vähem kui rohkem. Välisrühma kasutamiseks peab meil olema eelteadmisi antud rühma fülogeneesi kohta. Vahel juhtub, et üks välisrühm viitab ühele juure asukohale ning teine teisele. Üldiselt tuleks eelistada fülogeneetiliselt lähemat välisrühma. Välisrühma abil juurimine kasutab parsimoonsuse ehk säästuprintsiipi (vt meetodite juurest, allpool) MRCA – most recent common ancestor Antud näitest selgub, et jänestel on lindudega rohkem ühiseid plesiomorfisme kui teistel imetajatel.

21 Molekulaarses fülogeneetikas kasutatakse DNA järjestusi (A, T, C, G) või aminohappelisi järjestusi
+ saab võrrelda väga erinevaid organisme informatsiooni suur hulk, mutatsioone on palju tunnused on omavahel võrreldavad, on võimalus kasutada matemaatilisi mudeleid - homoplaasiate hulk on suur molekulaarseid homoplaasiaid saab lahendada enamasti ainult konsensuse alusel Vahel saab ka molekulaarseid homoplaasiaid lahendada muutusele sisuliselt lähenedes – näiteks saab võrrelda aminohapete asenduste mõju ulatust valgumolekuli funktsioonile. Radikaalsemad muutused on eeldatavasti harvemad.

22 Fülogeneesi rekonstrueerimine eri tasemeil: Geeniperekonnad
geeniduplikatsioonid, -deletsioonid Haplotüübid (liigisisene) genealoogia mitterekombineerunud DNA lõikude põhjal Liigid ja kõrgemad taksonid paljude lookuste põhjal, fülogenoomika Evolutsioonipuu võib kujutada nii geenide (nt duplitseerumise järel omandab üks koopia uue funktsiooni), haplotüüpide (mitterekombineeruvate genoomi osade puhul, mitokondriaalne DNA, Y kromosoom), või ka liikide rühma (paljude lookuste põhjal) põlvnemissuhteid.

23 Molekulaarse fülogeneetika metoodika
( -> content -> online chapters): Barton et al 2007 “Evolution” Cold Spring Harbor Laboratory Press Contents -> online chapters -> Phylogenetic reconstruction See on vabalt kättesaadav peatükk molekulaarse fülogeneesi rekonstrueerimisest.

24 Vali geen: näiteks: ss-rRNA valk geenidevaheline
Oluline on, et järjestused varieeruksid piisavalt, et neid eristada, kuid mitte sel määral, et see segab joondamist. Joondamine (alignment) – järjestuste paigutamine selliselt, et kohakuti on homoloogilised nukleotiidid või aminohapped Vali geen. Põhimõtteliselt võib kasutada igasuguseid järjestusi. RNA geene, valgu geene, regulatoorseid järjestusi, geenidevahelisi alasid. Sageli kasutatakse ribosoomi väikese subühiku RNA geeni (ss-rRNA, E. colis 16S rRNA), sest neis on nii ülikonserveerunud järjestusi (identsed praktiliselt kõikidel elusolenditel) kui ka perekondi eristavaid piirkondi (Escherichia vs Salmonella). rRNA puudusteks on näiteks suur mutatsioonikiiruse varieeruvus liikide vahel võrreldes mõnede valgugeenidega. Samuti on rRNA termofiilides kõrge GC-sisaldusega, mis kipub fülogeneetilises analüüsis kokku klasterdama erinevaid termofiile, sõltumata nende tegelikust sugulusest. Valgugeenides leidub varieeruvust ka siis, kui aminohappeline järjestus on konserveerunud. Koodi kõdumise tõttu. Samas isegi suure DNA varieerumise korral on aminohappeline järjestus üldjuhul paremini konserveerunud kui DNA, mis omakorda hõlbustab joondamist. Oluline on, et järjestused varieeruksid piisavalt, et neid eristada, kuid mitte sel määral, et see segab joondamist. Geenide valikul tuleb eelistada neid, millel on vähem duplikaate ehk paralooge (vt allpool) ning neid, mis ei kipu horisontaalselt üle kanduma.

25 Samade järjestuste kaks võimalikku joondust. Indelitega ja ilma. Joondus on hüpotees. Samadest järjestustest saab teha erinevaid joondusi. Positsiooniliselt homoloogilised nukleotiidid võivad olla identsed konvergentsi tõttu (homoplaasia).

26 Ortoloogsed - ühisest eellasgeenist liigitekke käigus
Homoloogsed geenid: Ortoloogsed - ühisest eellasgeenist liigitekke käigus Paraloogsed - ühisest eellasgeenist duplitseerumise tulemusena Ksenoloogsed - horisontaalse ülekande tulemusena liigiteke Andmebaasid sisaldavad suurel hulgal järjestusi. Andmebaasidest otsimine toimub alati mitmese joondamise (multiple alignment) põhimõttel. Igale joondusele omistatakse skoor, mis iseloomustab selle headust. Edasi analüüsitakse neid järjestusi, mis saavad parima skoori. Nende seas võib olla juhuslikult sarnaseid järjestusi, ortoloogseid, paraloogseid ja ksenoloogseid geene. Ortoloogsed geenid on geenid, mis on tekkinud ühisest eellasgeenist liigitekke käigus. Liikidevaheliste suhete rekonstrueerimiseks peame võrdlema just ortolooge. Vahel nimetatakse homoloogseteks ainult neid geene, mis on ortoloogsed. Paraloogsed geenid on geenid, mis on tekkinud ühisest eellasgeenist selle geeni duplitseerumise tulemusena. Ksenoloogsed geenid on sellised homoloogsed geenid, mis on tekkinud geeni horisontaalse ülekande tulemusena.

27 Kui analüüsi satuvad tuvastamata paraloogid:
Liigipuid rekonstrueerib fülogenoomika – paljude geenide samaaegne analüüs liikide puu (1(2,3)) Liigipuu – puu, mis kujutab liikide põlvnemissuhteid. Liigipuu sisemised sõlmed kujutavad liigitekke juhtu, mille läbi eellasliigi populatsioon lõhenes kaheks rühmaks, mis omavahel enam ei ristunud. Geenide ja liikide lahknemine ei toimu alati samal ajal. Geenipuu kujutab geenide põlvnemissuhteid. Sisemised sõlmed geenipuul näitavad eellasgeeni lahknemist kaheks geeniks. Nende geenide DNA järjestused on muteerumise tulemusena erinevaks muutunud. Tihti geenipuu ja liigipuu ei ühti. Põhjusi on mitmeid: 1) geeni duplikatsioon (paraloogsed geenid võivad olla sarnasemad kui ortoloogsed) 2) Enamasti toimub geenide lahknenime varem kui liikide lahknemine - eellaspopulatsioonis esinevad erinevate mutatsioonidega sama geeni variandid, millest üks kandub ühte ja teine teine järglasliiki. 3) geenipuu topoloogia erineb liigipuu topoloogiast ka siis, kui on toimunud hübridiseerumine, mille tulemusena on retsipientpopulatsioonis püsima jäänud ainult mõni geen (nt mitokondriaalne DNA) Selleks et geenipuu oleks võimalikult sarnane liigipuuga, tuleks võtta rohkem geene ning duplitseerunud geenide korral kaasata kogu komplekt või loobuda duplitseerunud geenidest üldse. geenide puu ((1,2)3)

28 Molekulaarse fülogeneetika metoodika:
arvuta puu

29 Fülogeneesipuude konstrueerimise meetodite klassid:
säästumeetod ehk parsimoonsus distantsmeetod suurima tõepära ja Bayes`i meetodid

30 Säästumeetod järgib Occami habemenoa ehk säästuprintsiipi - muude asjaolude võrdsuse korral tuleb eelistada lihtsamat hüpoteesi. Otsitakse puud, mis on kõige lühem. Säästumeetodil (maximum parsimony, MP) otsitakse puud, millel on kõige vähem mutatsioone. Mutatsioonide arvu puul nimetatakse puu pikkuseks. See on kõigi puu harupikkuste summa. Vaadeldakse kõiki või paljusid puid ning võrreldakse nende pikkusi. Aluseks on Occami habemenoa printsiip, mille kohaselt tuleb muude asjaolude võrdsuse korral eelistada lihtsamat hüpoteesi. Antud juhul lühimat puud. (Tegelik puu kuulub tõenäoliselt säästlikumate puude hulka, kuid ei pruugi olla kõige säästlikum.) Barton et al 2007 “Evolution” Cold Spring Harbor Laboratory Press Contents -> online chapters -> Phylogenetic reconstruction -> Fig 27.10

31 Säästumeetodil rekonstrueeritud fülogeneesipuul rekonstrueeritakse ka eellasseisundid
Barton et al 2007 “Evolution” Cold Spring Harbor Laboratory Press Contents -> online chapters -> Phylogenetic reconstruction -> Fig 27.10

32 Probleemid: võimalike puude arv, mille seast otsida, on väga suur

33 näiteks pruning and regrafting
Puude otsingu meetodeid on palju. Neid kasutatakse koos säästu-, distants- ja tõepära meetoditega. Otsingualgoritmid alustavad etteantud puust ning teevad sellesse ükshaaval ümberkorraldusi. Igale uuele puule leitakse pikkus ning kui see on lühem eelmisest, siis tehakse ümberkorraldusi omakorda sellele. Seni kuni lühemat ei leita. Barton et al 2007 “Evolution” Cold Spring Harbor Laboratory Press Contents -> online chapters -> Phylogenetic reconstruction -> Fig 27.12 näiteks pruning and regrafting

34 “mägironimise” algoritm
Oht jääda suboptimumile kinni (analoogia fitness-maastikuga) Ravi – protsessi korratakse mitu korda, alustades erinevatest alampuudest. Tulemus võib sõltuda sellest, millisest alampuust alustada

35 Distantsmeetodid Distantsmeetodid lähtuvad eeldusest, et need kelle viimane ühine eellane elas hiljem, on sarnasemad kui need, kelle oma elas varem. (Distantsmeetodid on oma lähenemiselt feneetilised) Kuigi aluseks võetakse üldine sarnasus, mis on feneetiline printsiip, on distantsmeetodid geneetiliste andmete analüüsiks täiesti sobivad. Kuna enamus mutatsioone on neutraalsed või peaaegu neutraalsed ja kuhjuvad aja jooksul enam-vähem ühtlase kiirusega, siis võib eeldada, et nende DNAd kelle viimane ühine eellane elas hiljem, on sarnasemad kui need, kelle oma elas varem.

36 Distantsmeetod kasutab algandmetena distantsmaatrikseid
Milline on evolutsiooniline kaugus A ja D vahel? paariviisilised kaugused joonduselt evoluts. kaugused puu pealt A ja D kaugus puu pealt loetuna ehk nende evolutsiooniline kaugus on 2+6+2=10

37 Reaalsete andmete puhul ei lange vaadeldavad kaugused ja puu kaugused kokku (homoplaasiad)
Distantsmeetod otsib puud, mille korral kokkulangevus vaadeldavate distantside ja puu distantside vahel oleks suurim. Võib otsida paljude puude seast sobivaimat või kasutada algoritmi, mis konstrueerib distantside põhjal ühe puu ->

38 Eeldus: evolutsiooni kiirus on konstantne
UPGMA kaalumata paaride meetod aritmeetilise keskmisega on distantsmeetod, mis kasutab klasterdamisalgoritmi UPGMA - unweighted pair-group method with arithmetic mean - on kõige vanem distantsmeetod. UPGMA eeldab, et puu on ultrameetriline ehk juurest kõigi tippudeni peab harupikkuste summa olema sama. Seega on väga lihtne harupikkusi leida. Näiteks kui üks haru viib lindudeni ja teine imetajateni, siis on kummagi haru pikkus võrdne poole keskmise kaugusega, mis on kõigi lind-imetaja paaride vahel. Eeldus: evolutsiooni kiirus on konstantne

39 UPGMA

40 Kui evolutsioonikiirus ei ole konstantne, siis konstrueerib UPGMA puu, mille topoloogia on vale
distantsmaatriks tegelik evolutsioon UPGMA puu: UPGMA puudus: eeldatakse, et geneetiline kaugus korreleerub fülogeneetilise kaugusega, et töötab nn molekulaarne kell, mis igas puu harus ühtlase kiirusega mutatsioone juurde „tiksub“. Kõige esimesed molekulaarse evolutsiooni analüüsi meetodid, mis 1960ndatel kasutusele võeti, olidki sellised distantsmeetodid, mis eeldasid ultrameetrilist puud. Kui evolutsioon on toimunud eri liinides erineva kiirusega, siis sellised meetodid konstrueerivad vale puu. Vale!

41 Naabrite ühendamise meetod
kasutab klasterdamisalgoritmi puu topoloogia ja harupikkuste leidmiseks distantsmaatriksi alusel nii, et puu pikkus oleks lühim Tuntud distantsmeetod on naabrite ühendamise meetod (Neighbor-joining, NJ). NJ on samuti klasterdamisalgoritm nagu UPGMA, kuid ei eelda molekulaarset kella. NJ püüab leida lühima puu. NJ pole arvutusmahukas.

42 naabrite ühendamise meetod

43 distantsmeetod säästumeetod
Puu konstrueerimise algandmetena kasutatakse evolutsioonilisi kaugusi. Evolutsiooniline kaugus, ka geneetiline kaugus, mõõdetakse asenduste arvuga või erinevuse määraga (valkude puhul). Konkreetsete asenduste iseloom siin puu seisukohalt huvi ei paku, ainult kaugus. Kõigepealt tehakse kauguste maatriks, millel on kõik paariviisilise võrdluse teel saadud kaugused. Edasi on vaja leida puu, mille harupikkused vastaks kõige paremini saadud maatriksile. Kaugused puul ja kaugused paariviisiliselt mõõdetuna ei lange tavaliselt kokku. Sarnaselt säästumeetodiga võib võrrelda kõiki puid. Näiteks eelistades sellist, mille paariviisiliste ja puu kauguste vahede ruutude summa on vähim (vähimruutude meetod). Enamasti seda ei tehta, vaid kasutatakse mõnd klasterdamistalgoritmi selleks, et konstrueerida distantsmaatriksi alusel üks puu.

44 Mutatsiooniline küllastumine
DNA erinevuse määr (%) Vaadeldud asenduste arv ja lahknemisaeg pole lineaarses sõltuvuses. Põhjuseks on küllastumine, s.t. ühes ja samas nukleotiidipositsioonis on toimunud mitu asendust (>1). Aja möödudes ja asenduste kogunedes küllastumine kasvab. Seega, mida kauem aega tagasi toimus lahknemine, seda enam erineb vaadeldud erinevuste arv tegelikult toimunud asenduste arvust – vaadeldud erinevuste arv hindab alla tegelikku evolutsioonilist muutust. Mida kaugemad on võrreldavad järjestused ja mida kiiremini nad evolutsioneeruvad, seda tõsisem on alahindamise probleem. Võrreldes aminohappeliste järjestustega, on probleem tõsisem DNA järjestuste korral – erinevaid aminohappeid on 20, aga erinevaid nukleotiide ainult neli. Evolutsiooniliselt lähedaste järjestuste analüüsil pole parandust vaja (I faas joonisel). Enamasti on vajalik teatud parandus mitmekordsete mutatsioonide jaoks (II faas). Mutatsioonidest täiesti küllastunud järjestused on fülogeneesi rekonstrueerimiseks kõlbmatud, sest korrelatsioon järjestustevahelise erinevuse ja evolutsioonilise kauguse vahel puudub (III). lahknemisaeg

45 Evolutsiooniline kaugus on muutuste hulk
Distantsmaatriksid kasutavad enamasti parandatud kaugusi, mis arvestavad mitmekordse muteerumisega. Kui nukleotiidipositsioonis on toimunud rohkem kui üks asendus, siis on tegelik asenduste arv suurem sellest, mis leitakse homoloogiliste järjestuste võrdlemisel. Järjestuste võrdlemisel saadud kaugushinnang hindab evolutsioonilist kaugust alla, sest ei võta arvesse samas positsioonis toimunud korduvaid asendusi. Pane tähele, et pole vahet, kas mitmekordne muteerumine toimus ühes ja samas evolutsioonilises liinis (=puu harus) või erinevates, mida siis omavahel võrreldakse.

46 Eeldatav asenduste hulk parandus
Distantsmaatriksites kasutatakse enamasti parandatud kaugusi, mis arvestavad mitmekordse muteerumisega. Eeldatav asenduste hulk parandus vaadeldav asenduste hulk lahknemisaeg mitokondr. rRNA tuuma rRNA

47 Kauguste parandamine Jukes-Cantori meetodil
D – parandatud kaugus λ – vaadeldud kaugus (erinevuste osakaal) Jukes-Cantori DNA evolutsiooni mudeli eeldused kõik nukleotiidid võivad muutuda kõigiks nukleotiidideks sama suure tõenäosusega järjestused sisaldavad igat nukleotiidi 25% Kauguste parandamine Jukes-Cantori (1969) meetodil. Mudel teeb eeldusi DNA evolutsiooni kohta. Reaalses elus need eeldused enamasti ei kehti ja kasutatakse keerukamaid mudeleid.

48 geneetiliste kauguste parandamiseks
Eeldusi DNA aluspaaride muteerumiste tõenäosuste kohta nimetatakse DNA evolutsiooni mudeliks geneetiliste kauguste parandamiseks järjestuste joondustele skooride andmiseks säästumeetodil saadud puule skooride andmiseks suurima tõepära meetodi rakendamisel puudele skooride andmiseks Tuntumad mudelid: * JC mudel on kõige lihtsam. Kõik asendused toimuvad sama tõenäosusega. See tähendab,et transitsioonide ja transversioonide tõenäosused on võrdsustatud. * Kimura 2-parameetriline mudel (1980) Kimura võttis arvesse, et transitsioonide arv nukleotiidipositsiooni kohta võib erineda transversioonide arvust ja esitas 2-parameetrilise mudeli. Näiteks inimese mitokondriaalses DNAs on transitsioonide ja transversioonide suhe >20. * Felsensteini (1981) mudel püüab arvesse võtta nukleotiidse järjestuse aluspaarilist koostist. Kui mõnesid nukleotiide on järjestuses oluliselt rohkem, siis on ootuspärane, et neid puudutavaid muutusi on rohkem. Siiski, mudel eeldab, et kõigi parasjagu võrreldavate järjestuste aluspaariline koostis on enam-vähem ühesugune. Tegelikult võivad erinevad geenid ning sama geen erinevates organismides erineda nukleotiidselt koostiselt. Hasegawa, Kishino ja Yano mudel (1985) ehk HKY85 sulatab kokku Kimura 2-parameetrilise ja Felsensteini mudeli. Üldine pööratav mudel arvestab järjestuse aluspaarilise koostisega ning annab kõigile kuuele asendusele (A↔G, A↔T, A↔C, G↔T, G↔C, T↔C) igale erineva kiiruse (tõenäosuse).

49 Suurima tõepära ja Bayes`i meetodid on statistilisemad.
Võimaldavad hinnata, kui palju on üks puu tõenäolisem kui teine. Tõepära – tõenäosus näha antud andmeid eeldusel, et hüpotees kehtib Bayes`i teoreemi järgi saab leida hüpoteesi tõenäosuse eeldusel, et teame hüpoteesi aprioorset tõenäosust ja näeme antud andmeid Suurima tõepära (maximum likelihood, ML) meetod on Ronald Fisheri poolt kasutusele võetud meetod. Kaasaegsete fülogeneetiliste ML meetoditele pani aluse Joseph Felsenstein 70-80ndatel. hüpoteesiks on antud juhul konkreetne fülogeneetiline puu ja andmeteks järjestused. aprioorne – kogemusele (andmetele) eelnev aposterioorne – kogemusele järgnev Tõenäosus omandab väärtusi 0 kuni 1. Tõepära on andmete tõenäosus, ei pea olema 0 kuni 1, sageli väga väike arv ja väljendatakse logaritmina. Joseph Felsenstein alates 1970d

50 Tõepärade suhte arvutamine mündiviske näitel kull -1 kiri -2
H1: P(1) = P(2) = 0,5 H2: P(1) = 0,6; P(2) = 0,4 10 korda visatakse: Tõepära( | 0,5:0,5) = 0,510 = Tõepära( | 0,6:0,4) = 0,64 * 0,46 = H1 on 1,84 korda tõepärasem kui H2 nende andmete korral Püstkriipsu taha märgitakse tõenäosuse arvutamisel tehtud eeldused. tõepärade suhe – likelihood ratio

51 Suurima tõepära meetod
Meetod peab lahendama kaks probleemi: Leidma iga puu jaoks tõepära väärtuse 2. Leidma puu (puud), millel on suurim tõepära. vaja on: järjestuste joondust järjestuse evolutsiooni mudelit puud (topoloogia ja harude pikkused)

52 Hüpoteesiks on fülogeneetiline puu
Igale nukleotiidipositsioonile joonduses omistatakse tõepära väärtus. Kõigi positsioonide tõepärad summeeritakse. Kui hüpoteesiks on fülogeneetiline puu, siis peame omistama sellele tõepära väärtuse. Igale nukleotiidipositsioonile joonduses omistatakse tõepära väärtus vastavalt mutatsioonidele, mida see positsioon läbi teeks antud puu korral. Kõigi positsioonide tõepärad summeeritakse selleks, et saada puu tõepära. Mutatsioonide tõenäosused saadakse DNA evolutsiooni mudelist. Sarnaselt säästumeetodiga võrreldakse puid ja omistatakse neile skoor. Erinevalt säästumeetodist tuleb nüüd võrrelda ka puid, mis võivad omavahel erineda ainult harupikkuste poolest, s.t. eellasseisundite poolest. See teeb võimalike puude hulga väga suureks. Enamasti siiski kõiki võimalikke puid ja harupikkusi ei analüüsita, vaid võetakse aluseks distantsmeetodiga saadud harupikkused. (Need harupikkuse hinnangud sõltuvad samuti DNA evolutsiooni mudelist) Mutatsioonide tõenäosused saadakse DNA evolutsiooni mudelist. Erinevalt säästumeetodist tuleb nüüd võrrelda ka puid, mis erinevad ainult harupikkuste poolest, s.t. eellasseisundite poolest.

53 Bayes`i meetod püüab hinnata hüpoteesi tõenäosust
Bayesi meetod on samuti tõepärameetod, kuid kasutab veidi teistsugust lähenemist. Selle asemel, et arvutada andmete tõenäosusi, püüab Bayesi meetod anda tõenäosushinnagu hüpoteesile enesele, kasutades selleks mingit eelteadmist. Võrdle: ML hinnang mündiviskele, millel 2 korda visates tuleb kull, on p = 1. Kuna münt näib tavaline ja tuleb oma rahakotist, siis eeldaks, et p on 0,5. Bayes`i lähenemine võimaldab võtta arvesse aprioorset tõenäosust 0,5. Kuigi esimest korda pakuti Bayesi meetodi kasutust fülogeneetikas juba 1968 (Felsenstein), siis laiemalt rakendama hakati seda alles 1996 (Rannala ja Yang 1996;Mau jt 1996;Li jt 1996). Mündiviske näide kehtib juhul, kui meil on lubatud visata ainult 2 korda. Kui andmeid on rohkem, s.t. viskeseeria on pikem, siis võib eeldada, et suurima tõepära hinnang on adekvaatne.

54 Positiivse vastuse saavad 999 haiget ja 999 tervet inimest.
Bayes`i lähenemine võimaldab võtta arvesse eelteadmisi ehk aprioorset tõenäosust selleks, et leida aposterioorset tõenäosust. Haiguse diagnoosimisel tehakse 0,1% vigu. Aprioorne tõenäosus, et positiivne testi vastus tähendabki haigust on 99,9%. Võtame arvesse eelteadmise, et haiguse esinemissagedus on 0,1%. S.t. miljonist inimesest on 1000 haiged ja terved. Positiivse vastuse saavad 999 haiget ja 999 tervet inimest. Seega positiivse vastuse saanul haiguse esinemise aposterioorne tõenäosus on 999/( ) = 50%. Teades haiguse esinemise sagedust, saame muuta oma hinnangut valepositiivsetele testi tulemustele. Haruldase haiguse korral toimub enamus vigu tervete inimeste testimisel.

55 Bayes`i meetod püüab hinnata hüpoteesi tõenäosust
hüpoteesi ja andmete ühine tõenäosus hüpoteesi tõepära ja tõenäosus andmete tõenäosus (summa üle kõigi hüpoteeside) andmete tõenäosus - selleks oleks vaja leida andmete tõenäosused iga võimaliku puu topoloogia, harupikkuste ja DNA evolutsiooni mudeli korral ja korrutada see vastava puu tõenäosusega. Õnneks kahe hüpoteesi võrdlemisel taandub andmete tõenäosus välja. Puude tõepärade suhe on leitav. Vaja oleks leida puude aprioorsete tõenäosuste suhte korrutis tõepärade suhtega ja seda kogu hüpoteeside ruumi ulatuses. Ainult nii saame infot selle kohta kui palju üks puu teisest aposterioorselt tõenäolisem on. Selleks simuleeritakse fülogeneetiliste puude valim, mis esindab erinevaid puid vastavalt nende aposterioorsetele tõenäosustele. Hüpoteeside võrdlemisel taandub andmete tõenäosus välja. Reaalsete andmete puhul pole aposterioorne tõenäosus kõigile võimalikele puudele(, mis statistikaks vajalik on) välja arvutatav.

56 Markovi ahela Monte Carlo (MCMC)
Võetakse puu ning tehakse sellele juhuslikke ümberkorraldusi. Võrreldakse eelmist ja uut puud tõepärade ja aprioorsete tõenäosuste suhte alusel. Kui uus puu on tõenäolisem, siis valitakse uus puu uute ümberkorralduste aluseks. Kui uus puu on vähem tõenäoline, siis on tema valimise tõenäosus võrdne tema suhtelise tõenäosusega. Kui uut puud ei valita, siis tehakse uued ümberkorraldused eelmisele puule. Peetakse meeles, kui kaua ühe puuga töötati. Moodustub puude valim. Korrektse Markovi ahela korral on iga puu valimise tõenäosus võrdne tema aposterioorse tõenäosusega. Tegelikkuses leitakse tõenäosused Markovi ahela Monte Carlo (MCMC) simulatsiooni abil. Markovi ahel (vene matemaatiku Markovi järgi) on protsess, milles iga seisund sõltub ainult eelmisest seisundist ja mitte varasematest seisunditest. Mälutus. Seisundite vahelised üleminekud toimuvad kindlaksmääratud tõenäosustega (üleminekutõenäosused). “Monte Carlo” viitab juhuslikkusele. Tõepära leidmiseks on vajalik DNA evolutsiooni mudel. Sageli kasutatakse eelteadmisena (prior) ikka veel ühtlast puude jaotust. See tähendab, et tegelikult justkui eelteadmist polegi ja võrreldakse ainult tõepärasid. Potentsiaalselt lubab Bayesi põhimõte ennast kasutada väga erinevate andmete puhul ja hästipõhjendatud eelteadmised võiksid kajastuda adekvaatsetes aposterioorsetes tõenäosustes.

57 Tekkinud puude valim annab infot üksikute klaadide monofüleetilisuse kohta.
Puid valimis , neist sisaldab klaadi B Tõenäosus, et rühm B on monofüleetiline 75400/ = 75.4% Suurima tõepära ja Bayes`i meetodid võimaldavad testida järjestuste evolutsiooni mudeleid, juhul kui puu on teada, ja ka teisi evolutsioonis olulisi parameetreid nagu näiteks populatsiooni suuruse muutused ja mutatsioonikiiruse muutused.

58 Fülogeneetiliste puude konstrueerimise meetodite kokkuvõte
Contents -> online chapters -> Phylogenetic reconstruction Table 27.4, p17

59 Kõigi fülogeneesi rekonstrueerimise algoritmide omadused on hästi kirjeldatavad ja kontrollitavad.
Selleks lastakse neil rekonstrueerida evolutsioonipuid, mis on teada (näiteks arvutisimulatsioonist) Statistilised meetodid on kõige paindlikumad ning annavad parimaid tulemusi. Samas sõltuvad need tulemused paljudest eeldustest, mille kontrollimata jätmisel on oht tulemusi üleinterpreteerida.

60 Kas opossum on primitiivsem liik kui inimene?
“Primitiivne” pole õige sõna. Õige on rääkida õde-klaadidest, sest kui A lahkneb B-st, siis samal ajal lahkneb B ka A-st. Kas jääkaru on lähemalt suguluses leemuri või inimesega? (A) Omland et al 2008 BioEssays 30:854–867 Figure 4. Pärisimetajate ja kukkurloomade fülogeneesipuude erinevad esitused. Puud erinevad i) tähelepanu all oleva liigi poolest A – inimene, B- opossum, C – pole näidatud; ii) liikide järjestamise poolest paremalt vasakule. Fülogeneetilised seosed on igal pool õiged. Võrdses suguluses, sest mõlemal paaril on sama ühine eellane.


Download ppt "Fülogeneesi rekonstrueerimine"

Similar presentations


Ads by Google