Download presentation
Presentation is loading. Please wait.
Published byDouglas Clark Modified over 6 years ago
1
genetička epidemiologija populaciona genomika -dizajn studija-
2
neka pitanja populacione genetike
Šta nam DNK sekvenca govori o istoriji populacija? Kako su evolutivni faktori oblikovali genetičku raznovrsnost i diferencijaciju populacija? Ima li asocijacije izmedju varijabilnosti u DNK sekvencama i fenotipa?
4
Genetička epidemiologija – istražuje ulogu genetičkih faktora u ispoljavanju osobina u porodicama i populacijama i interakcije genetičkih faktora sa sredinskim ispitati uzročnu medjusobnu vezu više gena, gena i sredinskih faktora sa fenotipom napraviti najbolji dizajn studije
5
Ima li značajne porodične agregacije fenotipa
Osnovno pitanje: da li je, i u kom stepenu, variranje složenog fenotipa (Vf) pod genetičkom kontrolom (Vg)? Primer: identifikovati genetičke faktore kod domaćina koji doprinose riziku za infektivno oboljenje Ima li značajne porodične agregacije fenotipa ako ima značajne asocijacije medju rodjacima za neko oboljenje, a ne javlja se medju supružnicima, znači visoka je Vg (genetička varijansa, npr. za infekciju nekim patogenom) i ne može se pripisati zajedničkoj sredini kojom se prenosi infekcija
6
Složene osobine..monogeno determinisane, poligeno, interakcija gena i sredine
7
Multifactorial Etiology
ROCHE Genetic Education (www)
9
Prelaz sa studija familija na populacione studije...
Porodične studije vezanosti (linkage) mere ko-segregaciju u familijama, malim rodoslovima ne treba kontrolna grupa jer testiraju specifični model mendelovske segregacije unutar familije Populacione studije asocijacija mere ko-segregaciju u populacijama koriste neravnotežu vezanosti (LD) koja se među populacijama razlikuje
10
Linkage - studije vezanosti
Genomika i složene osobine: da li je marker na hromozomu blisko lociran – “vezan” za nepoznati region koji kontroliše fenotip? Linkage - studije vezanosti upotrebom molekularnih markera otkrivanje lokusa za kvantitativne osobine (QTL) obično je puno sekvenci (npr. STR) asociranih sa fenotipom i imaju plejotropni efekat, uz epistaze, uticaj pola, populaciono specifični su itd. Studije asocijacije WGAS (Whole Genome Association Studies) nekoliko hiljada SNPs, treba da obuhvati veliki uzorak sa osobinom i kontrole bez date osobine GEIS (Gene-Environment Interaction Studies) kako genotipovi u specifičnoj sredini menjaju fenotip GWIS (Genome - Wide Interaction Studies)
11
Relativni rizik parametar genetičke epidemiologije
PAR – population attributable risk Proporcija slučajeva koja se pripisuje odredjenom faktoru rizika (za koliko bi opala incidenca kancera pluća da niko nije pušač?) PAF – population attributable fraction Proporcija svih slučajeva u populaciji koja je izložena tom faktoru rizika (koja frakcija obolelih od kancera pluća su pušači?) PAR i PAF se suštinski razlikuju samo ako je izloženost riziku česta a efekat varijanti relativno slab za retke izloženosti i varijante sa jakim efektom mala je razlika
12
Relativni rizik genotipa
Markeri DNK polimorfizma (mikrosateliti, SNP) daju informaciju o genotipovima u kontrolnim uzorcima i u “slučajevima” RR (relativni rizik za dati genotip) (GRR) = fd(1-fc)/fc(1-fd) fc, fd, su učestalosti genotipova u kontrolnoj i grupi “slučajeva” Dobijeni GRR se testira u odnosu na neki od modela Poredjenje: osobe koje imaju alel niskorizični (npr. d) odnosno visokorizični (npr.D) alel na oba, jednom ili nijednom hromozomu Ako su p0, p1, p2 verovatnoće oboljevanja osoba sa 0, 1, ili 2 kopije rizičnog alela D, onda su modeli GRR: Multiplikativni GRR = p1 / p0 = p2 / fp Aditivni GRR = p1 / p0 Dominantni GRR = p1 / p0 = p2 / p0 Recesivni GRR = p2 / p0 = p2 / p1 Opšta prevalenca oboljenja je (p2Rdd+2pqRDd+q2RDD)
13
Relativni rizik porodični da li se odredjene varijante grupišu u porodicama
učestalost medju rodjacima obolelog λr = populaciona učestalost λ je rizik ponavljanja medju srodnicima r je tip srodstva - u odnosu na konkordantno nasledjivanje kod parova srodnika koji su sa datom osobinom - analogno koeficijentu heritabilnosti Genetičko mapiranje je lakše za osobine sa visokom vrednošću λ , (λ > 10) nego sa niskom (λ < 2).
14
sve te relacije pomažu u razvoju strategije istraživanja i mapiranja
za dati porodični rizik λ, različiti modeli mogu biti i sa različitim PAR nema odredjene korespodencije λ i PAR retki aleli (npr. p=0,0001) visokog rizika (npr. R=50, DOM model), asocirani sa više porodičnih kancerskih sindroma (npr. λ=1,05), javljaju se u maloj proporciji u populaciji (npr. PAR=1%) sve te relacije pomažu u razvoju strategije istraživanja i mapiranja Primer: kancer dojke, porodična istorija, skrining mutacija u populacionim case-control studijama u UK procenila da je samo 17% porodičnog rizika usled visoko penetrabilnih BRCA1 i BRCA2. ako preptostavimo da su ostali, nisko penetrabilni lokusi relativno visoke učestalosti u populaciji ali im je efekat mali (niskorizični SNPs), tada ne više od 15% njih bi objasnilo ostatak-udeo u porodičnom riziku preptostavivši MULT model. verovatnoća da će slučajno uzeti SNPs u genomu biti asocirani sa kancerom dojke je tada veoma mala i potrebno je uključiti veliki uzorak da bi se postigla pouzdanost u detektovanju lokusa sa tako malim efektom
15
populacione studije kombinuju geneologiju i baze podataka
u proceni λ populacione studije kombinuju geneologiju i baze podataka dve velike baze, Juta (SAD) i Švedska procenjuju porodični rizik za skoro sve kancere drugi pristup odredjivanja relativnog doprinosa Vg kanceru u populaciji koristi MZ i DZ parove blizanaca u proceni broj parova u kojima oboje obole u poredjenju sa parovima kod kojih samo 1 oboli model podrazumeva aditivni doprinos brojnih lokusa koji doprinose podložnosti i kada ona predje prag, ispolji se fenotip ne može se razlikovati efekat dominanse i zajedničke sredine Primer: Skandinavija, uzorak od parova blizanaca, linkage studije kancera Oba pristupa su dala neke sličnosti: identifikovale su da kancer prostate i kolona ima značajnu Vg, nijedna nije našla značajnu Vg za kancer uterusa Retke varijante ne daju značajnu porodičnu grupisanost na nivou populacije
16
Populacione studije asocijacija
mere ko-segregaciju u populacijama koriste neravnotežu vezanosti (LD) koja se među populacijama razlikuje
17
Populacione studije asocijacije
zasnovane su na poredjenju nesrodnih jedinki u populaciji koje imaju poremećaj, određeni (fenotip) sa jedinkama bez njega Neki alel se smatra asociran sa osobinom ako je učestaliji medju obolelim jedinkama Moguće su ovakve studije za bilo koji DNK polimorfizam, ali imaju najviše smisla za funkcionalno značajne varijante Genome Wide Association Studies asocijacije širom genoma Identifikuju SNPs koji ili imaju fenotipski efekat ili su u bliskoj vezanosti (LD) sa lokusom koji ima efekat.
18
Razlike izmedju studija linkage i asocijacije
vezanost asocijacija svojstvo lokusa i genetički je fenomen svojstvo alela i statistički je fenomen uloga: Identifikovati biološki mehanizam prenosa osobine ilocirati gen Identifikovati asocijaciju izmedju alela i pojave osobine Identifikovati LD izmedju alela za osobinu i marker alela Grubo mapiranje (>1cM) Fino mapiranje (<1cM) Ne daje info o tome koja alelska varijanta je značajnije povezana s arizikom za nastanak poremećaja daje informaciju o riziku Zahteva rodoslove Pristup je preko grupa kontrola i slučajeva ili populacionih grupa Markeri su veoma polimorfni Markeri su obično bialelni
19
Najveći problem je odabir kontrolne grupe
Asocijacija nije genetički već statistički fenomen koji odredjuje zajedničko javljanje alela i fenotipa Npr. Ako je u opštoj populaciji učestalost alela HLA-DR4 36%, a kod obolelih od reumatodinog artitisa 78%, tada smatramo da je taj alel statistički asociran sa RA tj.nosi relativni rizik Najveći problem je odabir kontrolne grupe
20
“Case-Control” studije asocijacije sa nesrodnim kontrolama
uobičajene u epidemiologiji uzorak slučajeva uzorak kontrola iz iste populacije sa sličnom genetičkom pozadinom (poreklom) The numbers in this example are taken from a 2007 study of coronary artery disease (CAD) which showed that the individuals with the G-allele of SNP1 (rs ) were overrepresented amongst CAD-patients.
21
ako alel A uzrokuje osobinu
pozitivna asocijacija nekog alela npr. A i osobine može nastati iz više razloga: ako alel A uzrokuje osobinu u tom slučaju isto se mora dobiti u svim ispitivanim populacijama ako alel A ne uzrokuje osobinu, ali je u neravnoteži vezanosti (LD) sa stvarnim uzročnikom ako je osobina nastala usled odvojenih predačkih mutacija na uzrokujućem lokusu, a alel A bio prisutan na nekom od tih predačkih hromozoma dovoljno blizu ako je posledica artefakta usled mešanja populacija u mešovitoj populaciji, svaka osobina u visokoj učestalosti u nekoj etničkoj grupi pokazaće pozitivnu asocijaciju sa bilo kojim alelom koji je učestaliji u toj grupi NAJVEĆI I NAJČEŠĆI PROBLEM San Francisco...asocojacija izmedju nosilaca alela A1 na HLA lokusu i sposobnosti upotrebe štapića za jelo..HLA*A1 je učestaliji medju kinezima nego kavkazijancima
22
Kod složenih fenotipova, većina je čestih i umereno čestih varijanti sa niskim ili umerenim efektom
GWAS pristup ih može detektovati Retke varijante u opštoj populaciji sa velikim efektom, obično su populaciono-specfične (BRCA1/2)
23
Published Genome-Wide Associations through 12/2013
Published GWA at p≤5X10-8 for 17 trait categories NHGRI GWA Catalog Credit: D Leja and T Manolio, NHGRI; T Burdett, D Welter, and H Parkinson, EBI
24
2007, Wellcome, Trust Case Control Consortium, 500 000 SNP, kod 17 000 osoba, 7 oboljenja
označene su najjače asocijacije pojedinih hromozoma sa oboljenjem sledeći korak je da se utvrdi da li je taj deo uzročnik oboljenja ili je samo u LD sa uzročnikom
25
Nedostaci mešane populacije ili stratifikacija populacija usled čega se kontrole i uzorci razlikuju u učestalosti alela jer nisu istog populacionog porekla to može dovesti do lažno-pozitivnih ili lažno-negativnih asocijacija potreban veliki uzorak da bi se detektovale interakcije sa sredinom i to ≥ 4 puta više ukoliko su zajedničke genetičke i sredinske varijable
26
Population Stratification
Marchini, 2004 (www)
27
I dalje..“missing heritability“..“dark matter“
Identifikovane asocirane varijante i ne objašnjavaju u potpunosti porodični relativni rizik za nastanak oboljenja mogući kandidati bi bili aleli sa nepotpunom penetrabilnošću, retke varijante, CNV, epigenetičke studije... Poredjenje rezultata porodičnih studija vezanosti i studija asocijacije daju nisko podudaranje mogući razlozi su interakcije GS, epistaze, genetička i populaciona heterogenost...
28
Studija 90 000 blizanaca Švedska, Danska, Finska:
statistički značajni udeo Vg u Vf samo za kancer prostate (42%), kolorektalni (35%) i dojke (27% Studija 9,6 miliona osoba u Švedskoj bazi podataka porodičnih kancera: udeo Vg najveći za kancer štitaste žlezde (53%), visoka heritabilnost za kancer endokrinog sistema (28%), testisa (25%), dojke (25%) i melanom (20%). Galvan et at Beyond GWAS: genetic heterogeneity and individual predispozition to cancer. Trends in genetics, 26:
29
Neki primeri.. Kancer dojke i kolorektalni kancer: puno lokusa poznato, ali ostaje nepoznatih dosta koji doprinose Vg verovatno putem kombinacije učestalih alela niske penetrabilnosti, koji interaguju i sa sredinom Kancer pluća, kancer grlića materice: malo lokusa poznato, niska h2 primer veće značajnosti sredinskih faktora (nikotin, HPV) Kancer štitaste žlezde: malo lokusa poznato visoka h2
30
Dosta je kontroverzi oko označavanja populacija po etničkoj pripadnosti, poreklu u cilju zdravlja
alelske učestalosti oslikavaju populacionu strukturu, genetičku vairjabilnost, istorijske faktore-drift, protok gena i odražavaju se na diferencijaciju populacija, subpopulacija neki aleli koji se smatraju zajedničkim za doprinos riziku teško će se naći u malim populacijama ako su retki neki aleli su specifični za subpopulacije neke varijante mogu u različitim sredinama imati različite efekte
31
Genetički rizik za nastanak kancera se razlikuje medju populacijama
USA: visoka incidenca kolorektalnog kancera medju migrantima japanskog ali ne i Latino porekla, a u obe populacije je niska stopa oboljevanja od ovog tipa kancera (preovljadjuje interakcija sa Vs) Nema razlike kada se radi o kancerima koji se ospoljavaju u mladjem dobu (preovladjuje Vg) GWAS kancera su radjene uglavnom na populacijama evropskog porekla i identifikovale brojne učestale varijante koje doprinose niskom riziku, ali ograničenja su u kliničkoj primeni, u predikciji rizika identifikovane varijante za učestale kancere objašnjavaju samo 25% heritabilnosti Haiman&Stram Exploring genetic susceptibility to cancer in diverse populations. Current Opinion in Genetics & Development. 20:1–6. Goldgar, Population genetics of cancer. Biochimie 84:19-25.
32
Genome Wide Association Studies asocijacije širom genoma
Identifikuju SNPs koji ili uzrokuju ili su u LD sa uzročnikom poremećaja (fenotipa) Studije asocijacije zavise od neravnoteže vezanosti usled efekta genetičke vezanosti alela bliski SNP nisu i nezavisni
33
Neravnoteža vezanosti (linkage disequilibrium – LD)
odnosi se na alele u populacijama ako se 2 alela nasledjuju zajedno češće nego što se očekuje mendelovski, kaže se da su u neravnoteži vezanosti Gametska neravnoteža, se odnosi i na alele na različitim hromozomima, koji segregiraju u gamete To je odstupanje od slučajne asocijacije alela u haplotipovima od očekivane na osnovu učestalosti alela na 2 i više nezavisnih, udaljenih lokusa
34
Gametska ravnoteža (gametski ekvilibrijum)
(n - broj alela; m - broj lokusa; svaki lokus ima isti broj alela; nm = broj alelskih kombinacija u gametima) učestalosti alela i gameta za dvoalelni, dvolokusni model jednake su proizvodu učestalosti alela koje sadrže _______________________________________________ Aleli učestalost Gameti učestalost A p A1B pr = g1 A q A1B ps = g2 B r A2B qr = g3 B s A2B qs = g4
35
gameti ženki g1 (A1B1) g2 (A1B2) g3 (A2B1) g4 (A2B2)
gameti mužjaka g1 (A1B1) g1g g2g g3g g4g1 g2 (A1B2) g1g g2g g3g g4g2 g3 (A2B1) g1g g2g g3g g4g3 g4 (A2B2) g1g g2g g3g g4g4 Spajanjem gameta putem slobodnog kombinovanja može nastati 16 različitih diploidnih kombinacija alela, tj. genotipova (pr+ps+qr+qs)2 Genotipovi učestalosti (pr + ps + gr + gs) A1B1 / A1B g12 A1B1 / A1B g1g2 A1B1 / A2B g1g3 A1B2 / A1B g22 A1B1 / A2B g1g4 A1B2 / A2B g2g3 A1B2 / A2B g2g4 A2B1 / A2B g32 A2B1 / A2B g3g4 A2B2 / A2B g42 Ravnotežne učestalosti genotipova za par dvoalelnih lokusa Očekuje se da su učestalosti alela u nespregnutim gametima jednake učestalostima odgovarajućih alela u spregnutim gametima, i da time proizvodi učestalosti oba tipa gameta budu jednake: A1B2 x A2B1 = A1B1 x A2B2.
36
SNP1 [ A1 / A2 ] SNP2 [ B1 / B2 ] p(A1) p(B1) p(A2) p(B2)
Nezavisno segregirajući SNPs: Očekivana učestalost haplotipa p(A1B1) = p(A1) x p(B1) NERAVNOTEŽA VEZANOSTI učestalost haplotipa p(A1B1)≠ p(A1) x p(B1) Haplotip se prvo mora odrediti genotipovima gametske faze –moraju se znati genotipovi roditelja, ili se računaju preko Max verovatnoće 36
37
D = p(A,C) p(G,T) - p(A,T) p(G,C)
Lokusi su u ravnoteži vezanosti ako je p(A,C) = p(A) x p(C) Neravnoteža je ako: All based on Lewontin's D Performance depends on recombination fraction, allele frequency and other parameters Overall D’ and d are the best, although performance decreases if marker and disease loci are close. D = p(A,C) - p(A) x p(C) D = p(A,C) p(G,T) - p(A,T) p(G,C) 37
38
Rekombinacije smanjuju LD
Interes za LD raste naglo ’80tih zbog mapiranja genoma LD se detektuje za puno bliže markere nego u studijama vezanosti Rekombinacije smanjuju LD što su markeri (aleli) bliže, jači je LD jer je niža stopa rekombinacije učestalost haplotipa usled neravnoteže je: p(A1B1)≠ p(A1) x p(B1) + D (-D)
39
U populaciji, rekombinacijama...
Nakon 20 generacija mejoza, zajednički regioni će se smanjiti u odnosu na predački, samo će blisko vezani ostati zajedno Ako su dve nesrodne osobe nasledile alel D za oboljenje od davnog zajedničkog pretka, tada će one imati i isti alel blisko lociran sa D Informaciju daje postojeće populaciona asocijacija izmedju alela D i markera: Odredjene kombinacije blisko vezanih alela javljaće se češće
40
lokus M (aleli M1, M2 - neutralni markeri, SNPs)
Ako ne znamo ništa o jednom lokusu, možemo saznati pomoću drugog… SNP može biti u asocijaciji sa osobinom iako nije uzročni ali je statistički korelisan sa nekom uzročnom varijantom, usled LD Ex: lokus M (aleli M1, M2 - neutralni markeri, SNPs) lokus B (alel B1 u odnosu na B2 povećava rizik za npr. kancer) Očekujemo da je učestalost B1 povišena u uzorku “slučajeva” u odnosu na kontrolnu grupu Ako su M i B lokusi u LD, onda se M1 nalazi češće sa B1 nego sa B2, pa nije samo B1 povišene učestalosti kod “slučajeva” nego i M1
41
asocijacije mogu biti suprotnosmerne u različitim populacijama
pozitivne asocijacije usled LD mogu dati naizgled kontradiktorne rezultate: pozitivna asocijacija alela A i neke osobine u populacionim studijama može nastati ako alel A ne uzrokuje osobinu, ali je u LD sa stvarnim uzročnikom. ako je osobina nastala usled odvojenih predačkih mutacija na uzrokujućem lokusu, a alel A bio prisutan na nekom od tih predačkih hromozoma dovoljno blizu asocijacije mogu biti suprotnosmerne u različitim populacijama
42
Unutar porodice, linkage se dešava kada dva markera, mesta na hromozomu ostanu zajedno, ne razdvoje se rekombinacijom u mejozi U populaciji delovi osnivačkih hromozoma u početnoj generaciji sekvencijalno se smanjuju rekombinacijom i vremenom parovi marker mesta na hromozomu se uravnoteže u učestalosti u populaciji
43
neravnoteža vezanosti (LD) u populacijama je “oblikovana”
mutacijom,selekcijom, protokom gena i genetičkim driftom LD izmedju 2 lokusa može nastati mešanjem dve, genetički različite populacije usled smanjenja veličine populacije (drift), kada varijansa D može biti velika. Brz rast populacije ima efekta na smanjenje LD usled smanjenja drifta visoki nivoi inbridinga održavaju LD selekcija na lokusu na koji deluje uzrokuje LD sa neutralnim, blisko vezanim alelima
44
mutacija i LD kada su oboljenja u populaciji nastala mutacijom kod zajedničkog pretka, vezani aleli se zajednički nasledjuju LD metod koristi mejoze koje su se desile od nastanka mutacije i koristi se za fino mapiranje gena (male populacije, veće rodoslove) LD metod je najefikasniji u malim, genetički homogenim populacijama, gde je veća verovatnoća nalaženja pojedinačne, osnivačke mutacije
45
LD oko predačke mutacije
46
pogodan pristup mapiranja lokusa za složene osobine je putem neravnoteže izmedju markera i lokusa
novonastale mutacije su niske učestalosti i u potpunom LD sa alelima ostalih okolnih lokusa na tom hromozomu, sve dok ih rekombinacija ne razdvoji Vremenom, rekombinacija narušava ovu neravnotežu i učestalosti se izjednačavaju - erozija vezanosti. Trajanje zavisi od rastojanja (1Mb ~ 70 generacija ~2000 godina)
47
Diastrofična displazija (DTD), jedno od prvih oboljenja za koje je studijama asocijacije i LD mapiran region na hromozomu 5. populacija Finske, studije asocijacije su pokazale da se radi o nekoliko polimorfnih mesta, a da su 2 vezana za lokus CSF1R. u grupi obolelih, 95% je imalo haplotip 11, a u kontrolnoj 3%. populacija Finske je imala samo oko 100 generacija istorije što je procenilo udaljenost gena za DTD (glavnog za poremećaj hrskavice), oko 60kb od CSF1R lokusa
48
Cistična fibroza (CF) 70% su mutacije u ∆F508 alelu nastale pre više od godina Verovatne hipoteze: nastala kao efekat osnivača održava se prednošću heterozigota istorija CFTR mutacija se može odrediti preko minisatelitskih markera koji su u LD sa mutacijom
49
54 haplotipa (br. ponovaka na 3 lokusa), samo 3 česta, ostali sa učestalošću < 1%
haplotip je predački, ravnomerno distribuiran u Evropi, nema ga u drugim delovima sveta procena da je nastao pre 2627 generacija (sr.br. mutacija nastalih na∆F508 = 0.867, stopa mutacija 3.3x10-4/lokusu/gametu). 2 haplotipa ( i ) su češći u Centralnoj Evropi i Skandinaviji Korelacija geografske distribucije alela i ekspanzije neolitske civilizacije, farmera iz srednjeg istoka...
50
Populaciona genomika otisci selekcije na genomu
Selekciona prednost određenog genotipa i/ili haplotipa (gameta) može biti razlog značajnog odstupanja od gametske ravnoteže u populaciji Efekat zavisi od pravca, intenziteta, trajanja selekcije pozitivna selekcija, genetičko prevoženje, balansna, negativna, selektivni otklon itd..različite obrasce varijabilnosti ostavljaju u genomu
51
genetičko prevoženje, (genetic hitchhiking)
ako postoji statistički značajna asocijacija alela na neutralnom lokusu sa lokusom koji je pod selekcijom, taj neutralni alel može deliti sudbinu alela drugog lokusa za koji je vezan haplotipski, a na koji selekcija intenzivno deluje Ovo se posebno dešava ukoliko je takva asocijacija alela odigrava duže vremena veoma bliskom vezanošću, ili izmedju nukleotidnih mesta unutar lokusa, ili visokom stopom inbridinga.
52
Selektivno brisanje (selective sweep)
proces kojim selektivno favorizovani aleli rastu u učestalosti i time menjaju učestalost i varijanti sa kojima su u neravnoteži vezanosti, smanjujući varijabilnost bliskih regiona na hromozomima ostavlja zapis u genomu kao pad heterozigotnosti oko selektovane varijante (otklon) omogućava da se utvrde mesta koja su nedavno prošla selekciju
53
Genetički drift, efektivna veličina populacije (Ne) i LD
Neslučajne asocijacije između entiteta genetičkog polimorfizma mogu nastati kao rezultat stohastičkih procesa vezanih za fluktuacije u brojnosti populacije. iako je u nekom trenutku veličina populacije znatna, mala osnivačka populacija ili usko grlo u prethodnoj generaciji mogu biti uzrok značajne neravnoteže vezanosti. Generalno, drift je jači faktor u menjanju učestalosti gameta, na nivou više lokusa, nego da pojedinačnom lokusu LD između parova SNP zavisi od Ne i od rekombinacione stope između njih. Rastojanja od kb su isuviše mala da bi se rekombinaciona stopa računala preko linkage analiza i rodoslova Preko LD je moguće proceniti skorašnju Ne populacije, dok se preko heterozigotnosti (H) DNK sekvence procenjuje prosečna Ne kroz duži period
54
Za efektivnu velićinu populacije Ne, i stopu rekombinacije c izmedju lokusa, očekivana vrednost LD preko r2 je aproksimativno E (r2) ≈1/(1+4Nec) odakle sledi da kada je Nec veliko, E (r2) teži nuli, a obrnuto, dostiže 1. LD se zadržava duže u malim populacijama, sa niskom stopom rekombinacije
55
Ne humanih populacija se menja tokom vremena
smatra se, na osnovu LD procene, da je Ne humane populacije bila manja nego što se mislilo, i da je prošla usko grlo pre oko godina posle čega je nastupila ekspanzija. Mikrosateliti imaju višu stopu mutacija i oslikavaju još skoriju populacionu istoriju. smatra se da je Ne ~1000 osnivačka populacija savremenih ljudi
56
Linkage disequilibrium and population demography
Mapping disease genes by association requires the identification of linkage disequilibrium (LD) between a marker and a disease phenotype. Several studies of African populations have indicated that levels and patterns of LD in these populations differ from those in non-African populations owing to the age of African populations, admixture with other African and non-African populations, and historical differences in population size and substructure. A disease mutation (shown in violet) that occurs on a single haplotype background will initially be in complete LD with flanking markers on that chromosome (see panel a). In each generation, LD between a marker and a disease allele decays owing to recombination between the sites, and also because of the effects of mutation and gene conversion at marker loci. Young populations, and those that have undergone recent bottlenecks (as probably occurred during the migration of ancestral humans out of Africa), will have haplotype blocks of large to moderate size (panel b, shown in green). In older and larger African populations, in which there has been more recombination, the size of haplotype blocks will probably be smaller (panel c). LD can also be established by a founder event, with the strength and extent of the LD depending on the severity and length of the bottleneck event. Population substructure increases LD owing to a smaller effective population size and to higher levels of genetic drift in subdivided populations. So, if a pooled sample derived from several African populations was analysed, spurious LD would be detected, even if the haplotypes in each subpopulation were in LD. This could lead to erroneous conclusions about the association between genetic markers and disease phenotype. Small populations of stable size are expected to show LD between closely linked loci as a result of increased genetic drift, and larger populations will have fewer sites in LD. New mutations are less likely to be in LD in growing populations owing to the smaller effect of genetic drift, but allelic associations that exist before population expansion might persist for a longer period of time in an expanding population than in a population of constant size. Tishkoff, Nat Reviews Genet 2002 (www)
57
34 X-mikrosat. lokusa, urbane i izolovane ruralne, ostrvske subpopulacije Škotske
Nema značajne diferencijacije medju ovim subpopulacijama prema učestalosti alela ali je velika razlika u LD half-distance LD...na polovini izmedju maksimalne i minimalne vrednosti
58
D = mxmy (p1.x – p1.y)(q1.x – q1.y)
Protok gena i LD LD izmedju 2 lokusa može nastati mešanjem dve, po genetičkoj strukturi različite populacije Ako se posmatra delovanje protoka gena na više lokusa… mešanje populacija sa različitim učestalostima entiteta genetičkog polimorfizma, pa time i različitim gametskim učestalostima može dovesti do neslučajnih asocijacija i neravnoteže vezanosti. opšta veličina neravnoteže D u dvolokusno dvolalelnom modelu, pri mešanju dve populacije (x i y) u proporcijama mx i my data je izrazom: D = mxmy (p1.x – p1.y)(q1.x – q1.y) što je veća razlika u učestalosti alela između 2 populacije, a veliki uticaj predačkih na svaku ponaosob, to je veći D.
59
LD primenjeno na istraživanju kod Lemba, južnoafrička populacija koja govori Bantu jezik, ali tvrdi da potiče od jevrejskih predaka 68% Y- hromozoma Lemba ima semitsko poreklo, ali mt DNK analiza ne potvrdjuje ovakav protok gena po ženskoj liniji Utvrditi mogući uticaj mešavine populacija na LD kod Lemba Analizirano u parovima 66 mikrosatelitskih lokusa duž X hromozoma kod: Lemba Bantu Aškenazi
60
visok LD i medju udaljenijim lokusima
13,8% lokusa generalno ima značajan LD lokusi u LD samo kada su blisko vezani Visok LD kod Lemba ide u prilog tome da oni potiču od ne tako davne mešavine Bantu/Semiti
61
Upotrebom više molekularnih markera sa različitim učestalostima u evropskim i afričkim grupama, moguće je predvideti opseg neravnoteže vezanosti u afroameričkim grupama. na primer: učestalosti alela Null*1 lokusa FY razlikuju se u uzorcima afričke i evropske populacije za 99,9%, dok se alel 1 lokusa AT3, u istim uzorcima razlikuja za 58%. Na osnovu toga, mx je procenjena proporcija afro - predačkih alela u afro - američkoj mešavini nekog područja, i dobija se početni očekivani D = 0,06. utvrđeno je da je između ovih markera sadašnji D = 0,02 u istom području, što se slaže sa stvaranjem početnog D, mešavinom, sa razdaljinom lokusa c = 0,22, na hromozomu 1
62
Populacije nastale nedavnom mešavinom su korisne za mapiranje alela koji doprinosi riziku za nastanak oboljenja Učestalosti markera moraju da se razlikuju medju predačkim populacijama Studije mapiranja koje koriste mešane populacije su najkompletnije do sada za afroamerikanske i latino populacije i donele su rezultate za samo neke tipove na primer. kancera rizične varijante za kancer prostate na 8q24 kod afroamerikanaca
63
u studijama asocijacija spajanje populacija u uzorkovanju može dovesti do pogrešnih zaključaka o uzročnosti lokusa: stvaranje LD usled „mešanja“ dovodi do pogrešnih podataka o asocijacijama genomskih markera i fenotipa populacije mogu imati suptornosmerni LD usled prethodnog drifta, pa će se „mešanjem“ izgubiti asocijacije!
64
identifikovati LD i distribuciju haplotipova u genomu
osnovan 2002 cilj: opisati zajednički obrazac variranja humanih DNK sekvenci, ili, napraviti haplotipsku mapu genoma čoveka identifikovati LD i distribuciju haplotipova u genomu ovo je od značaja za: identifikaciju lokusa za složene osobine, kod čoveka, npr. dijabetes, kancer, moždani udar, koronarna oboljenja, depresija, astma razumevanje populacione istorije ljudi koja se oslikava u različitosti i sličnosti za dizajn i analizu studija genetičkih asocijacija koje zavise od informacije o LD kroz genom – bitno je znati koliki su i gde su predački segmenti hromozoma da bi se koristili odgovarajući SNP markeri 64
65
populacije različitog porekla (evropska, afrička, azijska); obrazac varuranja nadjen za 3,1 milion SNPs, a zatim subset od 1,6 milion SNPs kod još 7 populacija Cilj:identifikovati zajedničke i populaciono specifične haplotipove prva analiza osoba i to: 90 Yoruba osobe (30 trijada roditelji-dete) iz Ibadana, Nigerija 90 osoba (30 trijada) evropskog porekla iz Jute, USA 45 Han osoba iz Pekinga 44 Japanaca iz Tokija HapMap uzorci 65
66
Haplotipski blok je region za koji nema podataka o rekombinaciji
region u kome <0,05 poredjenja medju SNPs daje rekombinaciju blokovi obuhvataju 67-87% genoma, a 13-33% analiziranih regiona pokazuju puno veću raznovrsnost i rasutost i razlike medju jedinkama Granice hap blokova su na sličnim pozicijama kroz genom Hap blokovi variraju po veličini ali tipično je da su 5-15kb, osim u afričkom uzorku (7,3%) usled većeg broja generacija od osnivačkog, predačkog genoma četiri do šest haplotipa po bloku dovoljno da opiše sve hromozome.
67
značajno za studije složenih oboljenja preko LD; za svaki blok, nekoliko SNPs (tagovanih-SNPs) se može odrediti da pokažu koji blok hromozom nosi ne mora se raditi genotipizacija SNPs po bloku KonstrukcijaHapMap ide u 3 koraka. (a) SNPs se identifikuju u DNK više osoba. (b) susedni SNPs koji se zajedno nasledjuju se kompiliraju u "haplotipove." (c)"Tag" SNPs unutar haplotipova se identifikuju kao unikatni , karakteristični, za te haplotipove. Primer: genotipizacijom 3 SNPs na slici, može se identifikovati koji od 4 haplotipa je prisutan kod svake osobe
68
“triangle plot” : MET gen se sastoji iz 2 haplotipska bloka, jedan od 17 kb a drugi od 110 kb, sa parovima SNPs sa vrednošću D iznad specifičnog prag –date su ispod svakog para SNP, npr rs437 je SNP 1 a rs je SNP 2, i oni imaju vrednost 93 za D
69
LD je opšti fenomen genoma čoveka
LD je opšti fenomen genoma čoveka. Dat je deo genoma u kome su hap blokovi sa D = 1 odvojeni regionima u kojima se odigrala rekombinacija. Najveći blok ima 80 kb.
70
LD varira medju populacijama i koristi se za fino mapiranje
Kancer dojke i FGFR2 na populacijama Azije, Evrope, afroamerikanskoj dalo podatke o regionu koji doprinosi riziku u evropskoj Više lokusa koji doprinosi riziku sadrže nezavisno nastale varijante od kojih su neke poulaciono specifične istorija populacije je bitna: što je starija populacija, i što je duže zadržala veličinu manje je predačkih segmenata LD se obično javlja u izolovanim, ili skoro osnovanim manjim populacijama, ili nastaje mešavinom populacija
71
Pozitivne asocijacije usled LD mogu dati naizgled kontradiktorne rezultate:
pošto LD zavisi od populacione istorije, osobina može dati pozitivnu asocijaciju sa alelom A1 u jednoj izolovanoj populaciji, sa alelom A2 u drugoj, a ni sa jednim u velikoj, mešanoj.
72
Multietničko mapiranje
upotrebom HapMap podataka (faze 2 i 3) i dogovarajućih statistika odabir SNPs informativnih po poreklu ili većeg broja slučajno uzetih SNPs pomažu da se izbegne efekat stratifikacije “alelske učestalosti variraju medju populacijama”, ali više varijanti će biti često u multietničkoj populaciji nego u bilo kojoj posebno koja je čini Isto važi i za efekte na ispoljavanje oboljenja; u multietničkoj populaciji će biti jači signal nego u pojedinačnoj etničkoj grupi detekcija asocijacije zavisi od ukupne učestalosti, veličine uzorka i efekta, ali doprinos npr. retkih alela u malim grupama nije kumulativan u mešovitoj! GWAS sa multiplim populacijama nude velike mogućnosti, ali označavanje, karakterističnim markerima (”tagovanje”) je bitno pa genetička heterogenost može ostati problem... ako je tačna hipoteza “retke varijante/učestalo oboljenje”, spektar uzrokujućih varijanti će biti različit medju populacijama
73
HapMap faza 2 pruža panel referentnih (0,5-1 milion) SNPs za populacije single-continental porekla (Eu, Azija, Afrika) HapMap faza 3 uključuje genotipove za više populacija, Latino, Afroamero, ali je broj čestih SNPs manji nego u 2. NGS i 1000 Genome Project Disease researchers will combine the 1000 Genomes data with the genotype data in their disease GWA study to impute the genotypes in their samples for millions of additional variants beyond those they genotyped directly. They will do this computationally, with no genotyping cost. The additional genotype data will allow the researchers to localize the disease-associated regions more precisely. Once the disease-associated regions are identified, researchers will want to know all of the variants in those regions. The Project will provide data on almost all of the variants with a frequency of at least 1% in the populations studied. This will save disease researchers the time and expense of having to sequence their own samples. Although this list will not tell them which variants cause the increased risk for the disease, it will give them the set of suspects. They will then do experimental studies to determine which genes, genetic elements, and variants functionally cause the increased risk of disease. Many researchers will compare the allele frequencies and LD patterns that they find in their studies with those in the 1000 Genomes data. Researchers will also examine the 1000 Genomes data to study recombination, natural selection, and population structure and admixture.
74
zašto su česta oboljenja - česta?
mogu li GWAS otkriti potpuno genetičku podložnost kod složenih osobina? Komplikacije stvaraju CNV (varijacije broja kopija) u genomu zdravih osoba, kojiih ima puno, i pitanje je koliko SNPs studije mogu otkriti njihovu vezu sa oboljenima zašto su česta oboljenja - česta? Dve hipoteze, uzajamno se dopunjuju: učestalo oboljenje-učestala varijanta mutaciono selekciona hipoteza
75
često oboljenje - učestala varijanta (CDCV)
....kontradiktorno Asocijacije nadjene sa GWAS su ponovljive studije – to ukazuje da su neki predisponirajući faktori zaista predačke, učestale varijante Ali njihov umereni efekat ostavlja pitanje koliko podložnosti one objašnjavaju Kancer dojke..dvostruko učestaliji kod rodjaka prvog stepena obolele žene nego u opštoj populaciji, a GWAS su doprinele samo sa 3,65 ranijim studijama koje su otkrile lokuse koji doprinose 25% ruziku Teško je po ovoj hipotezi objasniti da su učestale varijante opstale hiljadama godina uz predačke haplotipske blokove u visokoj učestalosti pored prirodne selekcije.Moguće je ipak kada se radi o oboljenjima koja nastaju kasno u životu
76
Mutaciono - selekciona hipoteza
oboljenja su česta usled mutaciono-selekcionog balansa Varijante sa jakim efektom biće uklonjene iz populacije prebrzo da bi ostale u predačkim haplotipskim blokovima. Nastaće de novo mutacije stvarajući nove umereno štetne varijante najveći deo predispozicije za složene osobine može postojati heterogenost na nivou lokusa (različite osobe-mutacije u različitim genima istog puta) i alela (mutacije mogu biti kod različitih osoba u različitim delovima istog gena) Iako pojedinačna mutacija može biti retka,što otežava analize, ceo metabolički put može često izostati Najbolje rezultate daju studije sa sekvenciranim kandidat genima u velikom uzorku slučajeva i kontrola
Similar presentations
© 2025 SlidePlayer.com Inc.
All rights reserved.