Presentation is loading. Please wait.

Presentation is loading. Please wait.

Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006.

Similar presentations


Presentation on theme: "Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006."— Presentation transcript:

1 Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006

2 K a, K n, K s, d N, d S : этимология K  constant d  distance S, s  synonymous N, n  nonsynonymous a  amino acid altering

3 альтернативный сплайсинг вторичная структура РНК структура белков сайты связывания … Нуклеотидные замены в кодирующих областях генов распределены неравномерно. Нуклеотидные сайты испытывают различную функциональную нагрузку:

4 Типичная задача Сравнить скорость и паттерн эволюции нескольких групп кодирующих участков генома, например: постоянно и альтернативно сплайсируемые участки гены, экспрессируемые в сердце и гены, экспрессируемые в пятках

5 Точечные замены в кодирующей области синонимичныенесинонимичные полезные нейтральные вредные

6 Универсальный генетический код TCAG T TTTPheTCTSerTATTyrTGTCysT TTCPheTCCSerTACTyrTGCCysC TTALeuTCASerTAAСтопTGAСтопA TTGLeuTCGSerTAGСтопTGGTrpG C CTTLeuCCTProCATHisCGTArgT CTCLeuCCCProCACHisCGCArgC CTALeuCCAProCAAGlnCGAArgA CTGLeuCCGProCAGGlnCGGArgG A ATTIleACTThrAATAsnAGTSerT ATCIleACCThrAACAsnAGCSerC ATAIleACAThrAAALysAGAArgA ATGMetACGThrAAGLysAGGArgG G GTTValGCTAlaGATAspGGTGlyT GTCValGCCAlaGACAspGGCGlyC GTAValGCAAlaGAAGluGGAGlyA GTGValGCGAlaGAGGluGGGGlyG

7 Что такое d N и d S ? d S (d N ) — это число (не)синонимичных замен, фиксировавшихся в кодирующей последовательности в процессе эволюции, поделенное на суммарный (не)синонимичный потенциал последовательности. Это функции двух моментов времени (t 0,t), но существующие методы позволяют оценить эти функции только если t «сейчас», а t 0 — момент расхождения двух ортологов или дупликация.

8 А остальные? K a = K n = d N K s = d S ω = d N /d S = K a /K s = K n /K s ω не зависит от времени, это отношение скоростей

9 Нейтральные замены: на что делим? Не все нуклеотидные замены в геноме нейтральны. Чтобы извлекать информацию из количества «активных» замен, нужно нормировать их количество на «фоновый уровень» нейтральных замен. Какие замены считаются нейтральными - это параметр эволюционной модели. Нуклеотидные замены, которые на практике считают нейтральными: замены в некодирующих участках: интронах, межгенных областях, в т.ч. псевдогенах и повторах; синонимичные замены в кодирующих областях.

10 d N /d S = ω μ — фоновый уровень мутаций ρ — давление отбора на уровне РНК ω — давление отбора на уровне белка d N = ωρμ d S = ρμ

11 d N /d S критерий: отбор на уровне аминокислотной последовательности d N /d S < 0 отрицательный отбор d N /d S = 0 нейтральная эволюция d N /d S > 0 положительный отбор

12 «Жадные» (parsymony) оценки d N и d S Основанные на эволюционных путях: Nei & Gojobori 1986 (однопараметрическая модель) Ina 1995 (двупараметрическая модель)

13 «Жадные» (parsymony) оценки d N и d S Основанные на учёте вырожденности позиций в кодонах: Pamilo - Bianchi - Lee 1993 Comeron 1995 ATTIleACTThrAATAsn ATCIleACCThrAACAsn ATAIleACAThrAAALys ATGMetACGThrAAGLys Третья позиция кодона ATG невырождена, AAA — 2-вырождена, ATA — 3-вырождена, ACA — 4-вырождена

14 «Наиболее правдоподобные» (maximum likelyhood) оценки d N и d S Yang & Nielsen 2000 PAML (http://abacus.gene.ucl.ac.uk/software/paml.html) Единица эволюции — кодон.

15 Метод Ины (Ina 1995) простой, но основную «асимметрию» учитывает быстро работает на длинных выравниваниях, позволяет делать bootstrap и оценивать точность допускает усовершенствования

16 Метод Ины: подготовка выравнивания выравниваем две достаточно длинных кодирующих нуклеотидных последовательности (≥ 300 п.н.) кодоны с делециями выбрасываем

17 Метод Ины: допущения рассматриваемые последовательности ортологи или паралоги из одного организма с момента расхождения организмов (для ортологов) или с момента дупликации (для паралогов) две рассматриваемые последовательности эволюционировали с одинаковой скоростью

18 Метод Ины: (не)синонимичный потенциал Каждая позиция нетерминального кодона обладает синонимичным потенциалом s и несинонимичным потенциалом n, s+n=1. В общем случае (не)синонимичный потенциал позиции в кодоне — это вероятность получить (не)синонимичную замену кодона мутацией нуклеотида в этой позиции. Если замена основания в одной из позиций кодона (при прочих фиксированных) приводит к несинонимичной замене кодона, эта позиция называется несинонимичной, для неё s=0, n=1. Если же любая замена основания в данной позиции приводит к синонимичной замене кодона, эта позиция называется синонимичной, для неё s=1, n=0.

19 Метод Ины: двупараметрическая модель эволюции (Kimura)  — скорость транзиций  — скорость трансверсий R =  / 

20 Метод Ины: s и n могут быть выражены через R

21 Метод Ины: число нуклеотидных различий между кодонами

22 Метод Ины: оценивание dN, dS и ω S * — среднее арифметическое суммарных синонимичных потенциалов выравненных последовательностей S Ts * — количество транзиций, наблюдаемых в выравнивании S Tv * — количество наблюдаемых трансверсий Наблюдаемые частоты синонимичных различий — транзиций и трансверсий — в синонимичных позициях: P S * = S Ts * /S * Q S * = S Tv * /S * Оценка d S * для d S получается применением к P S * и Q S * поправки Кимуры на множественные замены: d S * = –1/2 ln(1 – 2 P S * – Q S * ) – 1/4 ln(1 –2 Q S * ) Оценка d N * для d N строится аналогично. Параметр ω оценивается как d N * /d S *.

23 Метод Ины: оценивание R =  /  R = 2 ln(1 – 2 P 3 * – Q 3 * ) / ln(1 –2 Q 3 * ) – 1 P 3 * и Q 3 * — наблюдаемые частоты транзиций и трансверсий в третьих позициях кодонов выравнивания

24 Нуклеотидные замены в постоянных и альтернативных участках альтернативно сплайсируемых генов человека и мыши dNdN Участки кодирующей области: C — постоянные A — альтернативные AN — N-концевые альтернативные AI — внутренние альтернативные AC — С-концевые альтернативные Слева — гены разделены на 3 равные группы по скорости Справа — все альтернативно сплайсируемые гены (3029 штук)

25 Нуклеотидные замены в постоянных и альтернативных участках альтернативно сплайсируемых генов человека и мыши dSdS

26 ω


Download ppt "Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006."

Similar presentations


Ads by Google