Альтернативный сплайсинг – детская площадка эволюции

Slides:



Advertisements
Similar presentations
Tutorial 1 Biology background for the course. Genome sizes and number of genes OrganismGenome SizeNo. of genes E. coli4.6 Mb~4,300 genes Baker’s Yeast12.
Advertisements

Two short pieces MicroRNA Alternative splicing.
Alternative splicing: A playground of evolution Mikhail Gelfand Research and Training Center for Bioinformatics Institute for Information Transmission.
August 19, 2002Slide 1 Bioinformatics at Virginia Tech David Bevan (BCHM) Lenwood S. Heath (CS) Ruth Grene (PPWS) Layne Watson (CS) Chris North (CS) Naren.
IV семестр «Функция и эволюция» БЛОК 1 «Эволюция» – 4 занятия Молекулярная филогенетика. Задачи и подходы. Лекция- семинар, (АБР) Реконструкция.
Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006.
Systems Biology Existing and future genome sequencing projects and the follow-on structural and functional analysis of complete genomes will produce an.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
GENE MYERS Sequence Comparison Wizard. Basics Full name: Eugene ‘Gene’ Wimberly Myers, Jr. Nationality: American B.S. in Mathematics, Cal Tech Ph.D. in.
Генная инженерия.
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Геном человека. ПРОГРАММА «ГЕНОМ ЧЕЛОВЕКА» Начата в 1998 году К 2000 году геном человека был прочтен с точностью в 10 раз ниже необходимой ( не более.
Функции IV. Биоинформатические ресурсы для работы с мембранными белками А.Б.Рахманинова (3 и 4 апреля 2007г.)
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
1 Alternative Splicing. 2 Eukaryotic genes Splicing Mature mRNA.
Михаил Налётов Активные продажи на сайте. Может ли ваш сайт работать еще эффективнее?
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
А.Б. Рахманинова (13 апреля 2010 г.) Факультет Биоинженерии и Биоинформатики, 2 курс, весенний семестр Функции Мембранные белки. Транспортные белки.
Мобильные ретроэлементы в геноме эукариот.. Ревертаза. РНК-зависимая ДНК- полимераза (ревертаза) способна катализировать синтез ДНК-копии (кДНК) на РНК-матрице.
КОМПЬЮТЕРНЫЙ АНАЛИЗ КОНСЕРВАТИВНОСТИ АЛЬТЕРНАТИВНОГО СПЛАЙСИНГА В ОРТОЛОГИЧНЫХ ГЕНАХ Государственный научно-исследовательский институт генетики и селекции.
Сравнительная геномика регуляторных и метаболических систем М. Гельфанд ИППИ РАН Отчетная конференция программы «Моекулярная и клеточная биология» Апрель.
Введение в эволюционную и медицинскую геномику, часть II ФББ МГУ, весна 2008.
Как найти последовательность, кодирующую Ваш белок? Как найти последовательность ДНК, кодирующую Ваш белок: – Ссылки из белковых баз данных – Прямой поиск.
Binding affinity between HP1-HOAP interacting protein (HipHop) and telomere maintenance proteins Modigliani & Verrocchio in Drosophila melanogaster through.
Bioinformatics Original definition (1979 by Paulien Hogeweg): “application of information technology and computer science to the field of molecular biology”
LINGUISTIC TOOLS ЛИНГВИСТИЧЕСКИЕ ИНСТРУМЕНТЫ Лекция 1.
Множественное выравнивание С.А.Спирин, весна
Обработка исключений в C# Единая техника обнаружения ошибок времени выполнения и передачи информации о них.
More regulating gene expression. Fig 16.1 Gene Expression is controlled at all of these steps: DNA packaging Transcription RNA processing and transport.
Gene Finding Genome Annotation. Gene finding is a cornerstone of genomic analysis Genome content and organization Differential expression analysis Epigenomics.
Potential relations between two drosophila proteins JORDAN DAVIS MENTOR: DR. MIKE GROTWIEL BNFO 300.
Computational Molecular Biology Biochem 218 – BioMedical Informatics Gene Regulatory.
Genome projects and model organisms Level 3 Molecular Evolution and Bioinformatics Jim Provan.
Shankar Subramaniam University of California at San Diego Data to Biology.
Вторичные структуры 2012 Часть 2 Анализ трехмерных структур 1.
Science & Technology Centers Program National Science Foundation Science & Technology Centers Program Bryn Mawr Howard University MIT Princeton Purdue.
Introduction to Bioinformatics Spring 2002 Adapted from Irit Orr Course at WIS.
BIOINFORMATICS IN BIOCHEMISTRY Bioinformatics– a field at the interface of molecular biology, computer science, and mathematics Bioinformatics focuses.
Molecular Biology Primer. Starting 19 th century… Cellular biology: Cell as a fundamental building block 1850s+: ``DNA’’ was discovered by Friedrich Miescher.
More regulating gene expression. Combinations of 3 nucleotides code for each 1 amino acid in a protein. We looked at the mechanisms of gene expression,
10/17/05 D Dobbs ISU - BCB 444/544X: Genes & Genomes1 10/17/05 Genes & Genomes (formerly Gene Prediction - 1)
Современное состояние геномики и биоинформатики бактерий Краткий обзор направлений исследований.
Alternative splicing: A playground of evolution Mikhail Gelfand Research and Training Center for Bioinformatics Institute for Information Transmission.
Cell Signaling Ontology Takako Takai-Igarashi and Toshihisa Takagi Human Genome Center, Institute of Medical Science, University of Tokyo.
Web Databases for Drosophila Introduction to FlyBase and Ensembl Database Wilson Leung6/06.
Alternative splicing: A playground of evolution Mikhail Gelfand Research and Training Center for Bioinformatics Institute for Information Transmission.
Alternative splicing: A playground of evolution Mikhail Gelfand Research and Training Center for Bioinformatics Institute for Information Transmission.
Chapter 1 Introduction.
Evolution of alternative splicing Mikhail Gelfand Institute for Information Transmission Problems, Russian Academy of Sciences Workshop “Gene Annotation.
Alternative splicing: A playground of evolution Mikhail Gelfand Research and Training Center for Bioinformatics Institute for Information Transmission.
Gene models and proteomes for Saccharomyces cerevisiae (Sc), Schizosaccharomyces pombe (Sp), Arabidopsis thaliana (At), Oryza sativa (Os), Drosophila melanogaster.
TSC1/Hamartin and Facial Angiofibromas Biology 169 Ann Hau.
1 What forces constrain/drive protein evolution? Looking at all coding sequences across multiple genomes can shed considerable light on which forces contribute.
Snapshot of iron response in Shewanella oneidensis by gene network reconstruction Emily Simso and Ronald Legaspi Departments of Biology and Computer Science.
The Central Dogma of Molecular Biology DNA  RNA  Protein  Trait.
Investigations of HIV-1 Env Evolution Evolutionary Bioinformatics Education: A BioQUEST Curriculum Consortium Approach Grand Valley State University August.
MCB 7200: Molecular Biology
University of California at San Diego
PBIO 4500/5500: Biotechnology and Genetic Engineering
Emerging Challenges in Information Theory for Life Sciences
more regulating gene expression
University of California at San Diego
Genomes and Their Evolution
Department of Chemical Engineering
Introduction to Bioinformatics
Schematic representation of the relationships between acid resistance (urease activity and urea transport), nitrogen metabolism (ammonia production), metal.
Presentation transcript:

Альтернативный сплайсинг – детская площадка эволюции М.Гельфанд Институт проблем передачи информации им. А.А.Харкевича РАН «Молекулярная и клеточная биология», 2 апреля 2007

Оценки % альтернативно сплайсируемых генов млекопитающих (по году публикации) Человек (выборка из генома) Все гены Человек (полные хромосомы) Только гены с ≥2 экзонами Мышь (выборка из генома) Гены с высоким покрытием EST

Значение альтернативного сплайсинга Функциональное: поддержание белкового разнообразия Человек: ~30.000 генов, >100.000 белков поддержание белкового единообразия Например, секретируемые, мембранные и цитоплазматические изоформы регуляция? Эволюционное

Общий план Эволюция альтернативной экзон-интронной структуры млекопитающие: человек, мышь, собака двукрылые насекомые: Drosophila melanogaster, D. pseudoobscura, Anopheles gambiae Скорость эволюции и тип отбора в постоянных и альтернативных областях Человек и мышь D. melanogaster и D. pseudoobscura человек-шимпанзе vs. человеческие SNP Альтернативный сплайсинг и структура белка

Элементарные альтернативы Кассетный экзон Альтернативный донорный сайт Альтернативный акцепторный сайт И т.д.: взаимоисключающие экзоны, удержанные интроны, сложные альтернативы

EDAS: альтернативный сплайсинг генов человека 20809 генов; 114568 мРНК; 91835 белков; 51713 альтернатив, из них 31746 элементарных

Альтернативная экзон-интроная структура генов млекопитающих Тройки ортологичных генов: человек-мышь-собака Следим за судьбой (консервативностью) альтернатив человека в геномах мыши и собаки

Потеря альтернативы в геноме мыши общий предок

Потеря альтернативы в геноме собаки (хотя теоретически возможно возникновение в общем предке приматов и грызунов) общий предок

Появление альтернативы в геноме человека (или ошибка сплайсинга, или экспериментальный шум) Common ancestor

Альтернативы в генах человека, отсутствующие в генах мыши – реальны ли они? Неконсервативные альтернативы человека: шум? Консервативные альтернативы

Добавим геном собаки Неконсервативные альтернативы человека: шум? Неконсервативные альтернативы человека: шум? Human-specific alternatives: noise? потери у собаки потери у мыши Conserved alternatives Консервативные альтернативы

Наблюдения нет сдвига рамки сдвиг рамки Часто вставляемые экзоны консервативны независимо от того, сбивают ли они рамку Редко вставляемые экзоны менее консервативны, особенно сбивающие рамку Много геном-специфичных потерь Больше в мыши, чем в собаке Чаще для экзонов, сбивающих рамку Тем не менее, ~40% редко вставляемых экзонов консервативны хоть в одном экзоне нет сдвига рамки сдвиг рамки

Консервативность белок-кодирующих областей в генах насекомых Технически сложнее (сложности с выравниванием), но наблюдения те же: альтернативные сегменты менее консервативны, чем константные Константные сегменты Альтер-нативные сегменты D. melanogaster – D. pseudoobscura 97% 75-80% D. melanogaster – Anopheles gambiae 77% ~45%

Консервативность элементарных альтернатив D. melanogaster в генах D Консервативность элементарных альтернатив D.melanogaster в генах D. pseudoobscura голубой – сохранились точно зеленый – вставка интрона в D.ps. (или потеря в D.mel.) желтый – вставка интрона в D.mel.(млм потеря в D.ps.) oранжевый – множественные вставки/потери красный – неконсервативно Удержанные интроны наименее консервативны (все ли они функциональны?) Взаимоисключащие экзоны столь же консервативны, как конститутивные

Консервативность элементарных альтернатив D Консервативность элементарных альтернатив D.melanogaster в генах Anopheles gambiae голубой – сохранились точно зеленый – вставка интрона в Anopheles (или потеря в Drosophila) желтый – вставка интрона в Drosophlia (млм потеря в Anopheles) oранжевый – множественные вставки/потери красный – неконсервативно ~30% вставок у дрозофилы, ~10% вставок у комара (вообще, у него примерно 3 интрона на ген, а у дрозофилы примерно 4) Почти нет вставок интронов во взаимоисключающие экзоны

Скорость эволюции и тип отбора в альтернативных и константных областях Пары ортологичных генов человек и мышь D. melanogaster и D. pseudoobscura Отношение скорости синонимичных и несинонимичных замен (dn/ds): большая доля несинонимичных замен (изменяющих аминокислоту) => слабый стабилизирующий отбор или отбор на изменчивость (в такой постановке неразличимы)

Гены человека и мыши: несимметричная гистограмма dn/ds(const)–dn/ds(alt) Черный: «тень» левой части. В большей части генов dn/ds(alt) > dn/ds(const), особенно в области больших значений. Т.е. в альтернативных областях слабее стабилизирующий отбор

Гены Drosophila: слабее отбор в альтернативных областях? Больше замен в альт. обл. Равный уровень замен Больше замен в конст. обл. В большинстве генов, уровни и синонимичных, и несинонимичных замен выше в альтернативных областях по сравению с конститутивными

Альтернативные области изменяются быстрее, чем константные 1 Альтернативные области изменяются быстрее, чем константные dN/dS dS dS dN/dS dN dN

Ослабление стабилизирующего отбора в альтернативных областях 1 Ослабление стабилизирующего отбора в альтернативных областях dN/dS dS dS dN/dS dN dN

1,5 dN/dS dN(AI)/dS(AI) = 1,43 Положительный отбор во внутренних альтернативных областях генов Drosophila dS dN

Тест МакДональза-Крейтмана: положительный отбор в минорных альтернативных областях Сравнение различий между генами человека и шимпанзе со SNP человека Экзоны, консервативные в генах мыши и/или собаки Гены с ≥60 ESTs Оценка значимости – тест Фишера Pn/Ps (SNP) Kn/Ks (геномы) разница значим. Конст. 0.72 0.62 – 0.10 Мажор. 0.78 0.65 – 0.13 0.5% Минор. 1.41 1.89 + 0.48 0.1% Минорные изоформы: Больше несинонимичных SNP: Pn(alt_minor)=.12% >> Pn(const)=.06% Больше несинонимичн. замен: Kn(alt_minor)=.91% >> Kn(const)=.37% Положительный отбор (не просто ослабление стабилизирующего): α = 1 – (Pa/Ps) / (Ka/Ks) ~ 25% позиций Аналогичные результаты для всех консервативных альтернатив или для всех генов с высоким покрытием EST

Попытка синтеза Альтернативный сплайсинг часто видоспецифичен «молодые» альтернативные изоформы часто тканеспецифичны … но все же функционален В альтернативных областях снижен уровень стабилизирующего отбора избыток несинонимичных замен (по сравнению с синонимичными) В альтернативных областях действует положительный отбор избыток несинонимичных замен (по сравнению с SNP) Альтернативный сплайсинг часто тасует белковые домены Таким образом, альтернативный сплайсинг – это способ попробовать новые формы белков, не жертвуя старыми

Планы: много дрозофил; млекопитающие (ENCODE)

Что делать? Оценить не только скорость потерь альтернатив, но и скорость приобретений (отличая молодые изоформы от ошибок сплайсинга) Следить за: функциональность: транслируемые / нарушающие рамку уровень: частые / редкие изоформы паттерн тканеспецифичности (?) Тип альтернативы: N-концевая / внутренняя / C-концевая Альтернативный сплайсинг в одном геноме / конститутивный – в другом (данные с микрочипов) Эволюция регуляции альтернативного сплайсинга Ошибки сплайсинга и мутации: удержаные интроны, пропущенные экзоны, скрытые сайты

Благодарности Обсуждения Данные Поддержка Евгений Кунин (NCBI) Всеволод Макеев (ГосНИИГенетика) Дмитрий Петров (Stanford) Дмитрий Фришман (GSF, TUM) Данные King Jordan (NCBI) Поддержка РАН (программа «Молекулярная и клеточная биология») РФФИ Howard Hughes Medical Institute INTAS

Авторы Андрей Миронов (МГУ, ИППИ) Рамиль Нуртдинов (МГУ) – человек/мышь/собака Дмитрий Малько (ГосНИИГенетика) – дрозофилы/комар Екатерина Ермакова (ИППИ) – Kn/Ks Василий Раменский (ИМБ) – SNP Ирена Артамонова (ИОГен) – человек/мышь, график из обзора Алексей Неверов (ГосНИИГенетика) – функциональность изоформ

Основные публикации 10,1 D.B.Malko, V.J.Makeev, A.A.Mironov, M.S.Gelfand (2006) Evolution of the exon-intron structure and alternative splicing in fruit flies and malarial mosquito genomes. Genome Research. 16: 505-509 . 4,1 E.O.Ermakova, R.N.Nurtdinov, M.S.Gelfand (2006) Faster evolutionary rate in alternatively spliced regions of mammalian genes. BMC Genomics. 7: 84. 0,36 Е.О.Ермакова, Д.Б.Малько, М.С.Гельфанд (2006) Эволюционные отличия альтернативных и постоянных белок-кодирующих участков альтернативно сплайсируемых генов Drosophila. Биофизика. 51: 581-588. 0,36 Р.Н.Нуртдинов, А.Д.Неверов, Д.Б.Малько, И.А.Космодемьянский, Е.О.Ермакова, В.Е.Раменский, А.А.Миронов, М.С.Гельфанд (2006) EDAS – база данных альтернативно сплайсированных генов человека. Биофизика. 51: 589–592. книга A.D.Neverov, A.A.Mironov, M.S.Gelfand (2006) Similarity-based gene recognition. Handbook of Computational Molecular Biology (Chapman & Hall/CRC), Chapter 2. книга M.S.Gelfand (2006) Computational analysis of alternative splicing. Handbook of Computational Molecular Biology (Chapman & Hall/CRC), Chapter 16. В работе: Nurtdinov et al. Conserved and species-specific alternative splicing in mammalian genomes Ramensky et al. Positive selection in alternatively spliced regions of human genes

Публикации в других областях Системная биология 10,2 V.Spirin, M.S.Gelfand, A.A.Mironov, L.A.Mirny (2006) Metabolic network in the evolutionary context: multi-scale structure and modularity. Proceedings of the National Academy of Sciences of USA. 103: 8774-8779. 0,89 А.В.Любецкая, Л.И.Рубанов, М.С.Гельфанд (2006) Потоковая модель метаболизма аминокислот кишечной палочки. Биохимия. 71: 1544-1549. Сравнительная геномика и эволюция регуляторных систем 5,9 C.Yang, D.A.Rodionov, X.Li, O.N.Laikova, M.S.Gelfand, O.Zagnitko, M.F.Romine, A.Y.Obraztsova, K.H.Nealson, A.L.Osterman (2006) Comparative genomics and experimental characterization of N-acetylglucosamine utilization pathway of Shewanella oneidensis. Journal of Biological Chemistry. 281: 29872-29885. 4,2 D.A.Rodionov,  P.Hebbeln, M.S.Gelfand, T.Eitinger (2006) Comparative and functional genomic analysis of prokaryotic nickel and cobalt uptake transporters: Evidence for a novel group of ATP-Binding cassette transporters. Journal of Bacteriology. 188: 317-327. 2,1 D.A.Rodionov, M.S.Gelfand (2006) Computational identification of BioR, transcriptional regulator of biotin metabolism in alpha-proteobacteria, and its binding signal. FEMS Microbiology Letters. 255: 102-107. 0,44 Н.А.Дорощук, М.С.Гельфанд, Д.А.Родионов (2006) Регуляция метаболизма азота у грамположительных бактерий. Молекулярная биология. 40: 919-926. 2,2 A.E.Kazakov, E.A.Permina, O.V.Kalinina, M.S.Gelfand (2006) Comparative genomics of regulation of heavy metal resistance in Eubacteria. BMC Microbiology. 6: 49. пока нет D.A.Rodionov, M.S.Gelfand, J.D.Todd, A.R.J.Curson, A.W.B.Johnston (2006) Comparative reconstruction of transcriptional network controlling iron and manganese homeostasis in alpha-proteobacteria. PLoS Computational Biology. 2: e163. нет G.Y.Kovaleva, G.A.Bazykin, M.Brudno, M.S.Gelfand (2006) Comparative genomics of transcriptional regulation in yeasts and its application to identification of a candidate alpha-isopropylmalate transporter. Journal of Bioinformatics and Computational Biology. 4: 981-998. Структуры и функции белков 4,7 O.V.Kalinina, M.S.Gelfand (2006) Amino acid residues that determine functional specificity of NADP- and NAD-dependent isocitrate and isopropylmalate dehydrgenases. Proteins. 64: 1001-1009. нет N.S.Sadovskaya, R.A.Sutormin, M.S.Gelfand (2006) Recognition of transmembrane segments in proteins: review and consistency-based benchmarking of internet servers. Journal of Bioinformatics and Computational Biology. 4: 1033-1056. Обзоры 9,6 M.S.Gelfand (2006) Evolution of transcriptional regulation networks in microbial genomes. Current Opinion in Structural Biology. 16: 420-429. 0,44 М.С.Гельфанд (2006) Цис-регуляторные структуры РНК бактерий. Молекулярная биология. 40: 609-619.