Биоинформатика, или молекулярная биология in silico М.Гельфанд Семинар в ИППИ 7 апреля 2006.

Slides:



Advertisements
Similar presentations
From computer to the wet lab and back Comparative genomics in the discovery of a family of bacterial transporters with a new mode of action Mikhail Gelfand.
Advertisements

Сравнительная геномика – окончание М.Гельфанд «Сравнительная геномика и системная биология» БиБи, 4 курс + ШБ, 2 год + ПФУ весна 2013.
Банки информации в молекулярной биологии С.А.Спирин 11/III – 2006.
Сравнительная геномика и метаболическая реконструкция бактериальных патогенов Михаил Гельфанд Институт проблем передачи информации РАН, Учебно-научный.
Биоинформатика.
Компьютерный анализ белковой последовательности Анализируют только аминокислотную последовательность белка, пренебрегают взаимодействием между боковыми.
Биоинформатика Исследование информационных процессов в биологических системах (клетках, органах, организме, популяции). Изучение и внедрение в компьютерную.
Курс «Биоинформатика» ф-т биоинженерии и биоинформатики МГУ А.В. Алексеевский. Использованы материалы лекций А.Б.Рахманиновой и С.А.Спирина.
Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Генная инженерия.
Веремьёва Е. И.. Радиобиология — это самостоятельная комплексная, фундаментальная наука, состоящая из многих научных направлений, изучающая действие ионизирующих.
Подготовила: Колегова Ю. С. Группа: ЭБ Б “ЧЕРНОБЫЛЬ И ЕГО ЖЕРТВЫ”
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Функции II. Классификация. Зачем? А.Б.Рахманинова (6 марта 2006 г.)
Создание сервиса синхронизации разнородных баз данных Допущена к защите зав. кафедрой: д.ф.м.н., профессор Терехов А.Н. Научный руководитель: доцент Графеева.
Функции IV. Биоинформатические ресурсы для работы с мембранными белками А.Б.Рахманинова (3 и 4 апреля 2007г.)
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Негеномные данные М.Гельфанд «Сравнительная геномика» БиБи 4 курс, Осень 2009.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Разработка программного обеспечения (Software Engineering) Часть 2. Создание ПО.
Генетика пола, сцепленное с полом наследование.. Мужские и женские особи отличаются наличием половых хромосом. У человека: Женский пол – гомогаметен,
Ответы на вопросы 7 июля « Подготовка паспортов безопасности» тел: (495) Экологический Синтезирующий.
BLAST Что такое выравнивание Выравнивание 2х последовательностей
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
Структура белка Как предсказать вторичную структуру белка? Как найти и анализировать пространственную структуру, если она известна? Что можно делать, если.
1 Ребенок в Сети. Ребенок играет?
EDCWiki Electronic Document Circulation using wiki Система электронного документооборота на основе wiki Участники: Кузьмин Константин, Цыцулин Виталий.
"The European Molecular Biology Open Software Suite"
Мобильные ретроэлементы в геноме эукариот.. Ревертаза. РНК-зависимая ДНК- полимераза (ревертаза) способна катализировать синтез ДНК-копии (кДНК) на РНК-матрице.
Множественные выравнивания как метод исследования Материалы к занятиям IV блока курса биоинформатики, 2006 А.Б.Рахманинова.
Д.А. Равчеев (14 апреля 2009 г.) Факультет Биоинженерии и Биоинформатики, 2 курс, весенний семестр Функции Трансмембранные белки.
Что можно делать с одиночной последовательностью ДНК? Как исключить векторные фланки? Рестрикционная карта Вашей последовательности Дизайн праймеров Анализ.
Сравнительная геномика регуляторных и метаболических систем М. Гельфанд ИППИ РАН Отчетная конференция программы «Моекулярная и клеточная биология» Апрель.
Высокопроизводительные вычисления в биоинформатике 1.
Swiss-Prot – одна из первых баз данных белковых последовательностей, “gold standard” белковой аннотации. Аннотация выполнена вручную группой профессиональных.
Методы анализа данных. Статистическая проверка гипотез.
BioUML интегрированная расширяемая среда для моделирования биологических систем Biosoft.Ru Лабоработория Биоинформатики КТИ ВТ СО РАН
Демидов А.В г. Операционные системы Лекция 4 Работа с файлами.
Учитель биологии ГОУ ЦО №1470 Селезнёва И.Г.. « Рост, размножение, подвижность, возбудимость, способность реагировать на изменения внешней среды – все.
Как найти последовательность, кодирующую Ваш белок? Как найти последовательность ДНК, кодирующую Ваш белок: – Ссылки из белковых баз данных – Прямой поиск.
Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
Функциональная аннотация М.Гельфанд «Сравнительная геномика» БиБи, набор 2004, 4 курс осень 2007.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
TMG Tel: 8 (495) Fax: 8 (477) Technology Management Group ООО «TMG» PayKeeper.
Что такое биоинформатика? Банк SwissProt С.А.Спирин 7, 8,10 февраля 2006 г., ФББ МГУ.
Системная биология М.С.Гельфанд Учебно-научный центр «Биоинформатика» Институт проблем передачи информации РАН Международная школа «Биоинформатика, геномика,
OAUTHОРИЗАЦИЯ И API СОЦИАЛЬНЫХ СЕТЕЙ Артём Курапов.
Comparative genomics: functional characterization of new genes and regulatory interactions using computer analysis Mikhail Gelfand Institute for Information.
Evolution of bacterial regulatory systems Mikhail Gelfand Institute for Information Transmission Problems, RAS BGRS-2004, Novosibirsk.
Small Talk Cell-to-Cell Communication in Bacteria.
Comparative genomics and metabolic reconstruction of bacterial genomes Mikhail S. Gelfand Meeting of HHMI International Research Scholars Tallinn, 2004.
I. Introduction A biosynthesis of L-lysine in various organisms is associated with an amazing diversity of pathways and enzymes involved in metabolism.
Современное состояние геномики и биоинформатики бактерий Краткий обзор направлений исследований.
Comparative genomics and metabolic reconstruction of bacterial pathogens Mikhail Gelfand Institute for Information Transmission Problems, RAS GPBM-2004.
The V. fischeri Autoinducer N-(b-ketocaproyl)-L-homoserine lactone.
Exploiting Gene Clusters to Curate Annotations October, 2003 Ross Overbeek, Fellowship for Interpretation of Genomes (FIG)
I. Prolinks: a database of protein functional linkage derived from coevolution II. STRING: known and predicted protein-protein associations, integrated.
Ribonucleotide reductases (RNRs) catalyse the reduction of ribonucleotides to their corresponding 2`-deoxyribonucleotides and therefore play an essential.
Cover illustration: Evolution of transcriptional regulatory networks in prokaryotes. See the article by Madan Babu et al. in this issue.
Gtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattacca gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta.
FLiPS Functional Linkage Prediction Service.
Network recovery for isoenzymes and protein complexes
10 интересных фактов о Японии и Японцах. В состав Японии входит островов. При этом четыре наиболее крупных из них - Кюсю, Хонсю, Хоккайдо и Сикоку,
Presentation transcript:

Биоинформатика, или молекулярная биология in silico М.Гельфанд Семинар в ИППИ 7 апреля 2006

Пропаганда 1 красный: статьи синий: последовательности

Анализ индивидуальных генов Поиск родственных белков в банках последовательностей – перенос функции от гомологов Функциональные сайты (каталитические центры) Функциональные участки (трансмембранные сегменты, сигнальные пептиды и т.п.)

Анализ на уровне индивидуальных генов даёт возможность охарактеризовать 50-75% генов в новом геноме Но: ~100 универсально отсутствующих генов (нет ни одного известного гена для известной функции) множество функций, для которых неизвестны представители в больших таксонах в каждом геноме ~5-10% консервативных генов с неизвестной функцией трудно предсказывать специфичность в мультигенных семействах (транспортёры, факторы транскрипции) нельзя найти что-то принципиально новое

Characterized experimentally “Hypothetical” Function inferred by similarity only “Conserved hypothetical” How much do we know about the Escherichia coli proteome?

Пропаганда – 2 Полные геномы

Haemophilus influenzae, 1995

Vibrio cholerae, 2000

Сравнительно-геномные подходы Positional clustering Phylogenetic profiling Gene fusions

Metabolic pathways

Functionally dependent genes tend to cluster on chromosomes in many different organisms

More genomes (stronger links) => highly significant clustering

… особенно в линейных путях (справа)

Распределение уровней связи (бимодальное для изоферментов, монотонное для субъединиц)

Phyletic profiles in the Phe/Tyr pathway

Arithmetics of phyletic patterns 3-dehydroquinate dehydratase (EC ): Class I (AroD) COG0710 aompkzyq---lb-e----n---i-- Class II (AroQ) COG y-vdr-bcefghs-uj---- Two forms combined aompkzyqvdrlbcefghsnuj-i enolpyruvylshikimate 3-phosphate synthase (EC ) AroA COG0128 aompkzyqvdrlbcefghsnuj-i-- + Shikimate dehydrogenase (EC ): AroE COG0169 aompkzyqvdrlbcefghsnuj-i-- Shikimate kinase (EC ): Typical (AroK) COG yqvdrlbcefghsnuj-i-- Archaeal-type COG1685 aompkz Two forms combined aompkzyqvdrlbcefghsnuj-i-- Chorismate synthase (EC ) AroC COG0082 aompkzyqvdrlbcefghsnuj-i--

STRING: trpB – fusions

Утилизация пектина E. chrysanthemi

… и транспорт олигогалактуронатов E. chrysanthemi Y. pestis K. pneumoniae

YpaA: транспортёр рибофлавина 5 предсказанных ТМ-сегментов => потенциальный транспортёр регуляторный RFN-элемент => ко- регуляция с генами метаболизма рибофлавина => транспорт рибофлавина или предшественника S. pyogenes, E. faecalis, Listeria: есть ypaA, нет генов биосинтеза рибофлавина => транспорт рибофлавина Предсказание: YpaA – рибофлавиновый транспортёр (Gelfand et al., 1999) Проверка: YpaA переносит рибофлавин (генетический анализ, Кренева и др., 2000 ) ypaA регулируется рибофлавином (анализ экспрессии на микрочипах, Lee et al., 2001; прямой эксперимент, Winkler et al., 2002 ).

Метаболическая реконструкция пути биосинтеза лизина: Идентификация пути ацетилированных интермедиатов в B. subtilis и родственных бактериях

Идентификация пути ацетилированных интермедиатов - 0 dapD (yquQ): ортолог известного гена E. coli

Идентификация пути ацетилированных интермедиатов - 1 patA: пиридоксаль-фосфат- зависимая аминотрансфераза (по гомологии) ко-локализуется и ко- регулируется с генами биосинтеза лизина во многих грам-положительных бактериях

Идентификация пути ацетилированных интермедиатов - 2 ykuR: N-ацил-L-аминокислота амидогидролаза (по гомологии) ко-локализуется и ко-регулируется с геном биосинтеза лизина dapD во многих грам-положительных бактериях в некоторых случаях принадлежит к большому лизиновому оперону, регулируемому LYS-элементом

Идентификация пути ацетилированных интермедиатов - 3 dapX: dapF отсутствует у некоторых бактерий (Staphylococcus aureus, Oenococcus oeni, Leuconostoc mesenteroides) во всех этих геномах есть dapX, гомологичный аланиновой рацемазе и другим эпимеразам в S. aureus dapX принадлежит к большому лизиновому оперону в O. oeni оперон dapX-asd регулируется LYS-элементом

Сравнительная геномика систем утилизации цинка Две роли цинка в бактериях: Структурная в ДНК-полимеразах, праймазах, рибосомных белках Каталитическая в протеазах и других белках

Регуляторы и сигналы nZUR-  nZUR-  AdcRpZUR TTAACYRGTTAA GATATGTTATAACATATC GAAATGTTATANTATAACATTTC GTAATGTAATAACATTAC TAAATCGTAATNATTACGATTTA

Цинк и паралоги белков рибосом L36L33L31S14 E. coli, S.typhi –– – +– + – K. pneumoniae –– – –– – – Y. pestis,V. cholerae – –  – – +– + – B subtilis – – + –– + –– +– + – +– + S. aureus – – – –– – – – – +– + Listeria spp. – – –– – – – +– + E. faecalis – –  – ––  – – – – + –– + – S. pne., S. mutans – – – –– – – –– S. pyo., L. lactis – – – –– – – – – +– + nZUR pZUR AdcR

(в скобках – мотив «цинковая лента») L36L33L31S14 E. coli, S.typhi (–)(–) – ( – ) + – K. pneumoniae (–)(–) – ( – ) – – Y. pestis,V. cholerae ( – )  – ( – ) + – B subtilis (–)(–)( – ) + – ( – ) + S. aureus (–)(–)( – ) – – – ( – ) + Listeria spp. (–)(–)( – ) – – ( – ) + E. faecalis (–)(–) ( – )  – – – ( – ) + – S. pne., S. mutans (–)(–)( – ) – – – (–)(–) S. pyo., L. lactis (–)(–)( – ) – – – ( – ) + nZUR pZUR AdcR

Сводка наблюдений: Makarova-Ponomarev-Koonin, 2001: –L36, L33, L31, S14 – это единственные рибосомные белки, дуплицированные более, чем в одном геноме –L36, L33, L31, S14 – четыре из семи рибосомных белков, содержащих мотив цинковой ленты (четыре цистеина) –Из двух (или более) копий L36, L33, L31, S1, обычно одна содержит мотив цинковой ленты, а другая – нет Среди генов, кодирующих паралоги рибосомных белков, как правило одни регулируется цинковым репрессором, а соответствующий белок никогда не имеет мотива цинковой ленты

Плохой сценарий достаточно цинка недостаточно цинка: весь цинк потреблен рибосомами, ферменты голодают

Хороший сценарий достаточно цинка недостаточно цинка: часть рибосом включает белки, не содержащие цинка – остается для ферментов

Регуляторный механизм ribosomes Zn-dependent enzymes R Sufficient Zn Zn starvation R repressor

Предсказание … (Proc Natl Acad Sci U S A Aug 19;100(17): ) … и подтверждения (Mol Microbiol Apr;52(1): )

Регуляторная система «с нуля под ключ» Консервативный сигнал перед генами рибонуклеотид-редуктаз Потенциальный регулятор (через филогенетический паттерн + домены)

Другие члены регулона Реутилизация дезоксирибонуклеотидов Репликация (ДНК-лигазы, топоизомеразы, ДНК-полимеразы

Как регулируется: репрессия в результате кооперативного связывания

Что осталось за кадром Эукариоты Структуры Молекулярная эволюция –Гены –Геномы –Метаболические и регуляторные системы Другие виды данных и что с ними делать –Экспрессия –Белок-ДНКовые взаимодействия –Белок-белковые взаимодействия –Структура хроматина (метилирование, гистоны и их модификации и т.д.) «Системная биология»