Биоинформатика, или молекулярная биология in silico М.Гельфанд Конференция ИППИ сентябрь 2007, Звенигород.

Презентация:



Advertisements
Похожие презентации
Биоинформатика: биологические тексты М.С.Гельфанд 29 октября 2006 Первый фестиваль науки МГУ Факультет биоинженерии и биоинформатики.
Advertisements

Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
Выравнивание … … последовательностей белков и его биологический смысл.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
Выравнивания (продолжение) С.А.Спирин, Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные.
Прокариоты: инициация и регуляция транскрипции. РНК-полимераза Главный компонент (core-фермент) σ-фактор Элонгация Распознавание промотора β β α ω α 12.
Транскрипция – синтез РНК по матрице ДНК. Все типы РНК транскрибируются с ДНК.
Сравнительный анализ последовательностей ДНК БиБи 4 курс Осень 2005.
Геном содержит биологическую информацию, необходимую для построения и поддержания организма. Большинство геномов, в том числе геном человека и геномы.
Структура генома вирусов Вирусные (+) РНК-геномы кодируют несколько белков, среди которых РНК-зависимая РНК-полимераза (репликаза), способная синтезировать.
Биоинформатика, или молекулярная биология in silico М.С.Гельфанд 15 января 2008 Институт проблем передачи информации им. А.А.Харкевича РАН.
Развитие цветка резухи Таля двойная кластеризац ия – на генах и на условиях.
Разработала: учитель биологии высшей категории МОУ СОШ 1 Жабина М.В.
Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова.
Биоинформатика, или молекулярная биология in silico М.Гельфанд Семинар в ИППИ 7 апреля 2006.
Изучение процесса синтеза белков в рибосоме Рассмотреть принцип, лежащий в основе процесса синтеза и- РНК; Определить свойства генетического кода; Сформировать.
Тема: «Организация генома человека» Выполнил: ст.гр Орынбасаров А.О.
БИОСИНТЕЗ БЕЛКА. Центральная догма молекулярной биологии.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ СРЕДНЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «КРАСНОЯРСКИЙ МЕДИКО-ФАРМАЦЕВТИЧЕСКИЙ КОЛЛЕДЖ ФЕДЕРАЛЬНОГО.
Три надцарства: Бактерии, Археи и Эукариоты. Что верно для E.coli, то верно для слона Жак Моно «гены кусками» огромное количество некодирующей ДНК Число.
Транксрипт:

Биоинформатика, или молекулярная биология in silico М.Гельфанд Конференция ИППИ сентябрь 2007, Звенигород

Расшифрован геном!

Расшифрован ли геном? Перехватить зашифрованное сообщение – еще не значит его понять

Фрагмент генома (0.1% генома E. coli) Геном бактерии: несколько миллионов нуклеотидов От 600 до 9 тысяч генов (примерно 90% генома кодирует белки)

Фрагмент генома (0.0001% генома человека) Геном человека: нуклеотидов Примерно 25 тысяч генов, < 5% генома кодирует белки

Пропаганда последовательности статьи

Цель (локальная):описать гены Что –функция Когда –Регуляция Экспрессии Время жизни (мРНК, белка) Где –Локализация Внутри/снаружи Органеллы и компартменты Как –Механизм Специфичность, регуляция

2006: > 1000 геномов бактерий (~400 полных) Пропаганда-2: полные геномы

Цель (глобальная): предсказать свойства организма по его геному (с использованием кое-какой дополнительной информации – эпигенетика и т.п.) и понять эволюцию геномов/организмов

Цель (недостижимая?) откуда оно все взялось? первое приближение – реконструкция генома/свойств LUCA реально ли заглянуть глубже? реально ли смоделировать? (времена) реально ли смоделировать «по частям»?

Задачи биоинформатики С проверяемым ответом –предсказание функции, регуляции, структуры и т.п.: ставим эксперимент С непроверяемым ответом –эволюционные деревья но если бы знать все геномы всех (в том числе очень давно умерших) существ, то задача станет тривиальной С принципиально непроверяемым ответом (который зависит от операциональных определений) –идентификация повторов, консервативных областей, островов метилирования и т.п. (так ли он непроверяем?) Без ответа (общеописательные) –статистика геномов (изохоры и т.п.) –описание регуляторных и пр. сетей (hubs, мотивы и т.п.)

Идеология Сходство => гомология (общность происхождения) Гомология => сходная функция Принцип Пирсона: консервативно то, что важно –функциональные мотивы в белках –регуляторные сайты в ДНК –не обязательно последовательности структура белка и РНК расположение генов на хромосоме ко-экспрессия генов

Не все так хорошо Сходство гомология –области малой сложности, неструктурированные домены, трансмембранные сегменты и т.п. области с нестандартным аминокислотным составом надо правильно измерять сходство последовательностей –всегда ли гомология следует из сходства структур? что такое сходство структур? как его измерять? сколько раз возникала каждая белковая укладка? (>1?) можем ли мы это узнать и доказать ответ? бывает ли конвергентная эволюция структур? Гомология та же функция. –Что такое «та же функция»? биохимические детали и функциональная роль (к вопросу о «проверяемости»)

Забавные функциональные аннотации C75604: Probable head morphogenesis protein, Deinococcus radiodurans O05360: Automembrane protein H, Yersinia enterocolitica Q8TID9: Benzodiazepine (valium) receptor TspO, Methanosarcina acetivorans NP_069403: DR-beta chain MHC class II, Archaeoglobus fulgidus © М.Galperin, А.Миронов

Ошибки в экспериментальных работах SwissProt: DEFINITION Hypothetical 43.6 kDa protein. ACCESSION P KEYWORDS Hypothetical protein. SOURCE Debaryomyces occidentalis ORGANISM Debaryomyces occidentalis Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Debaryomyces. [CAUTION] Was originally (Ref.1) thought to be 3-isopropylmalate dehydrogenase (LEU2). PIR: DEFINITION 3-isopropylmalate dehydrogenase (EC ) - yeast(Schwanniomyces occidentalis). ACCESSION S55845 KEYWORDS oxidoreductase. Iyer L.M., Aravind L., Bork P., Hofmann K., Mushegian A.R., Zhulin I.B., Koonin E.V. Quod erat demonstrandum? The mystery of experimental validation of apparently erroneous computational analyses of protein sequences. Genome Biology : research0051 © Koonin-Galperin (?)

SwissProt, запись DSDX_ECOLI -!- CAUTION: An ORF called dsdC was originally (Ref.3) assigned to the wrong DNA strand and thought to be a D-serine deaminase activator, it was then resequenced by Ref.2 and still thought to be "dsdC", but this time to function as a D-serine permease. It is Ref.1 that showed that dsdC is another gene and that this sequence should be called dsdX. It should also be noted that the C-terminal part of dsdX (from 338 onward) was also sequenced (Ref.6 and Ref.7) and was thought to be a separate ORF (don't worry, we also had difficulties understanding what happened!). © АБР

Случай из жизни Принцип Ферми-Финкельштейна –переносить функции по гомологии: скучно (ничего нового) Оказывается, можно описывать нечто совсем новое

Консервативный мотив перед генами рибонуклеотид-редуктаз (nrd) в бактериальных геномах

Идентификация фактора транскрипции Филогенетический паттерн: список геномов, в которых присутствует/отсутствует обнаруженный мотив => единственный ген с таким паттерном – ybaD (COG1327) –макроуровень – большие таксоны –микроуровень – в «смешанных» таксонах: отсутствует в геномах паразитов в группах альфа- и гамма- протеобактерий отсутствует в Desulfovibrio spp. среди дельта-протеобактерий отсутствует в Nostoc sp. среди цианобактерий отсутствует в Oenococcus и Leuconostoc среди Firmicutes присутствует только в Treponema denticola среди четырех спирохет COG1327: Гипотетический регулятор транскрипции, содержащий домены цинковая лента (ДНК- и РНК- связывающий) и АТФ-конус

Bork, Koonin: YbaD=RibX, регулятор биосинтеза рибофлавина?

Дополнительные соображения: Ко-локализация ген nrdR иногда образует опероны с генами nrd genes или с генами репликаци и dnaB, dnaI, polA

Еще дополнительные соображения: Состав регулона потенциальные сайты связывания NrdR обнаружены перед другими генами, связанными с репликацией: –топоизомераза I –инициатор репликации dnaA –разделение (partitioning) хромосом –ДНК-хеликаза II –ре-утилизация (salvage) dNTP

Множественные сайты (гены nrd): FNR, DnaA, NrdR

Механизм регуляции репрессор (сайты перекрываются с промоторами) кооперативное связывание: –>90% генов имеет парные сайты –расстояние между сайтами (центрами палиндромов) равно целому числу витков спирали ДНК как правило (94%) пн, в 84% случаев пн – 3 витка в Vibrio spp. 21 пн (2 витка) в некоторых фирмикутах пн (4 витка)

Экспериментальное подтверждение

Опять философия: «С трудом проверяемые ответы» филогенетические деревья (и реконструкция предковых последовательностей) –правила гигиены: самосогласованность (bootstrap) –что, если бы мы знали все современные геномы? не поможет –ср. пра-цезский и пра-индоевропейский –а вообще все когда-либо существовавшие геномы? тогда тривиально горизонтальный перенос «правильное» выравнивание

«В принципе не проверяемые ответы» (зависящие от определений) Так ли они непроверяемы? Повторы –если иметь все геномы, то можно описывать вставки/замены фрагментов генома и их последующее расхождение Консервативные области –если иметь все геномы, то можно просто оценивать локальную скорость эволюции (но это будет функцией времени) Статистика ДНК (локальный нуклеотидный состав) –это следствие локального паттерна замен, так и надо описывать Микросателлиты –можно ли «функционально» (а не операционально) определить микросателлит, исходя из динамики вставок/замен/дупликаций? CpG-острова –можно ли «функционально» (а не операционально) определить CpG-остров, исходя из паттерна мутаций, состояния метилирования и т.п.? (тут уже эволюция + эксперимент)

«Безответные задачи» Общие свойства геномов –количество факторов транскрипции как функция размера генома квадратично: «бюрократическая катастрофа» опять: интересна эволюция Общие свойства сетей –распределения степеней вершин и т.п. –перепредставленные мотивы