Быстрые пути эволюции белков. Эволюционный домен. БД PFAM.

Презентация:



Advertisements
Похожие презентации
Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова.
Advertisements

Семейства белков Pfam Rubens: Holy Family with St Elizabeth.
Эволюция доменной архитектуры. Домены как единицы непрерывной эволюции белков Под непрерывной эволюцией будем понимать эволюцию последовательности, происходящую.
Семейства белков. Мотив и распознающее правило. БД Pfam, InterPro. А.Б.Рахманинова, 2010, второй семестр.
Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка). Признаки гомологичности белков сходная 3D-структура.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин,
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Выравнивание биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2005–2008.
Выравнивания (продолжение) С.А.Спирин, Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные.
Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
Эволюция семейства белков Эволюционные домены и их выравнивание.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ СРЕДНЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «КРАСНОЯРСКИЙ МЕДИКО-ФАРМАЦЕВТИЧЕСКИЙ КОЛЛЕДЖ ФЕДЕРАЛЬНОГО.
Гены - SMS, посланные в будущее Проект юных биологов Руководитель Караваева Н.М. Гимназия 1 имени А.Н.Барсукова.
Выравнивание … … последовательностей белков и его биологический смысл.
Множественные выравнивания как метод исследования Материалы к занятиям IV блока курса биоинформатики, 2006 А.Б.Рахманинова.
Парные выравнивания биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2008 (продолжение)
Биосинтез белка Ученика 9 класса Г Антоненко Андрея.
Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка). Признаки гомологичности белков сходная 3D-структура.
Транксрипт:

Быстрые пути эволюции белков. Эволюционный домен. БД PFAM.

План Белок – продукт гена Пути эволюции белков – Мутации ДНК и их следствия для последовательностей белков – Наблюдаемые явления в последовательностях белков локальные мутации повторы эволюционные домены мотивы и циклические перестановки – ДНК-метилтрансферазы – [эндонуклеазы рестрикции] – RdRP БД Pfam Другие ресурсы

«Продукт» гена ГЕНГЕН mRNA (зрелая) Белок - предшественник Зрелые rRNA, tRNA и др. RNA Белок 2 Белок 3 РНК- предшественник процессинг (модификация РНК) ГЕНГЕН пре-мРНК (предшественник) Сплайсинг (у эукариот) транскрипция Зрелый белок 1 (mature protein) Альтернативный сплайсинг mRNA (зрелая) Посттрансляционная модификация Белок - предшественник mRNA (зрелая) ГЕНГЕН пре-мРНК (предшественник) Белок - предшественник Трансляция Что определяет последовательность белка: сигнал начала трансляции сигналы сплайсинга (эукариоты) стоп-кодон (редкие сигналы: запланированный сдвиг рамки, ….) кодирующая последовательность

Мутации ДНК и их следствия для последовательности белка Мутации соматические и мутации наследуемые Пресс отбора Аллельные варианты (эукариоты)

Мутации ДНК и их следствия для последовательности белка Локальные мутации в сигналах – потеря стоп-кодона: удлинение на С-конце за счет случайной последовательности слияние белков (прокариоты) – потеря сайта инициации трансляции: удлинение на N-конце за счет случайной последовательности потеря части N-концевой последовательности – потеря донорного сайта сплайсинга (эукариоты) : вставки случайной последовательности за счет включения интрона замена C-концевой последовательности на случайную (при сдвиге рамки из-за вставки интрона в экзон) – потеря акцепторного сайта сплайсинга (эукариоты) : делеция части последовательности из-за потери экзона делеция части последовательности с заменой последующей C-концевой последовательности на случайную (при сдвиге рамки из-за потери экзона) Примечание. Варианты усложняются при альтернативном сплайсинге

Мутации ДНК и их следствия для последовательности белка Локальные мутации в кодирующей последовательности – замена нуклеотида: последовательность белка без изменений замена аминокислотного остатка – мутация типа indel без сдвига рамки: делеция/вставка аминокислотных остатков – мутация типа indel со сдвигом рамки: замена C-концевого участка на случайную последовательность слияние белков (прокариоты) – образование стоп-кодона: потеря C-концевой последовательности – двойная мутация типа indel с восстановлением рамки: замена участка на случайную последовательность – образование нового сайта сплайсинга, донорного или акцепторного (эукариоты): вставки случайной последовательности или делеции участков (много вариантов)

Нелокальные мутации ДНК, которые могут изменять последовательности белков Дупликация фрагмента ДНК – образование паралога – образование повтора в белке Нерепликативная транспозиция – образование нового белка из частей старых – перестановка частей одного белка Инверсия фрагмента ДНК

Гомология нуклеотидных и аминокислотных последовательностей При перечисленных видах мутаций ДНК, кроме вставок нескольких нуклеотидов, прослеживается потомком какого нуклеотида генома предка является данный нуклеотид. При многих видах мутаций (но не всех!) то же верно и для аминокислотных остатков Поэтому можно говорить о гомологичности последовательностей и их букв Как правило, о гомологичности приходится судить по сходству последовательностей

Частоты мутаций Точечные: на сайт на поколение Рекомбинация: ??? при сравнении геномов бруцелл пара процентов замен ДНК ( замен на 1 млн. п.н.) и, очень грубо, несколько 1000 рекомбинаций (1000? на 1млн п.н.)

Примеры сравнений геномов

У далеких видов – E.coli и H.influenza – остаются общие гены и, иногда, порядок следования нескольких генов, но не более того!

et al. Сравнение двух штаммов

Вывод: Наследуемые рекомбинации бактериальных геномов происходят достаточно часто; хотя по числу их и меньше, чем замен. Что же происходит с белками?

Наблюдаемые события в эволюции белков Замены, вставки, делеции остатков Эволюционные домены: – протяженные сходные последовательности в разных белках, окруженные негомологичными участками – часто (но не всегда) участвующие в премешивании доменов – часто (но не всегда) последовательность изолированного домена имеет стабильную пространственную структуру – часто (но не всегда) домену можно приписать функцию

Белки, содержащие два эволюционных домена: гомеодомен и OAR домен (N-концевые участки не показаны)

Гомеодомены активно перемешивались в эволюции. Об этом можно судить по 65(!) различным доменным архитектурам гомеобелков, представленным в банке Pfam Гомеодомен Парный домен и гомеодомен Lim домены и гомеодомен Гомеодомен, продолженный Лейциновой молнией POU домен и гомеодомен Два гомеодомена PBX-домен и гомеодомен

Домены, найденные в последовательностях, часто, но далеко не всегда совпадают со структурными доменами.

Накопленные данные показывают что существуют структурные единицы наследуемой рекомбинации – эволюционные домены; они переставляются/вставляются/удаляются, как правило, целиком Бывают исключения: пример - ДНК метилтрансферазы

Вывод: Домены – структурные единицы эволюции, структуры и функции белка

Ортологи последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию Паралоги последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции.

Словарик Типы мотивовТипы подписей С айт(site) - Мотив (motif) – Повтор (repeat) – Домен (domain) – Семейство – Суперсемейство - Паттерн (pattern) – Профиль–PSSM – Профиль–HМM - ….. CCHC- цинксвязывающий мотив Подпись типа паттерн – CX2CX4HX4C Простой пример:

Ничто удачное не должно пропасть даром Точечные мутации медленный путь эволюции Быстрый путь дупликация Дуплицируются короткие фрагменты, домены, гены, кластеры генов, хромосомы, геномы Вторая копия может приобрести новые функции Почему это интересно?

25 белков 9 белков 2 белка 12 белков 223 белка 243 белка 507 белков ЕС ЕС ЕС Пример доменных перестроек: не только дупликации!

Пример 4

Pfam Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM. Состоит из 2-х частей: PfamA – курируемая часть, покрывает 76% UniProt PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA). Удобна для анализа доменной структуры белков.

Язык Pfam : Семейство – коллекция гомологичных белков. Домен – структурная единица, которую можно найти во множественном выравнивании. Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий. Мотив – короткая единица структуры вне глобулярных доменов. Клан – группа родственных записей.

Pfam Prosite Prints Blocks Smart (ProDom, PIRaln, ProClass, Systers, Picasso etc. not shown) Сравн ите

Создание интегрированной базы данных InterPro PROSITE PFAM PRINTS InterPro entries IPR IPR Интегрирование родственных подписей «вручную» ProDom SMART TIGRFAMs PIRSF SUPERFAMILY InterPro- an inte grated r esource of pro tein families, domains and functional sites.

Collagen alpha-1(III) chain (HUMAN) … GPP GPA GFP GAP GQN GEP GGK GER GAP GEK GEG GPP GVA GPP GGS GPA GPP GPQ GVK GER GSP GGP GAA GFP … Гипотеза: коллагены возникли в результате тандемных дупликаций девятки пар нуклеотидов (?)