Эволюция семейства белков Эволюционные домены и их выравнивание.

Презентация:



Advertisements
Похожие презентации
Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин,
Advertisements

Эволюция семейства белков Эволюционные домены и их выравнивание.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Множественное выравнивание С.А.Спирин, весна 2009.
Выравнивание … … последовательностей белков и его биологический смысл.
Семейства белков. Мотив и распознающее правило. БД Pfam, InterPro. А.Б.Рахманинова, 2010, второй семестр.
Парные выравнивания биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2008 (продолжение)
Множественное выравнивание С.А.Спирин, весна 2011.
Множественное выравнивание С.А.Спирин, весна
Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова.
Выравнивание биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2005–2008.
Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
Эволюция доменной архитектуры. Домены как единицы непрерывной эволюции белков Под непрерывной эволюцией будем понимать эволюцию последовательности, происходящую.
Выравнивания (продолжение) С.А.Спирин, Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные.
Семейства белков Pfam Rubens: Holy Family with St Elizabeth.
Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка). Признаки гомологичности белков сходная 3D-структура.
PSI – BLAST Position-Specific Iterated BLAST. PSI – BLAST: назначение для поиска удаленных белков или новых представителей семейств если простой BLAST.
Выравнивание последовательностей. Простое взвешивания +1 : вес совпадения -μ : штраф за несовпадение -σ : штраф за делецию/вставку Вес выравнивания =
Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально.
Транксрипт:

Эволюция семейства белков Эволюционные домены и их выравнивание

Основные этапы биоинформатического анализа молекулярной эволюции Выбор последовательностей и их выравнивание Построение/выбор эволюционной модели Реконструкция эволюции – реконструкция филогенетического дерева – оценка силы давления и направления отбора – сравнение скоростей эволюции –... Оценка статистической значимости реконструкции ? Весна, 2008, А.Б.Раманинова

Что отображает выравнивание? (три возможных смысла) 1.Сопоставление остатков есть гипотеза об их общем происхождении. 2.Сопоставление есть гипотеза (или утверждение) об одинаковой или «гомологичной» (что бы это ни значило) функции остатков. 3.Сопоставление есть гипотеза или утверждение о сходном пространственном расположении остова цепи в районе данного остатка. Разумеется, эти смыслы не взаимоисключающи! Известно, что пространственная структура консервативнее в эволюции, чем последовательность. Поэтому по наложению структур судят об общ ности происхождени я.

При сравнении похожих структур белков, как правило, анализируется только положение атомов CA каждого из аминокислотных остатков. Пример пространственного наложения структур двух родственных белков. Изображены только CA-атомы и условные линии, соединяющие их. Пара сопоставленных остатков Против этих остатков должны стоять гэпы.

Обычное дело … В истории многих белков имели место случаи рекомбинации: FAS_PNECA Q83I90 _TROW8

Домен белка Три определения: Функциональный домен: часть белка, которая, будучи получена в эксперименте отдельно от остального белка, сохраняет какую-либо из его функций. Структурный домен: часть белка, хорошо обособленная в пространстве от остальных частей (не формализовано!) Эволюционный домен: относительно консервативная часть последовательности, замеченная в перестановках с другими подобными частями. Материал по эволюционным доменам самый большой, поскольку известных последовательностей во много раз больше, чем известных структур, и во много-много раз больше, чем результатов экспериментов по сохранению функции частью белка. Домены, выделенные по разным определениям, часто совпадают. Однако есть примеры, когда один эволюционный домен состоит из двух структурных и т.п.

Эволюционные домены 25 белков 9 белков 2 белка 12 белков 223 белка 243 белка 507 белков ЕС ЕС ЕС

Выравнивать имеет смысл последовательности (эволюционных) доменов (а, вообще говоря, не полноразмерных белков) ! Тем самым, домен белка – основной объект науки о выравниваниях, эволюции, функциональной аннотации и т.п.

Программы множественного выравнивания ClustalW (можно считать устаревшей) Muscle (существенно быстрее и чуть аккуратнее) MAFFT (то же, имеет медленную и аккуратную опцию einsi) T-COFFEE PROBCONS DI-ALIGN

Банки семейств белков Pfam ProSite Структура Pfam: коллекция HMM-профилей (каждый профиль характеризует «обобщённую последовательность» некоторого эволюционного домена). аннотации эволюционных доменов (собственные и взятые из InterPro) выравнивания (генерируются с помощью профилей; часто плохого качества – содержат очевидные неточности) интерфейс (средства поиска, средства сохранения выравниваний и т.д.)

Банки семейств белков Pfam ProSite Структура ProSite: коллекция белковых семейств и доменов. аннотации эволюционных доменов Функциональные участки, мотивы, подписи и профили. интерфейс (средства поиска, средства сохранения выравниваний и т.д.)

PSSM PSSM или Position-Specific Scoring Matrix, тип матрицы в которой значение замещения аминокислоты зависит от положения в выравнивании. Например замена Tyr-Trp в позиции 5 не эквивалентна той же самой замене в позиции 10. Это является принципиальным отличием от PAM или BLOSUM. Значения в PSSM матрицы имеют положительные или отрицательные целочисленные значения. Положительные значения указывают, что аминокислота замещается чаще чем в случайным образом. Отрицательные значения соответственно наоборот. PSSM создаются при работе с PSI-BLAST Структура ProSite: коллекция белковых семейств и доменов. аннотации эволюционных доменов Функциональные участки, мотивы, подписи и профили. интерфейс (средства поиска, средства сохранения выравниваний и т.д.)

Профиль ID SEQUENCE_PROFILE; MATRIX. AC ZZ99999; DT Tue Apr 21 21:25: DE Generated from MSF file: 'RT07.weighted.ali'. MA /GENERAL_SPEC: ALPHABET='ABCDEFGHIKLMNPQRSTVWYZ'; LENGTH=287; MA /DISJOINT: DEFINITION=PROTECT; N1=6; N2=282; MA /NORMALIZATION: MODE=1; FUNCTION=LINEAR; R1= ; R2= ; TEXT='No_units'; MA /CUT_OFF: LEVEL=0; SCORE=850; N_SCORE=8.5; MODE=1; TEXT='!'; MA /CUT_OFF: LEVEL=-1; SCORE=650; N_SCORE=6.5; MODE=1; TEXT='?'; MA /DEFAULT: M0=-8; D=-20; I=-20; B1=*; E1=*; MI=-105; MD=-105; IM=-105; DM=-105; MA /I: B1=0; BI=-105; BD=-105; MA /M: SY='M'; M=-10,-20,-20,-30,-20,0,-20,0,20,-10,20,60,-20,-20,0,-10,-20,-10,10,-20,0,-10; MA /M: SY='G'; M=0,-10,-30,-10,-20,-30,70,-20,-40,-20,-30,-20,0,-20,-20,-20,0,-20,-30,-20,-30,- 20; MA /M: SY='I';M=-10,-30,-30,-40,-30,0,-40,-30,50,-30,20,20,-20,-20,-20,-30,-20,-10,30, -20,0,- 30; /GENERAL_SPEC: Общие указания /DISJOINT: Описание разделителей. /NORMALIZATION: Значения для нормализации результатов выравнивания. /CUT_OFF: Рекомендуемые значения Cut-off. /DEFAULT: Значения по умолчанию для специфических позиций /I: Вставка в профиле. /M: Совпадение в профиле.