Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин, 15.04.2008.

Презентация:



Advertisements
Похожие презентации
Эволюция семейства белков Эволюционные домены и их выравнивание.
Advertisements

Множественное выравнивание С.А.Спирин, весна 2011.
Множественное выравнивание С.А.Спирин, весна
Эволюция семейства белков Эволюционные домены и их выравнивание.
Множественное выравнивание С.А.Спирин, весна 2009.
Выравнивание … … последовательностей белков и его биологический смысл.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Выравнивание биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2005–2008.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
Парные выравнивания биологических последовательностей А.Б.Рахманинова, С.А.Спирин 2008 (продолжение)
Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова.
Семейства белков Pfam Rubens: Holy Family with St Elizabeth.
Эволюция доменной архитектуры. Домены как единицы непрерывной эволюции белков Под непрерывной эволюцией будем понимать эволюцию последовательности, происходящую.
Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка). Признаки гомологичности белков сходная 3D-структура.
Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально.
Теория вычислительных процессов 4 курс, 8 семестр Преподаватель: Веретельникова Евгения Леонидовна 1.
Выравнивания (продолжение) С.А.Спирин, Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные.
Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
Декартовы произведения Под упорядоченной парой (а; b) мы будем понимать двухэлементное множество, состоящее из элементов а и b, в котором зафиксирован.
Быстрые пути эволюции белков. Эволюционный домен. БД PFAM.
Транксрипт:

Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин,

Понятие выравнивания Выравнивание набора последовательностей – это: 1)множество позиций (пока абстрактное); 2)для каждой позиции – по букве из каждой последовательности набора (точнее, в данной последовательности данную позицию может занимать или буква, или «гэп»). При этом должны выполняться условия: а) каждая буква принадлежит не более чем одной позиции; б) нет позиций из одних гэпов. Смысл: буквы из одной позиции считаются сопоставленными друг с другом. (Далее можно говорить об общем происхождении, или сходной функции, или сходном пространственном расположении соответствующих остатков… Как всегда, в абстрактное понятие могут вкладываться различные, пусть и близкие, содержания)

Частные случаи Почти всегда: считается, что позиции упорядочены и что порядок представителей позиции в каждой последовательности не противоречит порядку самих позиций. (Хотя имеются содержательные случаи, в которых это ограничение мешает!) Благодаря этому выравнивание последовательностей можно изображать таблицей (столбцы соответствуют позициям) Полное (= глобальное) выравнивание: все буквы всех последовательностей должны быть представлены в позициях. Это не слишком биологически осмысленное понятие введено главным образом для удобства работы. Блок (иногда называемый мотив): выравнивание без гэпов ( обычно небольших консервативных участков).

Что отображает выравнивание? (три возможных смысла) 1.Сопоставление остатков есть гипотеза об их общем происхождении. 2.Сопоставление есть гипотеза (или утверждение) об одинаковой или «гомологичной» (что бы это ни значило) функции остатков. 3.Сопоставление есть гипотеза или утверждение о сходном пространственном расположении остова цепи в районе данного остатка. Разумеется, эти смыслы не взаимоисключающи! Известно, что пространственная структура консервативнее в эволюции, чем последовательность. Поэтому по наложению структур судят об общ ности происхождени я.

При сравнении похожих структур белков, как правило, анализируется только положение атомов CA каждого из аминокислотных остатков. Пример пространственного наложения структур двух родственных белков. Изображены только CA-атомы и условные линии, соединяющие их. Пара сопоставленных остатков Против этих остатков должны стоять гэпы.

На практике… Часть сопоставлений можно считать гипотезой об общем происхождении и/или сходном расположении. Остальные добавлены «для полноты» или «для красоты» (чтобы не вставлять лишних гэпов). Полезно уметь различать те и другие места в выравнивании!

Обычное дело … В истории многих белков имели место случаи рекомбинации: Мораль: лучше выравнивать не полноразмерные последовательности, а те их части, про которые можно предполагать общность происхождения (без рекомбинаций, слияний, разделений – только замены, вставки и делеции ). FAS_PNECA Q83I90 _TROW8

Домен белка Три определения: 1.Функциональный домен: часть белка, которая, будучи получена в эксперименте отдельно от остального белка, сохраняет какую-либо из его функций. 2.Структурный домен: часть белка, хорошо обособленная в пространстве от остальных частей (есть элемент субъективности!) 3.Эволюционный домен: относительно консервативная часть последовательности, замеченная в перестановках с другими подобными частями. Материал по эволюционным доменам самый большой, поскольку известных последовательностей во много раз больше, чем известных структур, и во много- много раз больше, чем результатов экспериментов по сохранению функции частью белка. Домены, выделенные по разным определениям, часто совпадают. Однако есть примеры, когда один эволюционный домен состоит из двух структурных и т.п.

Эволюционные домены 25 белков 9 белков 2 белка 12 белков 223 белка 243 белка 507 белков ЕС ЕС ЕС

Выравнивать имеет смысл последовательности (эволюционных) доменов (а, вообще говоря, не полноразмерных белков) ! Тем самым, домен белка – основной объект науки о выравниваниях, эволюции, функциональной аннотации и т.п.

Форматы хранения выравниваний FASTA Clustal = ALN PHYLIP MSF В пакете EMBOSS есть программа seqret, которая среди прочего умеет конвертировать форматы: seqret alignment.fasta msf::alignment.msf Редактор GeneDoc работает с форматом MSF, но умеет импортировать и экспортировать выравнивания в других форматах.

Программы множественного выравнивания ClustalW (можно считать устаревшей) Muscle (существенно быстрее и чуть аккуратнее) MAFFT (то же, имеет медленную и аккуратную опцию einsi) T-COFFEE PROBCONS DI-ALIGN Все перечисленные генерируют полные выравнивания. MEME (и её аналоги) генерирует блоки Редакторы выравниваний: GeneDoc JalView …

Банки выравниваний Pfam BLOCKS PRINTS Так называемые benchmarks (BaliBase и его современные аналоги)

Банки семейств белков Pfam ProSite SMART InterPro … Структура Pfam: коллекция HMM-профилей (каждый профиль характеризует «обобщённую последовательность» некоторого эволюционного домена). аннотации эволюционных доменов (собственные и взятые из InterPro) выравнивания (генерируются с помощью профилей; часто плохого качества – содержат очевидные неточности) интерфейс (средства поиска, средства сохранения выравниваний и т.д.)