Молекулярная филогенетика (лекция 1) Принципы построения филогенетических деревьев по молекулярным данным В.В. Алёшин 30 сентября 2014 года.

Презентация:



Advertisements
Похожие презентации
Филогенетические деревья (продолжение) Филогенетические деревья и таксономия организмов Сравнение деревьев Реконструкция филогении (общая схема) Расстояния.
Advertisements

Принцип Дирихле. Задачи и решенияПринцип Дирихле. Задачи и решения.
Теория графов Основные определения. Задание графов Графический способ – Привести пример графического задания графа, состоящего из вершин А, В и С, связанных.
Алексеева Е.В., учитель информатики и ИКТ МОУ «Сланцевская СОШ 3» Введение в теорию графов 11 класс начать.
Многоугольники, вписанные в окружность Многоугольник называется вписанным в окружность, если все его вершины принадлежат окружности. Окружность при этом.
Филогенетические деревья. 1) Алфавит без пробелов5 2) Кол-во выравниваний10 3) Глобальное выравнивание10 4) Локальное выравнивание7 5) Афинные гэпы8 6)
Кратчайшие пути по поверхности Задачи на нахождение кратчайших путей относятся к экстремальным задачам и играют большую роль в математике и ее приложениях.
Решение ЗАДАНИЙ С1-С6 в ЕГЭ 2010 Учитель : Клейменова Валентина Ивановна МОУ «Гирьянская СОШ»
Графы и их применение (подготовка к ЕГЭ) Мастер – класс учитель Майсова Т.Б.
ХНУРЭ, кафедра ПО ЭВМ, Тел , Лекции Н.В. Белоус Факультет компьютерных наук Кафедра ПО ЭВМ, ХНУРЭ Компьютерная.
M-чередующаяся декомпозиция Лекция 10. Нечетная декомпозиция Теорема 9.7 (Lovász [1972] ) Граф является фактор-критическим тогда и только тогда, когда.
Замечательные точки треугольника К числу замечательных точек треугольника относятся: а) точка пересечения биссектрис – центр вписанной окружности; б) точка.
Сумма углов треугольника Следствие. Сумма острых углов прямоугольного треугольника равна 90 о. Теорема. Сумма углов треугольника равна 180 о. Доказательство.
Граф отображает элементный состав системы и структуру связей между элементами этой системы А B C D F K.
Графы Степень вершины Подсчет числа ребер графа. Разминка… Вставьте недостающие слова в предложения (граф, титул, ребро, вершина) Всем известно, что слово.
ВЫПОЛНИЛ: УЧЕНИК 11 КЛАССА «А» ЛОБЖА АРТЕМ ЭЛЕМЕНТЫ ТЕОРИИ ГРАФОВ: ОУ СОШ 51 Образовательное учреждение: г. Комсомольск – на – Амуре, 2012 год.
Графы и их применение Мастер-класс 12 февраля ГМО учителей информатики.
1. Основные понятия теории графов 1. Основные понятия теории графов 2. Степень вершины Введение 5. Ориентированные графы 6. Изоморфизм графов 7. Плоские.
КЛАССИФИКАЦИЯ ГРАММАТИК И ЯЗЫКОВ ( КЛАССИФИКАЦИЯ ХОМСКОГО ) Рейн Т. С.
Графы Лекция 2. Графы Неориентированным графом (графом) называется тройка (V, E, ), где V и E конечные множества и {X V : | X | = 2}. Ориентированным.
Транксрипт:

Молекулярная филогенетика (лекция 1) Принципы построения филогенетических деревьев по молекулярным данным В.В. Алёшин 30 сентября 2014 года

Истинное филогенетическое дерево – объективные родственные свяиз всех существующих и существовавших на Земле живых форм; дерево, сконструированное на основании нуклеотидных (аминокислотных) последовательностей современных форм с помощью правил вывода, основанных на теоретических положениях.

Сконструированное дерево – это математический объект – связный граф без циклов. Он состоит из вершин (узлов) и соединяющих их ребер. Узлы бывают внутренние – с ним соединено три ребра (или более) и висячие («листья» дерева) – с ними соединено одно ребро. Неформально, висячая вершина – это нуклеотидная (аминокислотная) последовательность современного вида, определенная экспериментально. Ей дают имя и она ОТЕ (англ. OTU). Внутренние узлы дерева можно интерпретировать как гипотетического предка. Дерево – связный граф. Это значит, что из любого узла в любой другой узел существует путь (последовательность соединенных ребер). Это отражает факт, что все нынешние и вымершие виды родственны между собой. Дерево – граф без циклов. Это значит, что путь в дереве между двумя узлами всегда единственный. Таким образом, степень родства каждой пары видов (вершин графа) не произвольная, а строго определенная – определяемая путем между ними по дереву. В частности, любая пара узлов, соединенная в дереве непосредственно, соединена единственным ребром: если ребро соединяет два рассматриваемых узла, то такое ребро единственное. Это отражает эволюционную трансформацию любого вида из вида-предка, причем как единственное событие.

Эквивалентные изображения одного и того же немасштабированного бес корневого дерева ((А, В), (С, D)); из четырех ОТЕ Два дерева имеют одинаковую топологию, если они состоят из одинаковых ОТЕ, соединенных в том же самом порядке (т. е. их внутренние вершины можно занумеровать так, чтобы любому пути в одном дереве был такой же точно путь в другом).

Примеры текстовой и графической записи одного и того же масштабированного дерева:

Willi Hennig

Филогеномика Филогенетическая система Кладистика

Кумулятивный рост числа публикаций со словами molecular AND phylogeny в резюме, согласно базе данных ISI

% СВЯЗАВШИХСЯ ФРАГМЕНТОВ ДНК % НУКЛЕОТИДНЫХ ЗАМЕН В ГИБРИДНЫХ ДНК

матрицы: матрица попарных расстояний выравнивание (матрица) ДНК-матрица...

Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов.

Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов. |s| скорость эволюции = скорости мутирования (независимо от размера популяции) t фикс.=4Ne

Выравнивание. Насколько схожи между собой первичные структуры? Основания (биохимические и генетические) гипотезы молекулярных часов. p-дистанции и почему это не всегда хорошая мера сходства. 50 время Идентичность 100% 0

A C C C ОТЕ1ОТЕ2ОТЕ3 G ATG T T T A A G G G A T C T A T 1 Неравноценность различий между близкими и далекими видам

Возникает вопрос: насколько сконструированное дерево соответствует исходным данным (даже не истинному дереву, а данным!). Аддитивные (по отношению к матрице) деревья. Свойство аддитивности проявляет и матрица: в этом случае для любых четверок ОТЕ A, B, C, D выполняется условие, что из трех сумм дистанций dAB + dCD, dAC + dBD, dAD + dBC две суммы должны быть равны и больше третьей. Доказано, что если матрица дистанций может быть отображена аддитивным деревом, то такое дерево единственное. Другими словами, для аддитивного дерева матричная и масштабированная графическая форма представления эквивалентны, а для неаддитивного дерева нет. Для большинства природных ОТЕ деревья получаются неаддитивные.

Acyrthosiphon pisum 100% Drosophila melanogaster 98% Phlebotomus papatasi 98% 0.1 Aedes aegypti 100% Nilaparvata lugens 98% Hodotermopsis sjoestedti 70% Apis mellifera 95% Tribolium castaneum 100% Pediculus humanus 90% Daphnia pulex 97% Folsomia candida 42% Парафилия Crustacea относительно Hexapoda Onychiurus arcticus 69% Diaphorina citri 98% Hexapoda Lepeophtheirus salmonis 44% Artemia franciscana 99% Homarus americanus 81% Peracarida 31% Richtersius coronifer 60% Litopenaeus vannamei 92% outgroup Acanthoscurria gomesiana 70% Mesobuthus gibbosus 31% Ixodes scapularis 97% Carcinoscorpius rotundicauda 13% Anoplodactylus eroticus 98% Scutigera coleoptrata 85% Onychophora 84% Toxocara canis 82% Priapulus caudatus 55% 0.50 Xiphinema index 90% Echinoderes horni 85% Chelicerata Myriapoda Ecdysozoa без Arthropoda Spinochordodes tellinii 19% Hypsibius dujardini 86% Caenorhabditis elegans 100% Collembola Entomostraca Malacostraca Gryllus bimaculatus 100% Locusta migratoria 98%

# rank item obs au np | bp pp kh sh wkh wsh | # 1 а | | # 2 б | e | # 3 в | e | # 4 г | e | # 5 д | e | # 6 е | e | # 7 ж | e | # 8 з | e | # 9 и | e | # e-007 2e-007 | 0 2e e-005 | Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup Malacostraca Hexapoda Maxillopoda Myriapoda Chelicerata Branchiopoda outgroup абв где ж из к

Длина Число деревьев >2850 MP BP минимальная длина ветви

Scolecida Ecdysozoa 133 белок кодирующих генов ( поизций аминокислотного выравнивания)

Baurain et al. Lack of resolution in the animal phylogeny: Closely spaced cladogeneses or undetected systematic errors? Mol. Biol. Evol. 24(1):6–9. (2007 ) 133 protein-coding genes (31,089 amino acid positions) 133 белок-кодирующих генов (31,089 поизций аминокислотного выравнивания)

Joe Felsenstein Felsenstein J Cases in which parsimony or compatibility methods will be positively misleading. Syst. Zool. V P Эффект притяжения длинных ветвей (по: Felsenstein, 1978). (а) Схема возникновения неправильного объединения на бескорневом дереве. При вероятности мутации p, меньшей q2, метод максимальной экономии дает устойчивое объединение неродственных длинных ветвей (1 и 3). (b) На корневом дереве внешняя группа 1 притягивает к себе длинную ветвь 3, маскируя её длину и затрудняя распознавание. При этом нарушается топология дерева. Условия притяжения длинных ветвей (Long Branch Attraction) Число признаков не является параметром!

Acyrthosiphon pisum 100% Drosophila melanogaster 98% Phlebotomus papatasi 98% 0.1 Aedes aegypti 100% Nilaparvata lugens 98% Hodotermopsis sjoestedti 70% Apis mellifera 95% Tribolium castaneum 100% Pediculus humanus 90% Daphnia pulex 97% Folsomia candida 42% Парафилия Crustacea относительно Hexapoda Onychiurus arcticus 69% Diaphorina citri 98% Hexapoda Lepeophtheirus salmonis 44% Artemia franciscana 99% Homarus americanus 81% Peracarida 31% Richtersius coronifer 60% Litopenaeus vannamei 92% outgroup Acanthoscurria gomesiana 70% Mesobuthus gibbosus 31% Ixodes scapularis 97% Carcinoscorpius rotundicauda 13% Anoplodactylus eroticus 98% Scutigera coleoptrata 85% Onychophora 84% Toxocara canis 82% Priapulus caudatus 55% 0.50 Xiphinema index 90% Echinoderes horni 85% Chelicerata Myriapoda Ecdysozoa без Arthropoda Spinochordodes tellinii 19% Hypsibius dujardini 86% Caenorhabditis elegans 100% Collembola Entomostraca Malacostraca Gryllus bimaculatus 100% Locusta migratoria 98%

Huelsenbeck et al. (1996: Figs 2 and 3)

Монофилию многоклеточных и воротничковых жгутиконосцев выявить ТРУДНО Монофилию Holozoa выявить ЛЕГКО

outgroup Ctenophora Bilateria Dunn et al. Nature, 452, (2008) Porifera Cnidaria 150 белок кодирующих генов Placozoa Porifera: Homoscleromorpha outgroup Ctenophora Bilateria Porifera: Demospongia Cnidaria 1487 белок кодирующих генов Hejnol et al. Proc. R. Soc. B, (2009) outgroup Placozoa Bilateria Srivastava et al., Nature, 454, (2008) Porifera Cnidaria 104 белок кодирующих гена outgroup Placozoa Bilateria Sierwater et al., PLoS Biol, 7:1, (2009) Porifera Cnidaria Ctenophora 51 генов ( РНК - и белок кодирующие гены ) outgroup Placozoa Bilateria Pick et al., Mol. Biol. Evol., 27: , (2010) Porifera Cnidaria Ctenophora 150 белок кодирующих генов

UPGMA – Uweighted Pair Group Method using Arithmetic averages (невзвешенный парно-групповой метод с арифметическим усреднением)

Если гипотеза молекулярных часов правильно описывает эволюцию, то правильно построенное дерево будет не только аддитивным, но будет выполнено дополнительное, более строгое условие: в дереве будет точка (корень), равноудаленная от всех висячих вершин. Такое дерево называют ультраметрическим. Все пути по ультраметрическому дереву (ориентированному графу) к любым висячим вершинам, выходящие из любого внутреннего узла, также будут равны (все современные виды прошли в точности одинаковое расстояние от их общего предка). Если в таком дереве взять за точку отсчета вид (висячую вершину), не принадлежащую к некоторой подгруппе (поддереву), то расстояние от него до всех видов подгруппы должно быть в точности одинаковым (тест относительной скорости (Sarich, Wilson, 1973). Понятие ультраметричности относится не только к дереву, но и к данным. Если для любой тройки ОТЕ расстояния в матрице либо все равны, либо два равны, а третье меньше, то матрица ультраметрическая. Доказано, что по ультраметрической матрице всегда можно построить ультраметрическое дерево.

Тест относительной скорости на соотвествие эволюции гипотезе молекулярных часов

0,1 b x a c d D C A B d AB + d CD < d AC + d BD d AB + d CD < d AD + d BCBC + = + d d BC d AC d BD Условие «четырех точек» Условие «четырех точек» позволяет находить соседние ОТЕ на дереве, несмотря на то, что расстояние между ними не минимальное. Расстояния между ОТЕ известны из матрицы, но заранее не известно, какие ОТЕ соседние. Длина пути между ОТЕ в аддитивном дереве равна значениям в матрице парных расстояний. Сравним суммы расстояний между двумя парами ОТЕ, согласно правилу, понятному из приведенной записи. Следуя этому правилу, из четырех ОТЕ (и шести парных дистанций в матрице) можно составить три пары для суммирования. Пусть А и В соседние (см. рис.), тогда известное расстояние dAB между ними в дереве представлено в виде суммы отрезков a и b. Аналогично, известное расстояние dAC между видами A и C – это в дереве сумма отрезков a, x, c. Если в сумму войдет дистанция между А и В – парой соседних ОТЕ, то, согласно выбранному правилу, другим слагаемым (dCD) автоматически окажется тоже дистанция между парой (другой) соседних между собой ОТЕ. Такая сумма будет меньше, чем сумма расстояний между ОТЕ, не являющихся соседними, так как в последнюю, к сумме длин ребер, ведущих в висячим вершинам, добавляется удвоенная длина внутреннего ребра x. Сумма двух пар дистаниций между ОТЕ, не являющимися соседними, будет, как легко в этом убедиться, одинаковая. Метод UPGMA объединил бы ОТЕ A и C, поскольку между ними минимальное расстояние, но такая топология не удовлетворяет условию «четырех точек». Применяя это условие, можно не только найти правильную топологию, но и, при условии аддитивности, однозначно вычислить длины всех ребер дерева. Поскольку получаемое при этой процедуре дерево бескорневое, из него нельзя сделать вывод, что, например, соседние ОТЕ A и B сестринские. Для такой филогенетической интерпретации недостаточно данных, именно, не указано положение корня, которое необходимо установить дополнительными методами. Если корень не попадет на отрезки a и b, то A и B будут сестринскими. При любом из 5 возможных положений корня (по числу ребер на дереве) OTE, например, A и C сестринскими не будут (по: Li, 1997).

A A AA B B BB C C C C D D D D E E EE а бв г е д A B C D E F F F AB C D E F F F Деревья с мультифуркациями: примеры совместимых и несовместимых деревьев. Дерево а совместимо с любым из деревеьев б, в, г, д; из последних совместимы только б и в; дерево г совместимо с тремя не изображенными бинарными деревьями, а дерево е не совместимо ни с каким другим на рис. 6.

A B D E FAC D E F A E D F а бв G H H H Расширение понятия совместимости на деревья с частично несовпадающим набором ОТЕ. После исключения специфических ОТЕ B, C, G деревья, производные от а и б, приобретут идентичную топологию; с деревом, производным от в, этого не произойдет.