Филогенетические деревья (продолжение) Филогенетические деревья и таксономия организмов Сравнение деревьев Реконструкция филогении (общая схема) Расстояния.

Презентация:



Advertisements
Похожие презентации
Филогенетические деревья. 1) Алфавит без пробелов5 2) Кол-во выравниваний10 3) Глобальное выравнивание10 4) Локальное выравнивание7 5) Афинные гэпы8 6)
Advertisements

Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Классификация и регрессия Доклад по курсу Интеллектуальный анализ данных Закирова А.Р. 1.
Часть 6 3 класс. Арифметические действия (50 часов) Определение остатков, которые могут получаться при делении на данное число. Наименьший и наибольший.
Реконструкция филогении по биологическим последовательностям С.А.Спирин 6.III.2007, ФББ МГУ.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Номер варианта выбирается по параметру зачетки d 10 соотв Задача Коммивояжёра Имеется n городов, занумерованных числами.
1 ДИНАМИЧЕСКАЯ СЕГМЕНТАЦИЯ ПРОСТРАНСТВА ПРИЗНАКОВ ДЛЯ СИСТЕМ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ И СИСТЕМ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ А. Е. Лебедев, А. А.
Параллельное проектирование Таким образом, каждой точке A пространства сопоставляется ее проекция A' на плоскость π. Это соответствие называется параллельным.
Сжатие информации Алгоритм Хаффмана. Сжатие информации Сжатие данных – сокращение объема данных при сохранении закодированного в них содержания.
Множественное выравнивание С.А.Спирин, весна 2009.
Филогенетические деревья Что это такое Общий план действий Программы, которые строят деревья The time will come, I believe, though I shall not live to.
Мультимедийные презентации для уроков математики..
СЛЕДСТВИЯ ИЗ АКСИОМ Если прямая имеет с плоскостью две общие точки, то она лежит в этой плоскости Через прямую и не принадлежащую ей точку проходит единственная.
Решение задач биоинформатики при помощи веб - и интернет - сервисов.
4.4 Прямая и обратная пропорциональные зависимости Школа 2100 school2100.ru Презентация для учебника Козлова С. А., Рубин А. Г. «Математика, 6 класс. Ч.
Полиграфия 2. Выбор форматов издания Харитонов А. Ю. Министерство образования и науки Украины Донецкий национальный технический университет Кафедра компьютерных.
Свойства модулей: Решить уравнение 2.Решить неравенство Поскольку левая часть данного уравнения неотрицательна, то Это позволяет раскрыть.
Дерево (ЕГЭ С3) Выигрышные игровые стратегии. ЕГЭ С3_ Два игрока играют в следующую игру. Имеются три кучи камней, содержащих соответственно 2,
Транксрипт:

Филогенетические деревья (продолжение) Филогенетические деревья и таксономия организмов Сравнение деревьев Реконструкция филогении (общая схема) Расстояния между последовательностями

Филогенетические деревья и таксономия организмов Любая ветвь дерева делит множество листьев на два. Если листья соответствуют ортологичным белкам разных организмов, то одно из получившихся множеств может соответствовать какой-нибудь таксономической группе. Стандарт таксономии для биоинформатики – банк NCBI taxonomy database Тамошняя таксономия сознательно приближена к филогении (парафилетические таксоны, такие как Pongidae, старательно вычищаются). Это вряд ли разумно с точки зрения общей биологии, но удобно, так как позволяет, по сути, свести классификацию к филогении.

Сравнение деревьев Программы реконструкции филогении так же ненадёжны, как и любые другие компьютерные программы предсказания биологических фактов. Поэтому (в частности) возможны различные варианты реконструкции по одним и тем же данным. Встаёт задача сравнения различных деревьев с одним и тем же множеством листьев.

Напоминание: ветвь дерева как разбиение множества листьев A C B D E {A,C} vs {B,D,E} {A,B,C} vs {D,E}

MUSDO DROME CHICK HUMAN RABIT RAT MOUSE HORSE PIG BOVIN MUSDO DROME CHICK BOVIN HUMAN HORSE RABIT PIG MOUSE RAT Что общего у этих двух деревьев?

MUSDO DROME CHICK HUMAN RABIT RAT MOUSE HORSE PIG BOVIN MUSDO DROME CHICK BOVIN HUMAN HORSE RABIT PIG MOUSE RAT

Консенсусное дерево

Дерево большинства (Majority-rule tree) Строится по большому набору деревьев с одинаковым множеством листьев (например, деревья одного и того же набора бактерий, реконструированные по разным ортологическим рядам белков) Включает только те ветви, которые встретились в большинстве деревьев исходного набора.

Схема реконструкции филогении по последовательностям Последовательности Выравнивание Матрица расстояний Филогенетическое дерево «символьно-ориентированные» методы

Матрица расстояний MUSDOCHICKBOVINHUMAN MUSDO CHICK BOVIN HUMAN Множество объектов (последовательностей) превращается в метрическое пространство

Аксиомы метрического пространства: 1) d (A,A) = 0 2) d (A,B) > 0, если A B 3) d (A,B) = d (B,A) 4) d (A,B) d (A,C) + d (B,C) Если расстояние пропорционально эволюционному времени, то эти аксиомы выполняются. Но верно и нечто большее: 4') d (A,B) max ( d (A,C), d (B,C) ) («ультраметрическое пространство»)

Ультраметрическое расстояние AA B C Если d(A,B) > d (B,C), то d (A,C) = d (A,B) Или: из трёх расстояний между тремя объектами два всегда равны между собой и не меньше третьего (это равносильно аксиоме ультраметричности)

Расстояние как число мутаций Расстояние между последовательностями ультраметрично, если его понимать как эволюционное время... Но если неверно предположение о «молекулярных часах», то больше информации несёт понимание расстояния как числа произошедших мутаций. Такое расстояние не обязательно ультраметрично. Аддитивность: если есть четыре последовательности A,B,C,D, то из трёх сумм 1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C) две равны между собой и больше третьей. B A D C

Как оценить расстояние между последовательностями По аддитивному набору расстояний дерево (с длинами ветвей) восстанавливается однозначно! Но в реальности нам даны последовательности и требуется оценить число произошедших мутаций. Это не так просто, поскольку мутации могут происходить в одной и той же позиции.

Как оценить расстояние между последовательностями Всё же простейшая оценка расстояния есть число различий, делённое на длину последовательности. Более изощрённые методы учитывают тот факт, что чем больше наблюдаемое различие между последовательностями, тем больше можно ожидать повторных и возвратных мутаций в одинаковых позициях. Программа protdist (fprotdist): оценка расстояния по методу наибольшего правдоподобия. То, что получается, как правило не обладает (в точности) свойством аддиттивности!