BLAST: Basic Local Alignment Search Tool. BLAST – алгоритм для нахождения участков локального сходства между последовательностями. Алгоритм сравнивает.

Презентация:



Advertisements
Похожие презентации
Решение задач биоинформатики при помощи веб - и интернет - сервисов.
Advertisements

BLAST Что такое выравнивание Выравнивание 2х последовательностей BLAST на NCBI: –Что это такое –Как выбрать правильную программу –Как выбрать правильную.
PSI – BLAST Position-Specific Iterated BLAST. PSI – BLAST: назначение для поиска удаленных белков или новых представителей семейств если простой BLAST.
Гомологи, ортологи, паралоги. Поиск гомологичных последовательностей Осваиваем программу BLAST Осваиваем программу BLAST.
Парное выравнивание FVAH F I AG V DE G A TANL NI.
Продолжить – 19 = = Продолжить Завершить стрельбу.
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
Выравнивания (продолжение) С.А.Спирин, Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные.
Матемтааки ЕТ СТ 2 класс Шипилова Наталия Викторовна учитель начальных классов, ВКК Шипилова Наталия Викторовна учитель начальных классов, ВКК.
Выравнивание последовательностей. Простое взвешивания +1 : вес совпадения -μ : штраф за несовпадение -σ : штраф за делецию/вставку Вес выравнивания =
Урок 2. Информационные процессы в обществе и природе.
«Материалы на стенд» Этапы работы над задачей 1. Анализ текста задачи. 2. Составление таблицы, схемы – краткая запись условия. Поиск решения 3. Выбор.
Java Advanced XML Transformations 1.0 (XSLT 1.0).
Применение генетических алгоритмов для генерации тестов к олимпиадным задачам по программированию Буздалов М.В., СПбГУ ИТМО.
=8 3+5=8 8-3=5 8-5= И К У Л Т Н 4Л 4Л 40 У 45 Н 78 К 75 И 70 Т.
Нахождение одного процента от числа. 1 % от 300 составляет … 0,33300,03 0,003.
T, °C V, м/с Эквивалентные температуры воздуха в штиль(°С) и скорости ветра (м/с) Опас- ность обморо- жения 02,24,46,68,811,013,316,417,
Липлянская Татьяна Геннадьевна учитель математики МОУ «СОШ 3» города Ясного Оренбургской области.
Для учащихся школы 19.
Результаты ГИА по истории Новгородская область.
Транксрипт:

BLAST: Basic Local Alignment Search Tool

BLAST – алгоритм для нахождения участков локального сходства между последовательностями. Алгоритм сравнивает входную последовательность с последовательностями в базе данных, ищет сходные последовательности в базе данных и оценивает статистическую значимость находок.

Protein BLAST: поиск аминокислотной последовательности в базе данных белков Алгоритмы -blastp -psi-blast -phi-blast Здесь описан интерфейс, установленный на «родине» BLAST: National Center for Biotechnology Information (NCBI) в США,

вводим последовательность база данных организм (если надо ограничить) дополнительные параметры protein blast

Параметры сервиса максимальный размер выдачи порог на E-value параметры выравнивания борьба с «участками малой сложности»

Участок малой сложности Ищем: белок P02929 если отключить Compositional adjustments и фильтр, то одной из находок (18-ой от начала) будет следующее: в исходном белке имеется участок, содержащий очень много пролина и глутаминовой кислоты Данное выравнивание не свидетельствует о гомологии, несмотря на хорошее значение E-value (10 -9 )

выбираем formatting options подтверждаем выбор Переход к текстовому виду Чтобы увидеть выдачу самой программы (а не его обработку интерфейсом), можно поступить так:

Что выдает BLAST? Набор последовательностей, сходных с входной последовательностью для каждой находки приведены -E-value (Expect), Bit Score и Score -процент идентичности, сходства (Positives) и пробелов (Gaps) в выравнивании -информация о найденной последовательности

Length=129 Score = 78.6 bits (192), Expect = 9e-15, Method: Compositional matrix adjust. Identities = 34/73 (47%), Positives = 50/73 (68%), Gaps = 0/73 (0%) Query 17 YRLEEVQKHNNSQSTWIIVHHRIYDITKFLDEHPGGEEVLREQAGGDATENFEDVGHSTD 76 Y EEV +H W+I++ ++Y+I+ ++DEHPGGEEV+ + AG DATE F+D+GHS + Sbjct 11 YTHEEVAQHTTHDDLWVILNGKVYNISNYIDEHPGGEEVILDCAGTDATEAFDDIGHSDE 70 Query 77 ARALSETFIIGEL 89 A + E IG L Sbjct 71 AHEILEKLYIGNL 83 Вес в битах Вес E-value Число совпадений Длина выравнивания Длина найденного белка

E-value – ожидаемое количество случайных находок с таким же и лучшим Score (в той же базе данных, с теми же параметрами): E-value=Kmn·e -λS S – Score (вес) m – длина исходной последовательности n – размер базы данных (суммарная длина всех последовательностей) K и λ - параметры Чем меньше E-value, тем больше значимость находки. Bit score (вес в битах) Выражение E-value через биты