Структурное выравнивание - Структура vs Структура - Докинг Структурное моделирование (Структура vs Структура) - Homology modeling - Fold recognition/ Threading.

Презентация:



Advertisements
Похожие презентации
МОДЕЛИРОВАНИЕ ВЗАИМОДЕЙСТВИЯ БЕЛКОВ С МАЛЫМИ МОЛЕКУЛАМИ – РАЗРАБОТКА ЭФФЕКТИВНОГО ИЕТОДА СЛЕПОГО ДОКИНГА Ю.Н. ВОРОБЬЕВ Institute Chemical Biology and Fundamental.
Advertisements

Выравнивание … … последовательностей белков и его биологический смысл.
Выравнивание полипептидных цепей в пространстве С.А. Спирин 20 ноября 2012.
Энзимология и Молекулярная Механика.. Ферменты Фермент направляет реакцию по более «бстрому» пути, одинаково ускоряя прямую и обратную реакции. AB.
Моделирование и исследование мехатронных систем Курс лекций.
Структурные классификации 2012 Классификации трехмерных структур 1.
Подготовил Андреев Алексей. Задача о назначениях Задача о рюкзаке Задача коммивояжера Задача теории распределений Задача маршрутизации транспорта Задача.
ОПТИМИЗАЦИЯ ПЕРЕЛЕТОВ ПРИ ОГРАНИЧЕНИЯХ НА НАПРАВЛЕНИЕ ТЯГИ А. Суханов ИКИ 30 ноября 2004 г.
Модели – уравнения квантовой механики. Модели – уравнения квантовой механики. Методы численного исследования: метод функционала плотности, метод Хартри-Фока.
Графический метод решения задач математического программирования 1. Общий вид задачи математического программирования Z = F(X) >min Z = F(X) >min g i (x.
Реконструкция человеческой позы по сериям изображений Котков Е. Таланов П. Терентьев А. 3057/2.
ТЕОРИЯ УПРАВЛЕНИЯ Конспект лекций в схемах. Раздел I ПОНЯТИЕ И СУЩНОСТЬ УПРАВЛЕНИЯ. РОЛЬ И МЕСТО УПРАВЛЕНИЯ В СОЦИАЛЬНЫХ ПРОЦЕССАХ. Глава 1 ОСНОВНЫЕ СВЕДЕНИЯ.
Физико-математический лицей 30 Computer Graphics Support Group of 30 Phys – Math Lyceum 1 Физико-математический лицей 30 Computer Graphics Support Group.
Некоторые задачи планирования сети магистрального оператора Бутурлин И.А. Российский Университет Дружбы Народов.
Уравнение Ми-Грюнайзена Выполнила: Пятницкая Д., гр Научный руководитель: Кузькин В. А.
С ТАТИСТИЧЕСКИЕ МЕТОДЫ ОБУЧЕНИЯ РАСПОЗНАВАНИЮ ОБРАЗОВ Студент гр Хиндикайнен А.С.
Инновационные разработки в области новых методов лечения заболеваний Проф. О.С.Медведев ФФМ, МГУ им. М.В.Ломоносова.
МНОГООБРАЗИЕ И ЕДИНСТВО МИРА 1. Структурные уровни материи 2. Элементарные частицы, фундаментальные частицы 3. Атомное ядро 4. Молекулы и реакционная способность.
XXXIX Неделя науки СПбГПУ XXXIX Неделя науки СПбГПУ 2010 Визуальное редактирование запросов к поисковой системе с использованием онтологии WordNet А.Н.
Методика и определение SWOT-анализа
Транксрипт:

Структурное выравнивание - Структура vs Структура - Докинг Структурное моделирование (Структура vs Структура) - Homology modeling - Fold recognition/ Threading

Structural Alignment 1)Conserved 1º sequences похожие структуры 2) Похожие структуры conserved 1º sequences ?

Почему структурное выравнивание? Группировка/классификация белков по структурам (по схожести) Определение вклада отдельных аминокислот в образование 3D структуры Определение дистантных гомологов в белковых семействах Предсказание функции белков с низким уровнем sequence similarity с другими белками Исследования: –Структурно-функциональные отношения –Эволюция –Общие блоки\сайты связывания - мотивы

Distance Based Matrix A B DDMs Самый простой метод сравнения структур Не требует ни трансформаций, ни поворотов, ни совмещений Очень эффективен для поиска движений в шарнирах или локальных отличий Интуитивно понятная мера похожести

Совмещение структур A B

Выравнивание структур белков Уровни описания структуры: –Atom –Group – Fragment – Элементы вторичной структуры (SSE) Описание структуры - особенности: –Геометрия/архитектура - координаты/относительные позиции –Топология - порядок аминокислот в белке, взаиморасположение мотивов –Свойства - физико-химические свойства аминокислот 6

Описание структур Structure I Structure II Feature Extraction Structure Description I Structure Description II Comparison Algorithm Constrains Scoring Equivalence RMS Scoring Assessment Statistical Significant? Accurate? Scoring Equivalences: Coordinate based - defined using a transformation of one structure onto the other:root mean square deviation – RMSd Similarity of properties between equivalenced elements - conserved/similar amino acid Similarity of relations between pairs of equivalenced elements - similar distances, internal RMSd Pitfalls of RMSD: all atoms are treated equally (residues on the surface have a higher degree of freedom than those in the core) best alignment does not always mean minimal RMSD significance of RMSD is size dependent Alternative RSMDs aRMSD = best root-mean-square deviation calculated over all aligned alpha-carbon atoms bRMSD = the RMSD over the highest scoring residue pairs wRMSD = weighted RMSD ( W. Taylor(1999), Protein Science, 8: sue3/8272/8272.html#relat)

Поиск оптимального выравнивания B Поиск наибольшего количества атомов, выравненных с наименьшим RMSD (Root Mean Squared Deviation) Поиск баланса между локальными областями с очень хорошим выравниванием и общим выравниванием

Требования для сравнения структур 1. Какой атом структуры A соответствует другому атому структуры B? Вариант ответа – в выравнивании последовательнсотей THESESENTENCESALIGN----NICLEY | | | | | | | | | | | | | | | | | | | | | THESEQ--ENCE--ALIGNEDNICELY 2. Позиции\координаты атомов в структуре? Ответ: PDB-файлы (Dihedral angles, bond lengths …) 9 How good is a particular choice of heuristic and what is the computational cost of the search?

Локальное выравнивание вторичных структур Поиск первичного выравнивания двух белков при помощи динамического программирования для векторов вторичной структуры A B

Сопоставление атомов Применение жадных методов ближайшего соседа для минимизации RMSD между Cα атомами пробы и шаблона (i.e. поиск локальных минимумов в пространстве выравнивания)

Core Superposition Поиск лучшего выравнивания последовательно идущих Cα атомов и минимизация RMSD между ними

RMSD в множественном выравнивании структур A B

RMSD без выравнивания Å -> Essentially Identical Very good fit Moderately good fit Å -> Dubious relationship > 7.0 Å -> Structurally related > 12.0 Å -> Completely unrelated

Пример: Zinc Fingers 248 atoms RMS = 1.42Å 3znf and 4znf 30 CA atoms RMS = 0.70Å

Сервера для выравнивания структур LOCK - hierarchical protein structure Superposition 3dSearch - fast secondary structure superposition CE - Tools for 3-D Protein Structure Comparison and Alignment Using the Combinatorial Extension (CE) Method (no hetero atoms). Дополнительная информация об алгоритмах

Алгоритмы структурного выравнивания Distance based methods : DALI (Holm and Sander): Aligning scalar distance plots (similarity between the 2-D distance matrices) STRUCTAL (Gerstein and Levitt): Dynamic programming using pair wise inter-molecular distances SSAP (Orengo and Taylor): Dynamic programming using intra-molecular vector distances MINAREA (Falicov and Cohen): Minimizing soap-bubble surface area Vector based methods: VAST (Bryant): Graph theory based secondary structure alignment 3dSearch (Singh and Brutlag): Fast secondary structure index lookup Both LOCK (Singh and Brutlag): Hierarchically uses both secondary structure vectors and atomic distances

Docking и Scoring

How Do You Du(o)ck?

Ресурсы Reviews in computational chemistry, vol. 17, 2001, saarland.de/zbi/stud/lehrveranstaltungen/ws01/bioinfor matikI/materialien/PL-Docking.pdf Reviews in comp. chem., Vol Ed. Kenny B. Lipkowitz, Donald B. Boyd

Почему докинг? Молекулярное узнавание – центральный феномен в биологии Ферменты Субстраты Рецепторы Сигналы (лиганды) Антитела Антигены Классификация проблем докинга Докинг белок-лиганд –Rigid-body докинг –Flexible докинг Докинг белок-белок Докинг белок-ДНК

Проблема молекулярного докинга Дано: две молекулы в 3D с атомарным разрешением: Связываются ли они друг с другом? Если да: Как выглядит комплекс? Насколько сильно связывание? Структуры белок-лиганд X-ray (PDB: entries from X-ray) NMR Важность 3D структур Разрешение < 2.5Å Проблема моделирования гомологов

Основные принципы Связывание молекул основано на взаимодействии H-связи, солевые мостики, гидрофобные контакты, эдектростатические взаимодействия Очень сильное отталкивающее влияние VdW на коротких дистанциях. Случайные взаимодействия – слабые и короткие. Сильное связывание предполагает комплементарность поверхностей. Большинство молекул гибкие.

Binding Affinity Склонность к связыванию – энергетическая разность между связанным и свободным состояниями. Среда (обычно вода) играет важную роль. Энтропия вносит значимый вклад. Binding affinity описывает комплекс, а не единичные структуры.

Applications Оценка склонности к связыванию Поиск ключевых структур для белка\ов (виртуальный скрининг). Оценка влияния модификаций ключевых структур. Дизайн лигандов De Novo. Создание библиотек. Предсказание молекулярных комплексов. Распознавание вида связывания. Оптимизация ключевых структур.

Docking и Scoring Идентификация верного связывания лиганда с активным сайтом Пробы Spatial DOF Internal DOF Идентификация верного связывания по наименьшей энергии Функции скоринга - оценка Требования Характеристки

Требования и характеристики Требования Осуществить докинг и его оценку для базы структурно различных (гипотетически) соединений. Идентифицировать weak binders среди non-binders. Идентифицировать как минимум одно соединение с низкой IC50 mM активностью. Оценить ~10000 лигандов в день на процессор. RMS между экспериментом и моделью дока < 2Å - допустимо. Характеристики Высокий уровень false positives и false negatives. Отсутствие универсальной функции оценки.

False Positive и False negative База данных – соединений, среди которых 20 - хорошо связывающихся. При 50% false negatives имеем 10 binders. При 1% false positives имеем 1000 false positives. Если мы можем лабораторными методами проверить молекул (серьезный труд) из 1010 позитивных хитов, то 60% за то, что мы не получим ни одного верного соединения. Для того, чтобы достичь 90% успеха в определении верного хита уровень false positives должен быть 0.2% Допустим

Что такое Docking? Вычислительный подход к предсказанию взаимодействий между белками или между белками и другими молекулами (лигандами) Предположение: компоненты, которые хорошо стыкуются, могут и связываться друг с другом. Предсказание какие протеины могут взаимодействовать друг с другом Предсказание сайтов для такого взаимодействия Автоматизированное предсказание для белок–лекарственного взаимодействия Улучшение и облегчение инженерии белков и разработки лекарств (drug design)

Docking – почему это важно? Биомолекулярные взаимодействия – ядро всех регуляторных и метаболических процессов. Роль компьютерного анализа возрастает, поскольку растут объёмы баз данных известных структур. Увеличение вычислительных мощностей позволяет производить более детальный анализ и предсказание молекулярных взаимодействий. Автоматизированное предсказание молекулярных взаимодействий – ключ к рациональной разработке новых лекарств.

Цели докинга Для двух заданных биомолекул определить: 1.Могут ли они взаимодействовать согласно Gibbs free energy Есть ли такая энергетически выгодная ориентация двух молекул, при которой одна может модифицировать функцию\свойства другой? Могут ли две молекулы «соответствовать» друг другу в каком- либо энергетически выгодном состоянии? 2.Если могут, то какова их ориентация, которая сделает взаимодействие максимальным при минимизации общей «энергии» комплекса? Цель: Найти такие молекулы в базах данных молекулярных структур.

Docking – Совмещение (Superposition) Найти матрицу трансформации, которая наилучшим образом перекроет стол и стул. Иными словами найти такую матрицу трансформации, которая минимизирует RMS между соответствующими точками стола и стула. Соответствия: Верх стула – верх стола Бок стула – бок стола и т.д.

Алгоритм абсолютной ориентации Ключ – нахождение соответствующих точек между двумя структурами Docking – Совмещение (Superposition)

Docking – почему это так непросто? Обе молекулы гибкие и могут изменять друг друга во время взаимодействия: Степени свободы Допустимые конформации

Белок-белковое взаимодействие Обе молекулы рассматриваются как rigid bodies (но можно и иначе!). Огромная область для поиска (6 dof: 3 поворота, 3 перемещения) Стерические/энергетические ограничения для уменьшения области поиска.

Полости, впадины и взаимодействие CASTp Идентификация и характеризация областей на поверхности (и внутренних, недоступных для взаимодействия) белков и иных молекул. MolSurfer Белок-белковые интерфейсы PASS Быстрое определение и визуализация впадин для предсказания сайтов связывания Surface Racer Расчет доступной дл явзаимодействия поверхности, её кривизны и впадин (включая внутренние). SURFNET Поверхности и доступные области на молекулярных поверхностях ASC Набор скриптов для расчета поверхностей на базе PDB файла

CAPRI CAPRI: Critical Assessment of PRediction of Interactions CAPRI First community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

Жесткий докинг Допущения Ригидный белок Ригидный лиганд Применения метода Докинг малых или очень ригидных молекул. Докинг фрагментов (гибкий докинг дизайн De Novo). Докинг по базе мульти-конформеров.

The Clique Method Сопоставляем подходящие точки/характеристики двух молекул (рецептора и лиганда). 1.Для N сайтов рецептора и n сайтов лиганда образуем N x n узлов. 2.Для каждой пары узлов определяем Δd = D receptor sites – D ligand sites. 3.При Δd < ε, соединяем узлы линиями. 4.A clique – подграф, в котором все узлы соединены между собой. A B C D рецептор b ca лиганд Aa Ab Ba CaCb Ac BcBb Cc Da Db Dc Distance compatibility graph

The Dock Program X-ray structure of HIV proteaseConnolly surface for active site Active site заполнен сферами. Их центры – потенциальные места для атомов лиганда.

The Dock Program Центры сфер соответствуют атомам лиганда. Используя clique technique (до 4 точек на cliques), можно определить возможные ориентации лиганда. Обычно генерируется несколько десятков тысяч ориентаций для каждой молекулы. Лиганд представляется как перекрывающиеся сферы (или как атомы) Scoring Shape scoring – используя аппроксимацию: Lennard-Jones potential. Electrostatic scoring – ПО DELPHI, расчет электростатического потенциала. Force-field scoring – потенциал AMBER. Модель с наивысшим score vs X-ray структура

Гибкий докинг: Допущения Гибкость лиганда ограничена торзионными углами + кольцевыми структурами. Конформационные ансамбли –Жесткий докинг пула конформаций для каждой молекулы (DOCK). Фрагментация лиганда –Постепенно наращиваемые конструкции (FlexX) –«Вписываем-соединяем» Явный конформационный поиск –Генетические алгоритмы (GOLD) –Monte Carlo (LigandFit) Симуляции Белок рассматривается как почти полностью жесткая молекула Множественные модели белка (FlexE) Симуляции

Гибкий докинг: Применения Анализ комплексов, поиск возможных вариантов связывания. Виртуальный скрининг по базам малых молекул.

Incremental Construction Стратегия Разбиение молекулы на фрагменты. Вставка одного или нескольких фрагментов в активный сайт, игнорируя положение остальных. Последовательное добавление остальных фрагментов. Стратегия поиска Жадный поиск: После добавления фрагмента – выбор конформацию с наивысшей оценкой. Остальные отбрасываем. –Линейный масштаб от количества фрагментов. –Без учета возможных взаимодействий между фрагментами.

The FlexX Program Взаимодействия белок-лиганд описываются типами и геометрией. Типы взаимодействия делятся на группы и «антигруппы». Уровень взаимодействия - геометрия. Чем выше уровень, тем более строгие требования к геометрии взаимодействия.

Геометрия взаимодействия Взаимодействие между группой A лиганда и группой B белка наблюдается, если: 1.Группа взаимодействия B находится в антигруппе A. 2.Центр взаимодействия A лежит примерно на поверхности взаимодействия B и наоборот. O Центр взаимодействия Поверхность взаимодействия O H N H-bond donor H-bond acceptor

Геометрия взаимодействия Hydrogen bonds (3) Hydrophobic: Aromatic (2) Hydrophobic: Aliphatic (1)

Гибкость белков Protein flexibility and drug design: how to hit a moving target Несмотря на миллионы лет эволюции, создававшей рецепторы, которые могут распознавать специфический лиганд мы все ещё можем идентифицировать молекулы, которые связываются с ним с большей афинностью Сайт связывания может взаимодействовать с множеством молекул – существует возможность реорганизации сайта с относительно небольшим «штрафом» для соответствия малой молекуле. Двойная природа сайта связывания– высокая стабильность и высокая гибкость (зачастую большая, чем у белка в целом). Парадигма «Ключ-замок» устарела. Белок – совокупность предопределенных состояний. Carlson/ Curr. Op. Chem. Biol. 2002, 6:

Решения Использование единичной структуры белка в эксперименте докинга может пропустить возможное взаимодействие Cross docking Докинг всех лигандов на все имеющиеся структуры белка с дальнейшим объединением в ранжированный список. Ограничено имеющимися конформациями белка. Protein flexibility FlexE –Включает все комбинации структур белка.

Гибкость белков

Взаимодействие «Белок-Лиганд» Идентификация сайтов взаимодействия между белком (rigid body) и подвижной, гибкой малой молекулой (лигандом) Очень большое поле поиска Рассматривать лиганд как rigid body Или как фрагменты rigid body, соединенные гибкими связками. Метод Монте-Карло или MD.

Лиганд 2 типа: -Связывание средней силы, но в конформации c минимальной свободной энергией (most populated). или - Сильное связывание с менее выгодной конформацией (less populated). Связывание может сдвигать распределение (induced-fit system).

Взаимодействие «белок-лиганд». Серверы LPC-CSU Server: Предсказание контактов «лиганд- белок» и контактов структурных элементов LigBase: Структурная БД сайтов связывания

Multiple Protein Structure Abl связывается с STI-571 в неактивной конформации петли Abl. Abl связывается с PD – «петля активации» в иной конформации (активная киназа). Nagar et al./ CANCER RESEARCH 62, 4236–4243, August 1, 2002

MPS Nagar et al./ CANCER RESEARCH 62, 4236–4243, August 1, 2002

Grid Based Dock Scoring Сначала - Расчет вероятных взаимодействий Построение сети – объем такой же, как и у белка Расчет стерических и электростатических взаимодействий в каждой точке сети Ориентация лиганда – scoring суммированием взаимодействий с точками сети Пренебрегаем: электростатические взаимодействия с растворителем изменения энтропии изменения конформации белка

Drug Design

~6-7 лет. 3 фазы