Моделирование Нелинейной Взаимосвязи Между Генами на Основе Функции «Копула» Григорьев Д. НИУ ВШЭ, кафедра фондового рынка и рынка инвестиций Кескинбаев А. НИУ ВШЭ, институт развития образования. Львов Н. НИУ РГУ Нефти и Газа им. И.М. Губкина Никитин А. ФГУП ГНЦ РФ ИТЭФ, лаборатория атомно-масштабных исследований Пеникас Г. НИУ ВШЭ, кафедра математической экономики и эконометрики
Развитие геномных проектов Число проектов по секвенированию генома, по данным GOLD Число и количество геномных проектов экспоненциально растет Размер собранных данных превышает террабайты Необходима обработка, оптимизация и проведение аналитических исследований Этап перевода накопленной информации в разряд знания
Генные сети Генная сеть - группа координированно работающих и взаимодействующих между собой генов, контролирующих формирование фенотипических признаков организмов на основе информации, закодированной в геномах Основные задачи в рамках работы с генными сетями ПостроениеВизуализацияАнализ работы
Математическое моделирование генных сетей Систематизация информацииАнализ больших массивов информацииПонимание принципов структурной организацииПонимание механизмов функционированияЗадачи реконструкции генных сетейОценка влияния мутаций на генные сети
Линейные модели Уровень активности гена в определенный момент времени t, определяется суммой активностей остальных генов в предыдущий момент времени, взятых с весами в соответствии со степенью их влияния на интересующий ген Основное препятствие: колоссальный рост числа необходимых для описания сети уравнений с ростом числа генов. Число состояний в которых находятся гены будет пропорционально возрастать как с увеличением числа самих генов, так и с увеличением среднего числа взаимодействий приходящихся на один ген
Баесовские сети Байесовские сети - графические структуры для представления вероятностных отношений между большим количеством переменных и для осуществления вероятностного вывода на основе этих переменных. Применимость: декомпозируемость систем, знание свойств элементов и связей между ними Параметры влияющие на эффективность метода упорядоченность входных данных адекватное задание меры связи между узламинеобходимость независимости распределения случайных величинбольшие временные затраты в случае разветвленных сетейНевозможность использования замкнутых циклов в моделируемых сетях Chen X et al. Bioinformatics 2006;22: Генная сеть, отвечающая за жизненный цикл клетки дрожжей, апостроенная на основе БС
Копула. Понятие и применение R – многомерная случайная величина F – значение ее функции распределения в Многомерная теорема Шкляра утверждает, что существует С: Тогда функция С будет называться копулой и будет определяется как где и- частные CDF
Копула. Понятие и применение Копула – вероятностная функция нескольких переменных, позволяющая связать частные одномерные распределения в одно совместное многомерное. Частные распределения - гауссовскиеКопула - гауссовская Совместное распределение - гауссовское +
Преимущества использования копул при моделировании генных сетей Копула ГауссовскаяСтьюдента Частное распределение Гауссовское Гамма
Перспективы Выбор пула наилучших копул и применение иерархических моделей «копула» для задач секвенирования генома Предложение услуги генотипирования (формулирование характеристики генома клиента), с перспективой формирования единой базы Развитие data mining алгоритмов при извлечении информации из медицинских баз данных
Благодарю за внимание!