Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемВиктория Терёхина
1 QC-pipeline Руководитель: А. Коробейников Студент: К. Федоров
2 Задача Удаление артефактов из ридов: 1)Adapters (Illumina, etc) 2)Cloning Vectors (pUC19, etc) 3)Contaminations (H.Sapiens, etc)
3 Существующие решения Поиск векторов: cross_match Поиск адаптеров: cutadapt, fastX clipper Основные подходы: Выравнивание с помощью blast Некоторые утилиты ищут только точные совпадения
4 Цель Хотим научиться искать искать адаптеры и вектора за приемлемое время Желательно комбинировать различные подходы: точный поиск, выравнивание и т.д. для ускорения работы В качестве источников данных о контаминациях используется база UniVec
5 Точный поискВыравнивание Поиск контаминаций Фильтрация
6 Параллелизация
7 Проблемы (1) ? Выравнивание 250 адаптеров/векторов к 66 млн ридов – около 15 часов ! SIMD реализация SW ускоряет выравнивание ~ 30 раз
8 Проблемы (2) ? Хочется исключить из рассмотрения адаптеры, которые точно не подходят ! Поиск общих к-меров в базе и в ридах
9 Итого Выравнивание + точный поиск контаминаций в датасете из 66 млн ридов проводится за 4 минуты Проект стал частью SPAdes pipeline
10 Спасибо за внимание
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.