Институт общей генетики им. Н.И. Вавилова РАН Статистика множественных сравнений в ассоциативных исследованиях полиморфизма ДНК: Кошмар Бонферрони Рубанович.

Презентация:



Advertisements
Похожие презентации
ОСНОВЫ БИОСТАТИСТИКИ Александр Владимирович Рубанович зав. лаб. экологической генетики ИОГен РАН тел. (499)
Advertisements

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
Статистическая гипотеза. Нулевая гипотеза Кошкарова М.
Выполнила: Проверила:
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г. Лекция 4. Проверка статистических гипотез 4-1. Гипотеза о доле признака 4-2. Гипотеза.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
СРС На тему : « Сравнение средних значений признаков по критерию Стьюдента : Критерий Стьюдента для независимых выборок. Критерий Стьюдента для связанных.
Проверка статистических гипотез Лекция 20. План лекции: 1.Проверка статистических гипотез. 2.Критерии асимметрии и эксцесса. 3.Критерий Пирсона.
Общая теория статистики Выборочный метод в статистике. Статистическая гипотеза.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г. Лекция 3. Проверка статистических гипотез 3-1. Общий принцип проверки гипотез 3-2. Гипотеза.
Институт общей генетики им. Н.И. Вавилова РАН 3. Анализ количественных признаков Рубанович А.В. Биостатистика.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Транксрипт:

Институт общей генетики им. Н.И. Вавилова РАН Статистика множественных сравнений в ассоциативных исследованиях полиморфизма ДНК: Кошмар Бонферрони Рубанович А.В.

Опыты по выявлению людей с паранормальными способностями: Joseph Rhine (1950) 1000 человек угадывали последовательность из 10 карт: красная или черная? 12 человек угадали 9 из 10 карт, двое все 10 карт Вывод Д. Райна: «нельзя сообщать подопытным людям об их паранормальных способностях» Все выявленные «экстрасенсы» в последующих опытах не подтвердили свои способности

Что произошло? Шансы найти «экстрасенса» среди 100 человек = 1- Р(100 раз не найти) Шансы найти «экстрасенса» среди 1000 человек =

Точный тест Фишера с помощью монеты Облучение: 9 дицентриков на 1000 клеток Контроль: 1 дицентрик на 1000 клеток против Case: 9 мутаций на 100 больных Control: 1 мутация на 100 здоровых против Значимость различий 9 против 1 равна вероятности выпадения 9 или 10 «орлов» в 10 бросаниях монеты Если объемы выборок равны, значимость различий зависит только от числа событий (числа мутаций в выборках) …и не зависит от самих объемов выборок!!! Эти различия значимы (в единичном тесте ), но при проведении 100 тестов вероятность появления фальшивых отличий равна

Почему в середине 90-ых заговорили о проблеме «multiple comparisons» ? В ассоциативных исследованиях полиморфизма ДНК, как правило, фигурируют 3-5 (или 5-20) полиморфных локусов (это число еще нужно умножить на число заболеваний или сравниваемых признаков) Genome-wide association: изучение экспрессии генов при помощи микрочипов – SNP. При уровне значимости 0.01 можно ожидать 5000 ложных ассоциаций Мета-исследования (исследования исследований): как объединять и сравнивать данные, полученные разными авторами Проведение большого количества тестов (множественных сравнений) связано с опасностью фальшивых открытий

Генерируем две одинаково распределенные выборки по 100 особей с 20-локусными генотипами Как это бывает? Наблюдаем появление фальшивых ассоциаций OR p Ген Выборка 1 Выборка 2 Больные Здоровые Odd Ratio – отношение шансов, популярная мера сопряженности. При отсутствии связи OR=1 1 Должно быть OR=1 Значимо! 234 Сразу 3 локуса «ассоциированы» с заболеваемостью! Частоты минорых аллелей (в среднем 0.1)

Как же избежать фальшивых открытий? При проведении m независимых статистических тестов на уровне значимости, вероятность хотя бы одного фальшивого результата должна быть 1-(1- ) m < 0.05 Правило Карло Бонферрони (1935): При проведение m независимых статистических тестов значимы только те результаты, для которых

Правило Бонферрони ликвидирует значимость вполне определенных результатов: Контроль (100) Больные (100) ORp Мутация 1177,450,0349 Мутация 25153,60,0253 Однако правило Бонферрони требует: p < 0,05/2=0,025 Две мутации, ассоциированные с заболеванием 1 против 7 при равных по объему выборках:

Правило Бонферрони ликвидирует значимость вполне определенных результатов: Контроль (100) Больные (100) ORp Мутация 1177,450,0349 Правило Бонферрони требует: p < 0,05/2=0,025 Одна мутация + любой, не относящийся к делу признак Фамилия начинается с гласной буквы 36401,190,646 Увы, это не шутка!!!

Assessment of individual sensitivity to ionizing radiation and DNA repair efficiency in a healthy population F. Marcona, C. Andreoli, et al. Mut. Res., 541 (2003) Незначимо! Поправка Бонферрони требует: Генотипы

High-Throughput Detection of GST Polymorphic Alleles in a Pediatric Cancer Population P. Barnette, R. Scholl, et al. Cancer Epidemiology, Biomarkers & PreventionVol. 13, 304–313, видов заболеваний 13 генотипов OR=6,4 P=0,007 OR=2,3 P=0,018 Незначимо! Поправка Бонферрони требует: Гомозиготность по делециям GST защищает от рака! Контроль

Implication of Xenobiotic Metabolizing Enzyme gene (CYP2E1, CYP2C19, CYP2D6, mEH and NAT2) Polymorphisms in Breast Carcinoma A. Khedhaier, E. Hassen, et. al. BMC Cancer, 2008 Все стройно, но Бонферрони требует: microsomal Epoxide Hydrolase: Минорный аллель (С) обуславливает пониженную активность фермента У больных 12% гомозигот СС против 6% в контроле При этом среднее время выживания гомозигот СС выше, чем у больных с другими генотипами (повышенная эффективность химиотерапии?)

Bonferroni method creates more problems than it solves Аргументы Томаса Пернежера (Thomas Perneger, 1998): Интерпретация данных зависит от числа тестов. Это противно нашей интуиции. Данные не могут терять значимость от того, что их кто-то подтвердил! При большом количестве тестов гипотеза о том, что все наблюдаемые различия неслучайны, никому не нужна При коррекции Бонферрони вероятность упустить существенные различия столь велика, что …лучше просто перечислить какие тесты дали значимые результаты и, главное, почему Bonferroni adjustments are, at best, unnecessary and, at worst, deleterious to sound statistical inference…

…мы не будем гробить свои результаты из-за какого-то там Бонферрони …спрашивать диссертанта о Бонферрони – это дурной тон …«бонферронофобия» набирает обороты …разработчики программ не желают вводить кнопочку «Bonferroni» …хуже Бонферрони ничего нет, не считая отсутствия всякой коррекции Из разговоров на форуме molbiol.ru:

Чуть-чуть об ошибках статистических тестов Ошибка I рода ( ) Вероятность отвергнуть правильную нулевую гипотезу = Вероятность обнаружить различия там, где их нет = Вероятность совершить фальшивое открытие Ошибка II рода ( ) Вероятность принять неправильную нулевую гипотезу = Вероятность не обнаружить существующие различия = Вероятность упустить открытие Мощность теста = 1- Ошибка II рода = Вероятность правильно отвергнуть нулевую гипотезу Вероятность не упустить открытие Нулевая гипотеза – обычно предположение об отсутствии различий = 2 выборки из одной генеральной совокупности Традиционно биолог ориентирован на контроль ошибки I рода (через уровень значимости), т.е. на гарантии отсутствия ложных открытий, … и при этом мало заботится о возможности упустить открытие (ошибка II рода)

Мощность статистических тестов Мощность 80% считается приемлемой (мощность обычных тестов в реальных ситуациях) Консервативный тест - это тест с низкой мощностью (напр., критерий Колмогорова-Смирнова) Метод Бонферрони – архиконсервативен (особенно при сравнении частот) Во многих случаях коррекция Бонферрони делает выявление значимых результатов попросту невозможным

От чего зависят ошибки статистических тестов? От размаха реально существующих отличий и разброса данных От объемов выборок Ошибки I и II рода однозначно не связаны. В целом ошибка II рода растет при уменьшении ошибки I рода (главная причина маломощности метода Бонферрони ) С увеличением объема выборки мощность теста (вероятность не упустить открытие) всегда возрастает Крайний случай: «критерий» св. Фомы Неверующего (0033) Ошибка I рода = 0 Ошибка II рода = 1 Ошибка I рода (вероятность фальшивого открытия) слабо зависит от объемов выборок, если они сравнимы по величине

Зависимость ошибки II рода от числа тестов при использовании поправки Бонферрони Вероятность пропустить ген с OR=2.7 на выборках 100 (case) и 100 (control) При 100 сравнениях ради того, чтобы гарантировать отсутствие хотя бы одного ложного результата, мы упускаем 88% открытий! При m=100 ошибка равна В отдельном тесте вероятность упустить открытие равна 0.2 При 5 сравнениях упускаем 50% открытий

Новый принцип проверки статистических гипотез: FDR-контроль False Discovery Rate control: Benjamini, Hochberg (1995) Вероятность фальшивого открытия < Уровня значимости Ошибка I рода < 0.05 Средняя доля фальшивых открытий < Выбранный уровень Традиционный принцип заменяется на 105 статей в базе

(Benjamini, Hochberg, 1995) Алгоритм контроля FDR (Benjamini, Hochberg, 1995) Упорядочиваем тесты по уровню p-величин: Упорядочиваем тесты по уровню p-величин: p 1 p 2 … p m. p 1 p 2 … p m. Для контроля FDR на уровне α (например 0.05), Для контроля FDR на уровне α (например 0.05), находим находим Считаем различия значимыми при j = 1, …, j*. Считаем различия значимыми при j = 1, …, j*. При j > j * При j > j * различия считаются незначимыми Порядковый номер гена Желательный уровень значимости Общее число тестов (генов) Величина p для j-ого теста (гена)

Коррекция Bonferroni 0,005 Пример: множественные сравнения по 10 тестам Коррекция по FDR 0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050 Тестpipi 10,001 20, ,01 40,015 50,02 60,04 70,3 80,5 90,6 100,8 Значимые различия без поправок на множественность Располагаем тесты в порядке увелечения p Поправка Бонферрони оставляет значимым лишь первое сравнение В первой клетке как у Бонферрони, во второй клетке вдвое больше, втрое больше и т.д …. Для 6-ого теста p больше этого значения Значимые различия после коррекции по FDR И это все!!!

То же самое в общем случае: m – число сравнений, =0.05 (например) Bonferroni (1939)FDR (1995) p1p1 /m p2p2 2 /m p3p3 /m3 /m … /m … pipi i /m … /m … pmpm Бонферрони торжествует! Контроль FDR приносит ощутимые результаты, если хотя бы один тест удовлетворяет правилу p < /m

Пример: экспрессия 3051 генов при острой лейкемии Golub T.R. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. // Science. 2001, v.286. t-тест: 1045 генов, для которых p

Permutation tests: случайные перестановки пометок «case-control» в компьютерных симуляциях по алгоритму: Что делать, если FDR не помогает? В исходной базе данных делаем случайную перестановку В исходной базе данных делаем случайную перестановку лейблов лейблов case-control Вычисляем заново p-уровни для каждого гена ( p ) Вычисляем заново p-уровни для каждого гена ( p perm ) Повторяем процедуру раз (минимум 10000), фиксируя Повторяем процедуру N раз (минимум 10000), фиксируя случаи, когда p меньше исходного значения p случаи, когда p perm меньше исходного значения p Вычисляем откорректированное p Вычисляем откорректированное p как Тем самым мы отказываемся от попыток вычислить значимость различий. Вместо этого мы ее «измеряем» экспериментально, разыгрывая ситуацию на компьютере Точный тест Фишера – это тоже permutation test, только реализованный аналитически (р вычисляется по формулам комбинаторной теории вероятностей)

SNP Частота минорного аллеля ORp Case (100)Control (100) ,60, ,70, ,80, ,90, ,00, ,00, ,80, ,80, ,30, ,00,911 Значимо без коррекции на множественность p` 0,000 0,010 0,007 0,025 0,109 0,098 0,058 0,067 0,476 1,000 Permutation test применительно к данным об ассоциации заболеваемости с 10 SNP Переставляем отметки «case-control» раз. В результате получаем коррекцию p Значимо по Бонферрони Значимо по FDR Indulgentia Но так бывает не всегда

Почему Почему Permutation test так либерален? Поправки Бонферрони и FDR предполагают, что все тесты Поправки Бонферрони и FDR предполагают, что все тесты независимы независимы Перестановка лейблов «case-control» сохраняет Перестановка лейблов «case-control» сохраняет корреляционные связи между данными корреляционные связи между данными (в случае полиморфных генов можно сказать: «учитывает (в случае полиморфных генов можно сказать: «учитывает неравновесие по сцеплению») неравновесие по сцеплению») Учитывает совместные распределения тестовых Учитывает совместные распределения тестовых статистик статистик В результате В результате Permutation test значительно менее и консервативен, чем Bonferroni и FDR

Не предусмотрен в стандартных статпакетах. Не предусмотрен в стандартных статпакетах. На сегодняшний день доступно: Как реализовать permutation tests? free 30-day demo version FREE!!! Free software environment for statistical computing: встроенные функции + HaploStats, SNPassoc и многое др. И все же всегда проще самому!

Борьба с кошмаром Бонферрони продолжается! Нейронные сети, случайные деревья, Нейронные сети, случайные деревья, генетические алгоритмы, гибсовские поля генетические алгоритмы, гибсовские поля и еще Бог знает что и еще Бог знает что Переход от генотипов к гаплотипам: Переход от генотипов к гаплотипам: реальное уменьшение числа сравнений. реальное уменьшение числа сравнений. Информация о межлокусных корреляциях сохраняется! Информация о межлокусных корреляциях сохраняется! Если число локусов 3, то обычно Если число локусов 3, то обычно число наблюдаемых гаплотипов

/ X. Sole, E. Guino, J. Valls, R. Iniesta1, V. Moreno (2006) Soft для работы с гаплотипами

SNPStats Однолокусный анализ Allele and genotype frequencies Test for Hardy-Weinberg equilibrium Analysis of association with a response variable based on linear or logistic regression Multiple inheritance models: co-dominant, dominant, recessive, over-dominant and additive Analysis of interactions (gene-gene or gene-environment) Многолокусный анализ Linkage disequilibrium statistics Haplotype frequency estimation Analysis of association of haplotypes with the response Analysis of interactions (haplotypes-covariate)

Haplotype association with response (n=164, crude analysis) COMTGSTP1MTHFRFreqOR (95% CI)P-value 1LAC HAC ( ) HGC ( ) LGC ( ) HAT ( )0.15 6LGT ( )0.48 7LAT ( )0.15 8HGT ( )0.036 Global haplotype association p-value: По отдельности локусы не обнаруживают значимых ассоциаций! SNPstats в действии: ассоциации миом с 3 SNP (данные Т.И. Ивановой и Л.Е. Сальниковой, май 2008)

Чтобы не уподобиться старому Джозефу Чтобы преодолеть соблазн раздувать отчет о проделанной работе Чтобы предупредить выпады недоброжелателей Это просто и делается вручную. Если хотя бы одно сравнение проходит через сито Бонферрони, то с Вас хватит FDR. В противном случае Вам не обойтись без перестановочного компьютерного теста. Почему не следует пренебрегать коррекцией на множественность сравнений?

Спасибо Оргкомитету школы и Всем присутствующим !!! С удовольствием предоставлю копию презентации заинтересованными коллегам

Bonferroni, FWER, FDR и все такое Bonferroni контролирует Bonferroni контролирует FWER т.е., вероятность (family-wise error rate), т.е., вероятность хотя бы одного фальшивого открытия хотя бы одного фальшивого открытия ассоциации гена с заболеваемостью ассоциации гена с заболеваемостью FDR – это контроль средней доли FDR – это контроль средней доли фальш-ассоциированных генов среди всех фальш-ассоциированных генов среди всех генов, для которых отвергнута нулевая генов, для которых отвергнута нулевая гипотеза. гипотеза.

Переход от генотипов к гаплотипам Изменчивость признаков не определяется редкими Изменчивость признаков не определяется редкими мутациями отдельных генов, но зависит от большого числа мутациями отдельных генов, но зависит от большого числа SNP (со слабыми индивидуальными эффектами) SNP (со слабыми индивидуальными эффектами) Ассоциативные исследования полиморфизма ДНК Ассоциативные исследования полиморфизма ДНК с необходимостью должны быть многолокусными с необходимостью должны быть многолокусными Association between Common Variation in 120 Candidate Genes and Breast Cancer Risk P. Pharoah, J. Tyrer1 et al. PLoS Genetics, SNP (120 genes), Case , Control – Слабые ассоциации: 104 SNP в 8 генах метаболизма стероидных гормонов 112 SNP в 18 генах контроля клеточного цикла

Число событий в контроле Минимальное число событий в опыте при значимом отличии от контроля u-тест 2Фишер Сравнение частот при уровне значимости 0.05 Объемы выборок в опыте и контроле одинаковы Если в контроле нет аберраций, то при значимости отличий в опыте их должно быть больше 5 независимо от того, сколько клеток Вы просчитали – 100 или 1000