Лекция 1 Статистические расследования в диагностических исследованиях 1.

Презентация:

Advertisements

Похожие презентации

ПРИМЕНЕНИЕ СКРИНИНГА В ЭПИДЕМИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ.

Advertisements

Статистическая гипотеза. Нулевая гипотеза Кошкарова М.

Вербальные шкалы 1. Надежность доверительных интервалов (ДИ) Уровень значимости α Уровень доверия 100(1 – α)% Степень надёжности ДИ 0,0595%Низкая 0,0199%Средняя.

Выравнивание статистических рядов. Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений.

Доверительный интервал и доверительная вероятность.

Лекция 5. Модели надежности программного обеспечения Учебные вопросы: 1. Классификация моделей надежности 2. Аналитические модели надежности 3. Эмпирические.

Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.

РАЗДЕЛ 1. "ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ ОБЩЕСТВЕННОГО ЗДОРОВЬЯ И ОРГАНИЗАЦИИ ЗДРАВООХРАНЕНИЯ" Тема 1.2. «Основы медицинской статистики и организации статистического.

ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.

Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.

ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.

Обзор процесса изменения практики использования лекарств 1. ИЗУЧИТЕ Оцените существующую практику (Описательное количественное Исследование) Улучшить диагностику.

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.

СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.

Рак щитовидной железы. РАК ЩИТОВИДНОЙ ЖЕЛЕЗЫ Рак щитовидной железы злокачественная опухоль, развивающаяся из ткани щитовидной железы. Рак щитовидной железы.

Статистические оценки параметров распределения Доверительные интервалы.

Актуальные вопросы оценивания решения задач части 2 экзаменационной работы по математике.

Элементы теории вероятности и математической статистики Теория вероятностей возникла как наука из убеждения, что в основе массовых случайных событий лежат.

Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.

Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.

Транксрипт:

Лекция 1 Статистические расследования в диагностических исследованиях 1

Ранняя диагностика рака молочной железы - Маммография 2

Заболевания молочных желез - достаточно частая патология. Лишь 3% из них – злокачественные, 97% составляют другие: – мастопатии, в том числе, – кистозные формы, – доброкачественные узловые процессы и – фиброаденомы. 3

По данным Всемирной Организации Здравоохранения (ВОЗ – WHO) в мире ежегодно регистрируется более 1,2 млн. новых случаев заболевания раком молочной железы. 4

Маммография Маммография раздел медицинской диагностики, занимающийся неинвазивным исследованием молочной железы, преимущественно женской. Обследования молочных желез проводится с помощью малых доз рентгеновского излучения (обычно около 0,7 м Зв). Рентгеновская маммография считается эффективным методом для выявления рака молочной железы. В развитых странах Европы все женщины старше лет проходят обязательную процедуру рентгеновской маммографии (1-2 раза в год), что позволило значительно снизить смертность от рака молочной железы. 5

Грэй Грэй (обозначение: Гр, Gy) единица измерения поглощенной дозы ионизирующего излучения в системе СИ. Поглощенная доза равна одному грэю, если, в результате поглощения ионизирующего излучения, вещество получило один джоуль энергии в расчёте на один килограмм массы. Через другие единицы измерения СИ грэй выражается следующим образом: Гр = Дж / кг = м 2 / с 2 Единица названа в честь британского учёного Льюиса Грэя в 1975 г. Ранее широко использовалась (а иногда используется и до сих пор) внесистемная единица поглощённой дозы «рад». 1 Гр = 100 рад 6

Зиверт Зиверт (обозначение: Зв, Sv) единица измерения эффективной и эквивалентной доз ионизирующего излучения в системе СИ (используется с 1979 г.). Через другие единицы измерения СИ зиверт выражается следующим образом: 1 Зв = 1 Гр = 1 Дж / кг = 1 м² / с² Равенство зиверта и грэя показывает, что эффективная доза и поглощённая доза имеют одинаковую размерность, но не значит, что эффективная доза численно равна поглощённой дозе. При определении эффективной дозы учитывается биологическое воздействие радиации, она равна поглощённой дозе, умноженной на коэффициент качества, зависящий от вида излучения. Единица названа в честь шведского учёного Рольфа Зиверта (Rolf Sievert). 7

Будьте осторожны! Современное рентгеновское оборудование позволяет максимально снизить лучевую нагрузку на пациента, что соответствует требованиям Федерального закона РФ «О радиационной безопасности населения» 3 - ФЗ от г. 8

Приказ Минздравсоцразвития РФ от О мерах по совершенствованию медицинской помощи при заболеваниях молочной железы Основными задачами рентгенотомографического кабинета общего назначения являются: - уточнение диагноза и определение объема медицинской помощи при заболеваниях молочной железы; - профилактическое обследование молочных желез у женщин, не имеющих жалоб, старше 40 лет; - диагностика заболеваний молочных желез у женщин любого возраста при наличии соответствующих жалоб.

Маммограф 10

Рабочая зона маммографа 11

Компьютеризированный маммограф 12

Процедура проведения маммографии 13

Мамограмма: Стрелкой на рентгеновском снимке молочной железы показано возможное злокачественное образование.

Сложности маммографии при ожирении

Массовый маммографический скрининг Banks E., Reeves G., Beral V., Bull D., Crossley B., Simmond M., Hilton E., Bailey S., Barret N., Briers P., Englis R., Jackson A., Kutt E., Lavelle J., Rockal L., Wallis M.G., Wilson M., Patnick J. Influence of personal characteristics of individual women on sensitivity and specificity of mammography in the Million Women Study: cohort study BMJ, 2004; Vol. 329; No 7464; p

Что такое скрининг? Скрининг (от англ. screening «просеивание») общее название методов специальных проверок, обследований, применяемых в медицине, биохимии, а также в бизнесе и т. п. В медицине под скринингом понимают проведение простых и безопасных исследований больших групп населения с целью выделения групп риска развития той или иной патологии.

Таблица 2 × 2 – удобная, наглядная и компактная форма представления результатов сравнения диагностических методов

Результаты маммографического скрининга Результат Маммографии Рак молочной железы (биопсия)Всего Есть [+]Нет [-] Положительный [+] Отрицательный [] Всего (объем выборки)

Что такое когортное исследование? В когортном исследовании субъекты отбираются случайным образом до того, как у них определяется наличие или отсутствие тестируемого заболевания. Такое исследование является наилучшим способом оценить распространенность данного заболевания. Однако, когортные исследования дорогие и занимают очень много времени. Особенно, если заболевание редкое. 20

Можем ли мы доверять результатам маммографических обследований?

«Анатомия» таблиц 2×2 в диагностических исследованиях

Основные обозначения для исходов диагностического исследования D = результаты, полученные с использованием эталона сравнения (от англ. Disease). D+ = наличие болезни по результатам, полученным с использованием эталона сравнения. D- = отсутствие болезни по результатам, полученным с использованием эталона сравнения. T = результаты, полученные с использованием данного диагностического средства (от англ. Test). T+ = положительный результат теста. T- = отрицательный результат теста.

Символика таблицы 2×2 при диагностических исследованиях. Исходы тестирования Эталон Всего [+][-] Тест [+] (T+, D+) Истинные «позитивы» (TP – True Positive) (T+, D-) Ложные «позитивы» (FP –False Positive) T+ [-] (T-, D+) Ложные «негативы» (FN – False Negative) (T-, D-) Истинные «негативы» (TN – True Negative) T- Всего D+D-

Таблица 2 × 2 – удобная, наглядная и компактная форма представления результатов сравнения диагностических методов Изуча- емый метод Эталон сравнения («Золотой стандарт») Всего [+][+][] [+][+]aba + b []cd c + d Всего a + cb + d n Обычно (по умолчанию): – В столбцах такой таблицы представляют результаты применения Эталона сравнения («Золотого стандарта»). – В строках таблицы представляют результаты применения изучаемого метода. Иногда, однако, строки и столбцы в таблице меняют местами. 25

Таблица 2 х 2: возможные исходы диагностического исследования и их наблюдаемые численности Прове- ряемый метод диагностики Эталон сравнения Всего [+][] [+][+] (T+, D+) a (T+, D-) b (T+) a + b [] (T-, D+) c (T-, D-) d (T-) c + d Всего (D+) a + c (D-) b + d n Наблюдаемые численности: a – число верно положительных результатов тестов (T+, D+), истинных «позитивов» b – число ошибочно положительных результатов теста (T+, D-), ложных «позитивов» с – число ошибочно отрицательных результатов теста (T-, D+), ложных «негативов» d – число верно отрицательных результатов тестов (T-, D-), истинных «негативов» 26

Результаты маммографического скрининга Маммо- графия Рак молочной железы (биопсия) Всего Есть, [+]Нет, [-] [+][+]a 629 b a + b []с 97 d с + d Всегоa + с 726 b + d n

Статистический анализ – единственный путь оценки и сравнения диагностических методов Точный (по возможности максимально безошибочный) диагноз – одна из важнейших задач медицины. Однако Диагност обречен использовать несовершенные методы диагностики. Поэтому лучший и фактически единственный путь работать с несовершенной информацией – использовать статистические методы и выражать результаты диагноза и прогноза в терминах вероятности. 28

Что такое «Золотой стандарт»? «Золотой стандарт» – такой диагностический тест, который максимально точно (практически безошибочно) определяет наличие или отсутствие определенной болезни у пациента. Например, при диагнозе рака одними из наиболее убедительных принято считать результаты гистологической диагностики. Эталонный метод диагностики совсем не обязательно должен быть единственным. Чаще всего это есть результат применения нескольких диагностических методов. 29

«Золотой стандарт» или Эталон сравнения? Ранее эталонный метод диагностики называли «Золотым стандартом », но сейчас стало ясно, что этого словосочетания следует избегать, поскольку даже наилучшие методы диагностики не являются совершенными. Например, даже клинические диагнозы, сопровождаемые результатами наиболее эффективных гистопатологических анализов, оказываться несвободными от ошибок. Поэтому предпочтительнее использовать термин «Эталон сравнения».

Проблема сравнения тестов Золотой стандарт – желательный, но практически недостижимый идеал. К тому же часто он бывает дорог, болезнен, рискован и потому его нецелесообразно использовать в скрининговых исследованиях. Очевидно, что и врач и пациент воздержатся от его применения, если им будет предложен другой более простой, щадящий, но не менее надежный метод диагностики. Вопрос: как убедиться в надежности нового метода? 31

Требования к проведению проверки качества диагностического теста Процедура проверки предлагаемого метода диагностики должна быть стандартизирована и внятно изложена в соответствующей нормативной документации (инструкциях, протоколах исследования, методических указаниях, методических рекомендациях, или иных подобных документах). При проверке метода и интерпретации получаемых результатов следует неукоснительно руководствоваться положениями таких документов. 32

ГОСТ Р Настоящий стандарт устанавливает единые правила оценки клинической информативности лабораторных исследований, выполняемых в клинико- диагностических лабораториях медицинских организаций в целях оценки состояния здоровья, клинической диагностики и слежения за эффективностью лечения пациентов.

Статистическое оценивание - одна из основных задач статистики. Цель – по возможности точно и надежно определить (вычислить) значение той или иной числовой характеристики (параметра). Материалом для этого служат имеющиеся статистические данные. При оценивании параметров на основе варьирующих данных нельзя ограничиваться одним числом. Обязательно нужны еще оценки их варьирования. 34

Два основных типа статистических оценок Точечное оценивание – оценка одним числом. Интервальное оценивание – оценка интервалом. В статистике для интервального оценивания используются Доверительные Интервалы. Доверительный интервал это такой интервал, который содержит (накрывает) оцениваемый параметр с заданной вероятностью. Такая вероятность называется Доверительной Вероятностью или Уровнем Доверия. Уровень Доверия выбирается исследователем. 35

Статистические оценки вероятностей в диагностических исследованиях

Результаты маммографического скрининга Маммо- графия Рак молочной железы (биопсия)Всего Есть, [+]Нет, [-] [+][+]a 629 b a + b []с 97 d с + d Всегоa + с 726 b + d n

Обозначения P или Pr – вероятность Например, P(D+) – вероятность заболевания; она называется распространенностью заболевания. f – наблюдаемая (относительная) частота события. Например, f(D+) – доля субъектов с данной болезнью в исследуемой группе (выборке) Частоты (доли) могут служить статистическими оценками вероятностей P.

Вероятности исходов Эталон Всего [+][-] Тест [+] P(T+, D+) P(T+, D-) P(T+) [-] P(T-, D+) P(T-, D-) P(T-) Всего P(D+)P(D-) 1

Основная логика статистического оценивания: точечные оценки Обычно вероятности P (или иные параметры) нам неизвестны. Мы их оцениваем по наблюдаемым численностям: a, b, с и d. Например, разумной и интуитивно понятной точечной оценкой для распространенности болезни по данным когортного исследования P(D+) может служить наблюдаемая частота f(D+) = (a + c) /n, т.е. доля больных от общего числа n обследованных.

Основная логика статистического оценивания: интервальные оценки Понятно, что если мы многократно повторим сравнения данного диагностического теста с эталоном сравнения, то наблюдаемые частоты f(D+) = (a + c) /n неизбежно будут варьировать. Поэтому задача математиков – вывести математический закон (вероятностное распределение), которому подчиняется варьирование этой частоты. Если такой закон найден, то тогда можно получить доверительные интервалы (ДИ) для оценки распространенности болезни P(D+) с заданной доверительной вероятностью (1 – α).

Итак, еще раз: Что такое Доверительный Интервал (ДИ)? Доверительный Интервал (ДИ) есть такой интервал, который с заданной (доверительной) вероятностью (1 – α) накрывает искомое оцениваемое значение параметра. Синонимы: Интервал Доверия Интервал Накрытия Принципиально важно понимать, что ДИ является случайным. Это означает, что от опыта к опыту его границы будут колебаться, варьировать. 42

Доверительный интервал 43

Точность и надежность статистических оценок Чем уже ДИ, тем оценка точнее. Чем больше доверительная вероятность (1 – α), тем оценка надежнее. Однако ДИ с доверительной вероятностью 100% - бессмыслен. Например, 100%-й ДИ для доли будет содержать все значения в границах от 0 до 1: [0, 1].

Надежность (убедительность) доверительных интервалов (ДИ) Уровень значимости, α Уровень доверия, (1 – α)×100% Надежность интервальной оценки 0,0595% Приемлемая 0,0199% Удовлетво- рительная 0,00199,9% Высокая

ДИ Итак, 99%-й ДИ означает, что если мы многократно повторим наши наблюдения, то в 99% случаев получаемые интервалы накроют (неизвестное) значение оцениваемой вероятности P (или иного параметра θ). Но в 1% случаев мы можем «промахнуться»: вычисленный интервал не накроет искомое значение. И промах этот может случиться как раз с данной конкретной выборкой. Отсюда мы приходим к выводу о неизбежной необходимости многократно повторять опыты (или наблюдения). 46

Наши жизненные достижения Смысл «99%-й доверительной вероятности» можно интерпретировать в терминах достижений нашей жизни. Если мы за всю свою жизнь построили много 99%-х ДИ, то приблизительно 99% этих ДИ действительно содержали неизвестные оцениваемые значения. 47

Наши жизненные достижения Поигрывая в картишки в доме престарелых и вспоминая свою жизнь, мы будем испытывать удовлетворение от того, что в 99% случаев наши ДИ были правильными. Однако к этому чувству будет примешиваться огорчение, поскольку 1% интервалов были неверны. И мы никогда не сможем узнать, в каких случаях результаты нашего труда были верны, а в каких нет! Такова неизбежная неопределенность статистических выводов. По: Сигел Э. Практическая бизнес-статистика. – М.: Издательский дом «Вильямс», – 1056 с. (с ) 48

Основные вероятностные показатели способности диагностического теста распознавать наличие или отсутствие болезни Чувствительность теста - Se Специфичность теста – Sp Отношение правдоподобий для положительных результатов теста – LR[+] Отношение правдоподобий для отрицательных результатов теста – LR[-]

Показатели качества проверяемого диагностического теста Эталон [+][-] Тест [+][+] Se = P(T+|D+) = = P(T+, D+)/P(D+) P(T+|D-) = = P(T+, D-)/P(D-) [] P(T-|D+) = = P(T-, D+)/P(D+) Sp = P(T-|T-) = = P(T-, D-)/P(D-) Всего 11

Символ «вертикальная линия» в теории вероятностей В теории вероятностей вертикальной линией обозначают условные вероятности. Выражение P(A|B) означает вероятность наблюдать случайное событие A при условии, что произошло случайное событие B. Чувствительность и специфичность являются такими условными вероятностями. Например, P(T+|D+) есть вероятность получить положительный результат диагностического теста у субъекта с данной болезнью, т.е. при условии наличия у него болезни.

Что такое Чувствительность диагностического теста? Чувствительноть Se (от англ. Sensitivity) есть количественный показатель способности диагностического теста распознавать наличие болезни. Она есть условная вероятность истинного «позитива», т.е. вероятность получить положительный результат теста у субъекта с выявляемой болезнью: P(T+|D+) = P(T+,D+)/[P(D+)]. Ее статистической оценкой является доля истинных позитивов среди субъектов с болезнью: f(T+|D+) = f(T+,D+)/[f(D+)] = a/(a + c).

Что такое Специфичность диагностического теста? Специфичность Sp (от англ. Specificity) есть количественный показатель способности диагностического теста распознавать отсутствие болезни. Она есть условная вероятность истинного «негатива», т.е. вероятность получить отрицательный результат теста у субъекта без выявляемой болезни: P(T-|D-) = P(T-,D-)/[P(D-)] Ее статистической оценкой является доля истинных негативов среди субъектов без болезни: f(T-|D-) = f(T-,D-)/[f(D-)] = d/(b + d)

Эталон сравнения («Золотой» стандарт) Итак, в терминах чувствительности и специфичности, Эталон сравнения («Золотой стандарт») – это такой диагностический тест (метод), который одновременно обладает идеальными (100%-ми) чувствительностью и специфичностью. 54

Идеал Тест Эталон [+][-] [+]a0 [-]0d Чем меньше ложных «позитивов» и ложных «негативов» дает тест, тем он лучше. Se = a/(a + 0) = 100% Sp = d/(0 + d) = 100%

Вычислительные формулы для оценки вероятностных показателей качества диагностического теста Эталон [+][-] Тест [+][+] Se = a/(a + c)f(T+|D-) = b/(b + d) [] f(T-|D+) = c/(a + c)Sp = d/(b + d) Всего 11

Компактная форма записи для совместного представления точечных и интервальных оценок Пример: – Точечная оценка: 0,87 – Нижняя граница 99%-го доверительного интервала (ДИ): 0,83 – Верхняя граница 99%-го ДИ: 0,90 Компактная запись: 0,83 0,87 0,90 57

Точечные и интервальные оценки вероятностных показателей качества маммографического тестирования Маммография Рак молочной железы (биопсия) есть, [+]нет, [-] [+][+] Se = f(T+|D+) = 629/726 = 0,83 0,87 0,90 f(T+|D-) = 3885/ = 0,031 0,032 0,033 [] f(T-|D+) = 97/726 = 0,10 0,13 0,17 Sp = f(T-|D) = / = 0,967 0,968 0,969 Всего 11 Слева и справа от точечных оценок в виде подстрочников указаны границы 99%-х ДИ

Что такое Отношение Правдоподобий, LR? Суммировать информацию о качестве диагностического теста можно с помощью показателя, который называется Отношением правдоподобий, LR (Likelihood Ratio). Отношение правдоподобий сводит воедино информацию о чувствительности и специфичности проверяемого диагностического теста. Оно сообщает нам, насколько сильно полученные результаты теста изменяют вероятность наличия данной болезни у пациента.

Что такое Отношения Правдоподобий для положительных и отрицательных результатов диагностического теста? Отношение правдоподобий для положительных результатов диагностического теста LR[+] = f(T+|D+) / f(T+|D-) показывает, во сколько раз доля истинных «позитивов» (верно положительных результатов диагностического теста) превышает долю ложных «позитивов» (ошибочно положительных результатов теста). Отношение правдоподобий для отрицательных результатов диагностического теста LR[-] = f(T-|D+) / f(T-|D-) показывает, во сколько раз доля ложных «негативов» (ошибочно отрицательных результатов диагностического теста) меньше доли истинных «негативов» (верно отрицательных результатов теста).

Как оценивать Отношение Правдоподобий для положительных результатов теста T+? 61

Как оценивать Отношение Правдоподобий для отрицательных результатов теста T-? 62

Как интерпретировать LR [+] LR[+] показывает, во сколько раз чаще положительные результаты данного диагностического теста будут получаться у больных, чем у здоровых. Чем больше LR[+], тем выше способность положительных результатов теста распознавать наличие болезни. 63

Как интерпретировать LR [-] LR[-] показывает, во сколько раз реже отрицательные результаты данного диагностического теста будут получаться у больных, чем у здоровых. Чем меньше LR[-], тем лучше способность отрицательного результата теста распознавать отсутствие болезни. 64

LR[+] = f(T+|D+) / f(T+|D-) > 1 означает, что положительный результат теста более вероятен при наличии у пациента болезни, чем при ее отсутствии. Иными словами, если LR[+] > 1, то это означает, что после получения положительного результата теста вероятность обнаружения у субъекта болезни возрастает. Если же LR[+] < 1, то это означает, что положительный результат теста менее вероятен при наличии у пациента болезни, чем при ее отсутствии. Иными словами, если LR[+] < 1, то это означает, что после получения положительного результата теста вероятность обнаружения у субъекта болезни уменьшается.

LR[-] = f(T-|D+) / f(T-|D-) < 1 означает, что отрицательный результат теста более вероятен при отсутствии у пациента болезни, чем при ее наличии. Иными словами, если LR[-] < 1, то это означает, что после получения отрицательного результата теста вероятность отсутствия у субъекта болезни возрастает. Если же LR[-] > 1, то это означает, что отрицательный результат теста менее вероятен при отсутствии у пациента болезни, чем при ее наличии. Иными словами, если LR[-] > 1, то это означает, что после получения отрицательного результата теста вероятность отсутствия у субъекта болезни уменьшается.

Идеальный, бесполезный и «вредный» тесты Если тест идеальный, то LR[+] = и LR[-] = 0. Если LR[+] = LR[-] = 1, то тест бесполезен. Если LR[+] 1, то тест следует признать даже «вредным».

Принятые словесные интерпретации для градаций LR[+] LR[+] Способность положительных результатов диагностического теста распознавать наличие болезни: > 100 чрезвычайно высокая 33 – 100 отличная 10 – 33 хорошая 3 – 10 удовлетворительная 1 – 3 неудовлетворительная

Принятые словесные интерпретации для градаций LR[-] LR[-] Способность отрицательных результатов диагностического теста распознавать отсутствие болезни: 1 – 0,3 неудовлетворительная 0,3 – 0,1 удовлетворительная 0,1 – 0,03 хорошая 0,03 – 0,01 отличная < 0,01 чрезвычайно высокая

Статистическая интерпретация ДИ для LR Если (1 - )х 100%-й доверительный интервал (ДИ) для того или иного отношения правдоподобий (для LR[+], или для LR[-]) накрывает практически бесполезное (неинформативное) значение LR = 1, то у нас нет оснований считать, что оцениваемое значение LR статистически значимо отличается от 1. Если (1 - )х 100%-й ДИ для LR не накрывает значение LR = 1, то у нас появляется основание сомневаться в том, что оцениваемое значение LR равно 1. Это является следствием того факта, что при многократных повторениях диагностического исследования границы ДИ для LR неизбежно будут варьировать, однако, доля тех из них, которые накроют значение LR = 1, не превысит выбранного нами уровня значимости. 70

Статистическая значимость Когда ДИ для LR не накрывает значение LR = 1, то в таких случаях говорят, что оцениваемое (неизвестное) значение LR статистически значимо отличается от 1 на уровне значимости. Например, если выбрана доверительная вероятность (1 - ) = 0,99, и полученный 99%-й ДИ LR не накрывает значение 1, тогда оцениваемое значение LR статистически значимо отличается от 1 на уровне значимости 0,01. 71

Оценка Отношения Правдоподобий по результатам массового маммогрфического обследования LR[+] = = a/(a+c) : b/(b+d) = = 629/726 : 3885/ = = 27,1 LR[+] = Выводы: LR[+] статистически значимо отличается от практически бесполезного значения LR[+] = 1. Способность положительных результатов теста T+ распознавать наличие болезни хорошая. LR[-] = = c/(a+c) : d/(b+d) = = 97/726 : / = = 0,14 LR[-] = 0,11 0,14 0,17 Выводы: LR[-] статистически значимо отличается от практически бесполезного значения LR[-] = 1. Способность отрицательных результатов теста T- распознавать отсутствие болезни удовлетворительная. 72

Когда в нашем распоряжении имеются оценки чувствительности и специфичности RM-обследования, мы можем сообщить пациентке лишь следующее: «если у Вас рак, то вероятность того, что результат Вашего RM-обследования будет положительным, равна 87%. Если же у Вас нет рака, то вероятность того, что результат Вашего RM-обследования будет отрицательным, равна 97%».

И пациенту и лечащему врачу (поставщику медицинских услуг) на основании подобных утверждений трудно придти к клиническим заключениям. Таким образом, основная слабость показателей чувствительности и специфичности заключается в том, что они не предоставляют информацию о данном диагностическом средстве в виде, непосредственно пригодном для принятия клинических решений.

Проверьте свою интуицию Допустим, что у женщины (не дай бог) маммография дала положительный результат. Как Вы думаете, какова вероятность того, что у этой женщины действительно рак молочной железы? 75

Принципиально важно Принципиально важно понимать, что P(T+|D+), т.е. вероятность получить у субъекта положительный результат теста (T+) при условии наличия у него болезни (D+), не есть P(D+|T+), т.е. вероятность наличия у субъекта данной болезни, при условии получения у него положительного результата теста.

N.B. –nota bene P(D+|T+) P(T+|D+)

Предсказательная способность диагностического теста Получив у данного пациента положительный (или отрицательный) результат данного диагностического теста, мы более всего заинтересованы получить ответ на основной прагматический вопрос: Какова вероятность того, что у этого пациента действительно имеется (или действительно отсутствует) данная болезнь? Статистическая оценка такой вероятности называется предсказательной вероятностью положительного (или отрицательного) результата теста. Синонимы: пост-тестовая вероятность, прогностичность; предсказательная, прогнозирующая, прогностическая ценность диагностического теста. По-английски: PPV – Positive Predictive Value (of a test) и NPV – Negative Predictive Value (of a test). 78

Теорема Бейза в действии 79

Reverend Thomas Bayes [bɛi:z]) – Преподобный Томас Бейз (Байес, Бейес) c – bɛi:z 80

Теорема Бейза

Что такое Предсказательная вероятность для положительного результата теста, PPV? PPV есть мера того, насколько хорошо данный тест предсказывает наличие болезни у пациента. PPV есть вероятность наличия болезни у пациента при условии, что данный тест дал у него положительный результат. Синонимы: – Предсказательная полезность положительного результата теста – Прогностичность положительного результата теста – Послетестовая вероятность наличия у пациента болезни 82

Что такое Предсказательная вероятность для отрицательного результата теста, NPV? NPV есть мера того, насколько хорошо данный тест предсказывает отсутствие болезни у пациента. NPV есть вероятность отсутствия болезни у пациента при условии, что данный тест дал у него отрицательный результат. Синонимы: – Предсказательная полезность отрицательного результата теста – Прогностичность отрицательного результата теста – Послетестовая вероятность наличия у пациента болезни 83

Что такое Распространенность болезни, Prev = P(D+)? Вероятность обнаружить пациента с данной болезнью в данной популяции: P(D+) называется распространенностью болезни. Ее оценкой является доля, f(D+), лиц с данной болезнью в выборке объемом n из данной популяции, выявленных с помощью золотого стандарта. Два варианта оценки распространенности: 1. Данные демографической (медицинской) статистики. 2. Когортное исследование - исследование, в котором большую группу людей (когорту) наблюдают в течение некоторого промежутка времени. 84

Оценка распространенности болезни в когортном исследовании Прове- ряемый метод диагностики Эталон сравнения Всего [+] [] [+][+] (T+,D+) a (T+,D-) b (T+) a + b [] (T-,D+ ) c (T-,D-) d (T-) c + d Всего (D+) a + c (D-) b + d n Вероятность обнаружить пациента с данной болезнью в данной популяции: P(D+). В когортном исследовании ее оценкой является доля лиц с данной болезнью в выборке объемом n из данной популяции: f(D+), выявленных с помощью эталона сравнения. В когортном исследовании она вычисляется как отношение количества больных (a + c), выявленных с помощью эталона сравнения, в данной выборке, к общему числу обследованных n: Prev = f(D+) = (a + c)/n 85

Оценка распространенности рака молочной железы в когортном исследовании Маммо- графия Рак молочной железы (биопсия)Всего Есть, [+]Нет, [-] [+][+] a 629 b a + b [] с 97 d с + d Всегоa + с 726 b + d n Оценка распространенности рака молочной железы в когортном исследовании: Prev = f(D+) = (a + c)/n = = 726/ = = 0,0059 Prev = f(D+) = = 0,0054 0,0059 0,0065, т.е. примерно 0,6%. Указаны 99%-е ДИ. 86

Оценка предсказательных вероятностей в когортном исследовании Итак, когда распространенность оценивается по тем же данным, т.е. по результатам когортного (массового) обследования, то предсказательные вероятности вычисляются очень просто: PPV = f(D+|T+) = a/(a + b) и NPV = f(D-|T-) = d/(c + d) 87

Точечные и интевальные оценки прогностичностей маммографического обследования 88 Маммо- графия Рак молочной железы (биопсия) Всего Есть, [+]Нет, [-] [+][+] PPV = f(D+|T+) = 629/4514 = 0,126 0,139 0,153 f(D-|T+) = 3885/4514 = 0,85 0,86 0,87 1 [] f(D+|T-) = 97/ = 0,0006 0,0008 0,00106 NPV = f(D-|T-) = /11784 = 0,9989 0,9992 0, Слева и справа от точечных оценок в виде подстрочников указаны границы 99%-х ДИ

До и после До маммографического обследования вероятность заболеть раком молочной железы была равна Prev = f(D+) = 0,0059, т.е. примерно 0,6%, а вероятность отсутствия рака молочной железы была равна (1 - 0,006) = 0,994, или 99,4%. После получения пациенткой положительного результата вероятность наличия у нее рака повышается и становится равной примерно PPV = f(D+|T+) 14%. А после получения отрицательного результата вероятность отсутствия рака увеличивается до 99,92%. Однако в то же время при наличии положительного результата маммографического обследования вероятность отсутствия рака остается довольно высокой и составляет f(D-|T+) 86%.

Идеальный, бесполезный и «вредный» тесты В терминах предсказательных вероятностей: Идеальный тест: PPV = 1 и NPV = 1 Бесполезный тест: PPV = P(D+) NPV = P(D-) «Вредный» тест: PPV < P(D+) NPV < P(D-)

Полезное правило Где и когда только возможно, следует представлять результаты статистического анализа наглядно – графически.

Программа PPVNPV.xls primarycareandpublichealth/resources/PPVNPV.xls Чем более выгнута красная кривая для PPV, тем лучше способность положительных результатов теста предсказывать наличие болезни. Чем более выгнута синяя кривая для (1 – NPV), тем лучше способность отрицательных результатов теста предсказывать отсутствие болезни.

Зависимость прогностичностей маммографии, PPV и (1 – NPV), от распространенности рака молочной железы

Классификация диагностических тестов Классификационные вероятности Предсказательные вероятности Идеальный тест Se = 1; Sp = 1 f(FP) = 0; f(FN) = 0 I Y = 1 LR[+] = ; LR[-] = 0 PPV = 1; NPV = 1 Бесполезный тест f(FP) = f(TP); f(FN) = f(TN) I Y = 0 LR[+] = LR[-] = 1 PPV = Prev, NPV = 1 Prev «Вредный» тестf(FP) > f(TP); f(FN) > f(TN) I Y < 0 LR[+] 1 PPV < Prev, NPV < 1 Prev На какой вопрос отвечает Какова вероятность того, что тест верно распознает наличие (или отсутствие) болезни у субъекта? Какова вероятность наличия (или отсутствия) болезни у субъекта после получения результата теста? 94

Диагностические исследования в схеме «случаи – контроли» 95

Что такое исследование типа «случаи – контроли»? В исследованиях типа «случаи – контроли» случайным образом отбираются две группы субъектов: - группа субъектов с болезнью – «случаи» и - группа субъектов без болезни – «контроли» Такие исследования менее затратны, чем когортные. Но для них необходимо иметь оценки распространенности заболевания, которые так или иначе получаются на основе когортных иследований. 96

Целиакия Целиакия нарушение пищеварения, которое вызывается некоторыми пищевыми продуктами, содержащими определённые белки глютен (клейковина) и близкие к нему белки (авенин, гордеин и др.) в таких злаках, как пшеница, рожь, ячмень и овёс. У некоторых субъектов, предрасположенных к целиакии, эти белки приводят к повреждению ворсинок тонкой кишки. Болезнь имеет смешанный аутоиммунный, аллергический, наследственный генез, наследуется по аутосомно- доминантному типу. Синонимы: болезнь Ги Гертера Гейбнера, глютенэнтеропатия, кишечный инфантилизм (англ.: Coeliac disease, non-tropical sprue, c(o)eliac sprue, gluten enteropathy and gluten intolerance).

Биопсия тонкого книшечника у больного с целиакией Видна уплощенная форма ворсинок, лейкоцитарная инфильтрация и гиперплазия крипт.

Распространенность целиакии Долгое время целиакия считалась редким заболеванием с распространенностью от 1 : до 1 :1000. Однако по современным данным она считается довольно распространенным заболеванием. В США и в Европе (в России в частности) распространенность целиакии варьирует от 1:300 до 1:100, т.е. от 0,3% до 1%. Средняя распространенность целиакии в мире оценивается как 1 : 184, т.е. 0,54%.

Вохмянина Н.В., Хромов-Борисов Н.Н. HLA-генотипирование больных целиакией, его прогностическая ценность и экономическая эффективность. Гаплотипы Численности и частоты гаплотипов в группах Больные целиакией II- IV степени Контрольная группа Всего Предрасполага- ющие: DQ2 + DQ8 191 Se = 0,86 0,92 0, f(FP) = 0,42 0,44 0, Остальные 17 f(FN) = 0,046 0,082 0, Sp = 0,53 0,56 0, Всего

Сравнение диагностической и прогностической способностей маммографии и HLA-гаплотипирования Мамография и рак молочной железы Se = 0,83 0,87 0,90 Sp = 0,967 0,968 0,969 LR[+] = LR[-] = 0,11 0,14 0,17 f(D+) = 0,0054 0,0059 0,0065 PPV = 0,126 0,139 0,153 NPV = 0,9989 0,9992 0,9994 HLA-гаплотипирование и целиакия Se = 0,86 0,92 0,95 Sp = 0,53 0,56 0,58 LR[+] = 1,8 2,1 2,3 LR[-] = 0,08 0,15 0,26 «Внешние данные»: f(D+) = 0,0054 Размах: от 0,0033 до 0,010 PPV = 0,0003 0,011 0,15 NPV = 0,9992

Зависимость прогностичностей HLA-гаплотипирования, PPV и (1 – NPV), от распространенности целиакии

Почувствуйте разницу Прогностичности маммографии при раке молочной железы Прогностичности HLA-гаплотипирования при целиакии

Иридодиагностика Иридодиагностика - метод исследования состояния организма по радужной оболочке. «Теоретическое» обоснование: Каждый орган имеет свою локализацию на радужке, т.н. проекционную зону, куда через висцеральные центры головного мозга направляет информацию о своем неблагополучии. Эти сигналы и способствуют, в первую очередь, появлению на радужной оболочке иридологических знаков, помогающих осуществлять диагностику многих заболеваний. 104

Иридодиагностика

107

108

Приборы для иридодиагностики 109

Иридоскопы 110

Компьютеизированный иридоскоп 111

112

Иридологические карты, Индия

Иридологические карты

Иридологические карты Дженсена

Компьютеризация заблуждений 117

118

Украина 119

Simon A., Worthen D. M., Mitas J. A. An evaluation of iridology. JAMA, 1979, 242(13): Задача: проверить способность иридологов диагностировать поражение почек. Иридологи уверяли, что они способны диагностировать болезни почек на ирисе (ок. 6 час.). Один из аргументов: область почек на ирисе легко фотографировать. В качестве эталона сравнения по обоюдному согласию было выбрано определение уровня креатинина в плазме крови, которое надежно тестирует функцию почек. 120

Отбор «контролей» – субъектов без дисфункции почек Контрольная группа: 95 пациентов (55 мужчин и 40 женщин) с нормальной функцией почек Возраст: от 21 до 80 лет Уровень креатинина в плазме крови ниже 1,2 мг/дл: 0,5 – 1,2 мг/дл В истории болезни нет никаких указаний на дисфункцию почек 6 человек – гипертоники, 3 - диабетики 121

Отбор «случаев» – пациентов с дифункцией почек 48 человек (30 мужчин и 18 женщин) с дисфункцией почек Возраст: от 21 до 74 лет Уровень креатинина в плазме крови свыше 1,5 мг/дл: от 1,6 до 16,0 мг/дл 7 человек – гипертоники, 7 - диабетики 122

Иридодиагносты Из трех иридологов двое имели степень доктора хиропрактики (DC) и один степень иридолога. Один из них – всемирно известен своими работами по иридологии и как автор наиболее популярной в Америке книги по иридологии. Двое имели опыт работы более 40 лет и один – 3-4 года. 123

Иридодиагностика Для фотографирования ириса использовалась фотокамера, принадлежавшая одному из иридологов. Слайды были получены в соответствии с рекомендациями иридологов Все слайды были закодированы и предложены для анализа иридологам с использованием таблицы случайных чисел. Все иридологи работали индивидуально и отдельно друг от друга. Никто из них не знал ни о числе больных в выборке, ни о их возрасте. 124

Проверка иридодиагностики заболевания почек JAMA 242(1979) Иридодиа- гностика Эталон сравнения (креатинин плазмы крови) Всего > 1,5 мг/100 мл < 1,2 мг/100 мл [+][-] [+] [-] Всего

Качество иридодиагностики дисфункции почек 126

Минздравсоцразвития не предупреждает Серьезные врачи-исследователи редко тратят время на изучение таких методов, как иридодиагностика. Приведенные результаты убеждают в том, что по радужной оболочке глаза выявлять тяжелое заболевание почек иридодиагносты не способны. Даже если Минздрав сертифицирует применение такого метода и утвердит «стандарт» его применения, Вы, зная результаты настоящего испытания, не станете посылать своего пациента на консультацию к иридодиагносту. Если Вы – администратор, то Вы не станете тратить средства на покупку компьютерного иридодиагностического комплекса. 127

Хилер или киллер Обратите внимание на то, что иридодиагносты почти в два раза чаще выявляли «болезнь»: у иридодиагностов доля положительных диагнозов: f(T+) = (a + b)/n = 88/143 = 61% а у согласно эталону сравнения доля истинно больных: f(D+) = (a + c)/n = 48/143 = 34%. Это типичная практика всех «целителей» и «неортодоксальных» диагностов. Они находят болезни почти у всех пациентов и обычно помногу. Трудно доказать, что «ранней стадии» болезни нет, а человек оказывается привязанным к такому хилеру и, естественно, лечение «помогает» болезни-то нет. Открывается простор для внушаемости и развития зависимости пациента от хилера. 128

И снова теорема Бейза: Как комбинировать две независимые PPV? 129

PPV 1,2 для двух независимых тестов Предположим, что в дополнение к маммографическому обследованию (тест Т 1 ) с PPV 1 = 0,14 проведено дополнительное независимое диагностическое исследование (тест T 2 ) с такими же чувствительностью и специфичностью: Se 2 = 0,87 и Sp 2 = 0,97. Тогда получаем: PPV 1,2 =(0,006 0,87 0,87):(0,006 0,87 0,87+0,9 94 0,03 0,03) = 0,83 ! 130

PPV 1,2 для двух независимых тестов Предположим, что в дополнение к HLA- гаплотипированию (тест Т 1 ) с PPV 1 = 0,011 проведен независимое диагностическое исследование (тест T 2 ) с такими же чувствительностью и специфичностью: Se 2 = 0,92 и Sp 2 = 0,56. Тогда получаем: PPV 1,2 =(0,054 0,92 0,92):(0,054 0,92 0,92+ +0,946 0,44 0,44) = 0,20 ! 131

Проверка согласия между результатами двух диагностических исследований

Проверка согласия между мнениями двух иридологов Мнение иридолога В: Мнение иридолога D: Всего Болезнь Есть, [+]Нет, [-] Есть, [+] Нет, [-] Всего

Коэффициент «каппа» Коуэна Каппа Коуэна есть показатель степени согласованности между результатами двух диагностических исследований (или иных двух способов классификации).

Определение независимости двух случайных событий Два случайных события A и B называются независимыми, если вероятность их совместного появления P(A, B) равна произведению вероятностей их появления по отдельности: P(A, B) = P(A)×P(B)

Независимость результатов двух диагностических исследований Вероятности исходов при условии их независимости Мнение диагноста A: Мнение дигноста B: Всего Болезнь Есть, [+]Нет, [-] Есть, [+] p1p2p1p2 p1q2p1q2 p1p1 Нет, [-] q 1 p 2 q 1 q 2 q1q1 Всего p2p2 q2q2 1 По определению, мнения двух диагностов независимы, когда P([+], [+]) = p 1 p 2, P([+], [-]) = p 1 q 2, P([-], [+]) = q 1 p 2 и P([-], [-]) = q 1 q 2

Каппа Коуэна (Cohen)

Оценка коэффициента каппа Коэна

Статистическая интерпретация ДИ для κ Если (1 - )х 100%-й доверительный интервал (ДИ) для κ накрывает κ = 0, то у нас нет оснований считать, что оцениваемое значение κ статистически значимо отличается от 0. Если (1 - )х 100%-й ДИ для κ не накрывает значение κ = 0, то у нас появляется основание сомневаться в том, что оцениваемое значение κ равно 0. Это является следствием того факта, что при многократных повторных исследованиях границы ДИ для κ неизбежно будут варьировать, однако, доля тех из них, которые накроют значение κ = 0, не превысит выбранного нами уровня значимости. 139

Статистическая значимость В таких случаях говорят, что оцениваемое (неизвестное) значение κ статистически значимо отличается от 0 на уровне значимости. Например, если для построения ДИ выбрана доверительная вероятность (1 - ) = 0,99, и полученный ДИ не накрывает значение 0, то отличие оцениваемого κ от 0 статистически значимо на уровне значимости 0,

Проверка согласия между мнениями двух иридологов Мнение иридолога В: Мнение иридолога D: Всего Болезнь Есть, [+]Нет, [-] Есть, [+] Нет, [-] Всего Оценка коэффициента Каппа Коуэна: κ = -0,016 0,28 0,53. 99%-й ДИ накрывает значение κ = 0. Это означает, что оцениваемое значение κ статистически не отличается от 0 (на уровне значимости α = 0,01), т.е. мнения двух диагностов скорее всего не согласуются друг с другом (являются независимыми).

Клиническая значимость коэффициента каппа Коуэна Значения коэффициента каппа Коуэна Интерпертация - 1Полная рассогласованность, противоречивость < 0Рассогласованность 0Независимось Степень согласованности: 0 – 0,2Плохая 0,2 – 0,4Посредственная 0,4 – 0,6Удовлетворительная 0,6 – 0,8Хорошая 0,8 - 1,0Отличная

Проверка согласия между мнениями двух групп диагностов (Горелов А.И.) Мнение российских диагностов: Мнение независимых зарубежных экспертов: Всего Рецидив болезни: Есть, [+]Нет, [-] Есть, [+] Нет, [-] Всего Оценка коэффициента Каппа Коуэна: κ = 0,67 0,75 0,78. 99%-й ДИ не накрывает значение κ = 0. Это означает, что оцениваемое значение κ статистически значимо отличается от 0 (на уровне значимости α = 0,01), т.е. мнения двух групп диагностов хорошо согласуются друг с другом.

Экономическая эффективность диагностического исследования

Индекс Юдена (Youdens Index), I Y Чувствительность Se и специфичность Sp можно объединить в единый сводный показатель, который называется индексом Юдена. Он определяется как разность между долями истинных и ложных «позитивов»: I Y = f(TN) – f(FP) = f(T+|D+) – f(T+|D-) = Se – (1 – Sp). Его точечная оценка вычисляется по формуле: a / (a + с) - b / (b + d) = (ad – bc) / [(a + c)(b + d)]. 145

Индекс Юдена может служить сводным показателем точности диагностического теста. Его нулевое значение (I Y = 0) равносильно случайному гаданию и свидетельствует о бесполезности проверяемого диагностического теста. Значения этого индекса, близкие к 1 указывают на высокую точность теста. Отрицательные значения означают, что доля ложных «позитивов» превышает долю истинных «позитивов» и с практической точки зрения представляются абсурдными.

Оценки диагностической точности (DA) и индекса Юдена (I Y ) для данных маммогрфического скрининга Маммо- графия Эталон сравнения (биопсия) Всего Есть, [+]Нет, [-] [+][+] a 629 b a + b [] с 97 d с + d Всегоa + с 726 b + d n Оценка диагностической точности DA = (a + d)/n = ( )/ = DA = Оценка индекса Юдена: I Y = a/(a + c) - b/(b + d) = = 629/712 – 3885/ = 0.83 I Y = Указаны 99%-е ДИ. 147

Статистическая интерпретация доверительных интервалов для индекса Юдена, I Y Если (1 - )×100%-й ДИ для I Y накрывает неинформативное значение I Y = 0, то у нас нет оснований считать, что оцениваемое значение I Y значимо отличается от 0. Если (1 - )×100%-й ДИ для I Y не накрывает значение I Y = 0, то у нас появляется основание сомневаться в том, что оцениваемое значение I Y равно 0. Это является следствием того факта, что при многократных повторениях диагностического исследования границы ДИ для I Y неизбежно будут варьировать, но доля тех из них, которые накрывают значение I Y = 0, не превысит выбранного нами уровня значимости. 148

Статистическая значимость В таких случаях говорят, что оцениваемое (неизвестное) значение I Y статистически значимо отличается от 0 на уровне значимости. Например, когда выбрана доверительная вероятность (1 - ) = 0,99, и полученный 99%-й ДИ для I Y не накрывает значение I Y = 0, тогда оцениваемое значение I Y статистически значимо отличается от 0 на уровне значимости 0,

Индекс Юдена и число подлежащих скринингу, NNS Индекс Юдена I y есть разность долей истинных позитивов у субъектов с болезнью и ложных позитивов у субъектов без болезни: I y = P(T+|D+) - P(T+|D-): Величина, обратная к индексу Юдена и деленная на распространеность заболевания называется «числом подлежащих диагностированию» - NNS (от англ. Number Needed to Screen): NNS = 1/(I Y × Prev) NNS интерпретируется как число субъектов, которых надо подвергнуть данному диагностическому обследованию, чтобы выявить хотя бы одного больного и тем самым предотвратить хотя бы один печальный исход.

Экономическая эффективность диагностических исследований Экономическая эффективность диагностических исследований вычисляется как произведение числа подлежащих диагностированию (или сканированию) на стоимость одной диагностической процедуры: CE = NNS × Cost

Экономическая эффективность трех диагностических исследований Показатель МаммографияHLA-гаплотипи- рование Иридо- диагностика Индекс Юдена, I Y 0,830,48- 0,017 Распространен- ность, Prev 0,00590,00540,1 NNS = 1/(I Y × Prev) Стоимость одной процедуры, Cost 100 руб руб. Экономическая эффективность, CE = NNS×Cost руб руб руб.

Вопросы для оценки диагностического теста Все ли Вам понятно в тексте статьи? Достаточно ли детально, четко и понятно описаны методы, чтобы Вы как профессионал могли бы их правильно воспроизвести? Достаточно ли подробно и понятно ли описаны использованные методы статистического анализа данных? Приведены ли ссылки на руководства или статьи, в которых можно при необходимости найти описание и обоснование этих методов? Если для статистического анализа использованы компьютерные программы, то даны ли ссылки на них? 153

Выборка Каким способом сформирована выборка (группа) пациентов для данного исследования? Описан ли и четко ли способ формирования выборки? Использована ли рандомизация? Гарантированы ли случайность выборки и независимость ее членов? Обоснован ли объем выборки? Является ли исследование когортным или типа «случаи – контроли»? 154

С чем сравнивать? Есть ли сопоставление с эталоном сравнения (золотым стандартом)? Обоснован ли выбор эталона сравнения? Согласны ли Вы с его обоснованием? Проведено ли это сопоставление слепым методом? Рационально ли определена норма отсутствие болезни? Четко ли, разумно ли обосновано различение здоровых и больных? 155

Статистические оценки и выводы Оценки каких показателей способности проверяемого диагностического теста распознавать наличие или отсутсвие болезни приведены для обоснования выводов: Чувствительность - Se ? Специфичность - Sp ? Отношение правдоподобий для положительных результатов теста – LR[+] ? Отношение правдоподобий для отрицательных результатов теста – LR[-] ? Приведены ли оценки прогностичностей проверяемого диагностического теста,такие как PPV и NPV ? Как оценена распространенность заболевания Prev = P(D+) ? Какого вида оценки представлены: – точечные, – интервальные? Какие уровни доверия выбраны: 95%, 99% или 99,9%? 156

Повторности и воспроизводимость Представлены ли результаты независимых повторных проверок? Оценена ли воспроизводимость результатов теста? 157

Практические вопросы Широк или узок спектр заболевания у обследованных (легкие и тяжелые случаи, лечившиеся и нелеченые, с поражениями разной формы, с сопутствующими заболеваниями)? Если тест предлагается как дополнение к пакету других тестов, то показано ли, что применение этого теста улучшает общий результат диагностики? Оценена ли общая полезность теста? 158

Упрощающие предположения (допущения, условия, ограничения) При использовании таблиц 2 х 2 следует помнить об упрощающих допущениях и условиях (предпосылках), которые неизбежно необходимы. Первое допущение. Используемое диагностическое обследование надо сравнивать с эталоном сравнения.

Второе важное допущение состоит в том, что результат обследования является бинарным (дихотомическим): либо положительным, либо отрицательным. Такое допущение является, пожалуй, наименее привлекательным, поскольку результаты обследований зачастую являются мерными. Для таких случаев придумано использовать ROC-кривые. Последнее допущение состоит в том, что качество обследования оценивают в отношении наличия или отсутствия одной болезни, а не нескольких болезней одновременно.

Объективна ли статистика? В идеале статистическая процедура должна быть «объективной» в том смысле, что разные исследователи, если они используют одни и те же модели и сталкиваются с одними и теми же данными, будут приходить к одним и тем же выводам. 161

Задачи и упражнения 162

Льюис Кэрролл (Lewis Carroll, настоящее имя Чарльз Лютвидж Доджсон, Charles Lutwidge Dodgson; – ) 163

164

Полуночные задачи (задача 5 ) В мешке находится шар, о котором известно, что с вероятностью равной 1/2 он либо белый, либо черный. В этот мешок кладут белый шар, после чего содержимое мешка тщательно перемешивают, и человек наугад извлекает один шар, который оказывается белым. Вопрос: какова после этого вероятность извлечь белый шар? 165

Задача о картировании генов На одной хромосоме расположены три гена A, B и С. Известны: - P AB - вероятность кроссинговера на участке между генами A и B и - P BC - вероятность кроссинговера на участке между генами B и C. По формуле Троу вероятность кроссинговера на участке между генами A и C есть: P AC = P AB + P BC - 2P AB P BC Выведите эту формулу самостоятельно. 166

После продолжительной разлуки встречаются два приятеля. Между ними происходит следующий диалог: - Ну, как дела? - Да вот уже тремя детьми обзавелся. - А сколько им лет? - Произведение их возрастов равно 36, а сумма их возрастов равна номеру проезжающего трамвая. После некоторого раздумья второй приятель говорит: - По-моему, ты чего-то не договариваешь. - Ах, да – я забыл сказать, что старший у меня рыжий. Вопрос: сколько лет детям? 167

«Подножный» материал к практическим занятиям 1. ЧСС – частота сердечных сокращений ровно за 60 секунд (не за 15!) 2. САД – систолическое артериальное давление (мм Hg) 3. ДАД – диастолическое артериальное давление (мм Hg) 4. Рост (см) 5. Масса тела (кг) 6. Пол 168

7. Какой палец на руке длиннее – указательный или безымянный? Укажите пол. 169

8. Высыпите на стол коробок канцелярских кнопок и подсчитайте, сколько из них лягут на шляпку острием вверх, а сколько – на острие и шляпку. 170

Спасибо за внимание! Слайды доступны для всех Никита Николаевич Хромов-Борисов Кафедра физики, математики и информатики СПбГМУ им. акад. И.П. Павлова (812) – дом. (812) – раб – моб. 171