Понятие о доказательной медицине. Основы теории вероятностей ЗАВЕДУЮЩИЙ КАФЕДРОЙ ОЗиЗ Шульмин А. В.

Презентация:



Advertisements
Похожие презентации
Качественные признаки Тема занятия.
Advertisements

Презентация на тему: Презентация на тему: «Основы теории вероятностей» Презентацию подготовила: Струсевич Анастасия. Презентацию подготовила: Струсевич.
Основы теории вероятности Основные понятия и определения.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Еще больше презентаций на. Основы теории вероятности Основные понятия и определения.
Теория вероятностей и математическая статистика Лекция 1. Введение. Основные понятия теории вероятностей. Элементы комбинаторики.
Элементы теории вероятности и математической статистики Теория вероятностей возникла как наука из убеждения, что в основе массовых случайных событий лежат.
1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Кафедра медицинской и биологической физики Тема: Элементы теории вероятностей лекция 10 для студентов 1 курса обучающихся по направлению подготовки
Кафедра общественного здоровья и здравоохранения По дисциплине « Доказательная медицина » Тема : Понятие о доказательной медицине. Основы теории вероятностей.
Автор: Яковлева Екатерина. Об авторе Ученица 8 «А» средней школы 427. Яковлева Екатерина Александровна Дата рождения года. Проект по Теории.
Теория вероятностей раздел математики, изучающий закономерности случайных явлений: случайные события, случайные величины, их свойства и операции над ними.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Изучает закономерности массовых случайных явлений.
Теория вероятностей Основные понятия. Этапы развития теории вероятностей »2-я половина XVI века – первые задачи » по теории вероятностей. Конец XVII-
Транксрипт:

Понятие о доказательной медицине. Основы теории вероятностей ЗАВЕДУЮЩИЙ КАФЕДРОЙ ОЗиЗ Шульмин А. В.

План лекции : 1. Определение понятия. 2. Историческая справка. 3. Основные перспективы и проблемы развития доказательной медицины. 4. Теория вероятностей Определение основных понятий 4.2. Основные теоремы.

Определение понятия Понятие « доказательная медицина » предложено учеными из университета Мак - Мастера г. Торонто ( Канада ) в 1990 г. Доказательная медицина – это технология сбора, анализа, обобщения и интерпретации медицинской информации, позволяющая принимать научно доказательные решения по профилактике, диагностике, лечению заболеваний и организации здравоохранения

Определение понятия сознательное, четкое и беспристрастное использование лучших из имеющихся доказанных сведений для принятия решений о помощи конкретным больным новая технология сбора, анализа, синтеза и использования медицинской информации, позволяющей принимать оптимальные клинические решения

Определение понятия Определение данное Тришей Гринхальд содержит большие акценты на статистических доказательствах результатов клинических испытаний. « Доказательная медицина это усиление традиционных навыков клинициста в диагностике, лечении, профилактике и других областях путем систематического формулирования вопросов и применения математических оценок вероятности и риска »

Новая идеология В настоящее время доказательная медицина является основополагающим инструментом для принятия решения о выборе медицинской технологии более чем у 80% медицинских работников в Европе и США. Причем центром принятия решений является не мнение авторитета или укоренившиеся традиции, а специалист - медик ( ученый, врач, провизор ) – ответственный и компетентный, информированный и критически мыслящий.

ИСТОРИЯ ФОРМИРОВАНИЯ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ

В МЕДИЦИНЕ ДОНАУЧНЫЙ ПЕРИОД ПРОДОЛЖАЛСЯ НАМНОГО ДОЛЬШЕ, ЧЕМ В ДРУГИХ ОБЛАСТЯХ НАУКИ. ПОЛЬЗА ОТ МНОГИХ МЕТОДОВ ЛЕЧЕНИЯ В ТУ ЭПОХУ БЫЛА ВЕСЬМА СОМНИТЕЛЬНОЙ, А ИНОГДА ОНО ДАЖЕ ПРЕДСТАВЛЯЛО РЕАЛЬНУЮ УГРОЗУ ЖИЗНИ ПАЦИЕНТА. !!!

Общепринятым было лечение огнестрельных ран путем прижигания раскаленным железом и кипящим маслом. Во время итальянской кампании в 1536 г., когда запасы масла иссякли, французский врач А. Паре (1510–1590) начал накладывать на раны повязки, как ему казалось, с бездейственным составом на мазевой основе. В своем дневнике он писал, как провел бессонную ночь, переживая за несчастных солдат, которых он лечит столь нетрадиционным способом, и как он был поражен наутро, убедившись, что раненые « были довольны, словно луговые жаворонки », а те, которые накануне получили традиционное лечение, продолжали страдать от лихорадки и боли.

Использование клизм было популярным еще со времен Древнего Египта. Клизмы с вином рекомендовали при чахотке, с мочой – при водянке. Клизмы с табачным дымом рекомендовали для оживления утопленников

Кровопускание и применение пиявок представляют отдельную главу в истории медицины. Со времен античности вплоть до XIX в. кровопускание, осуществлявшееся различными способами, служило основным методом лечения практически всех заболеваний. Профессор патологии Ф. Бруссе (1772–1838), впоследствии названный самым кровожадным врачом в истории медицины, во время эпидемии холеры в 1832 г. лечил пациентов изнуряющей диетой ( полный запрет на еду и питье ) и кровопусканием при помощи флеботомии и пиявок. Подсчитано, что только в 1800 г. в парижских больницах было выпущено около 85 тыс. л крови, а в 1824 г. во Францию импортировали 33 млн пиявок

К началу XIX в. во многом была утрачена вера в старые теории и методы лечения. Пессимистические настроения, бытовавшие в среде врачей, лучше всего отражает цитата из статьи в одном из европейских журналов того времени : « В медицине пока так и не появился свой Ньютон, и, к сожалению, мы вправе опасаться, что никогда не увидим гения, который способен привнести в медицину то, что физика нашла в алгебре, а химия – на чашках лабораторных весов. Медицина продолжает оставаться тем, чем были эти науки столетия назад – набором не связанных между собой тезисов »

Пионерами количественного метода оценки эффективности лечения стали П. Луи (1787–1872) и Ж. Гавар (1809–1890)

П. Луи первым усомнился в эффективности кровопускания при лечении болезней, поставив под сомнение догматическое положение о том, что его следует делать как можно раньше. Он сравнил результаты лечения у больных, которым кровопускание производилось при первых признаках болезни и в более поздние сроки, и обнаружил, что они не зависели от времени выполнения флеботомии. На основании своих наблюдений в 1835 г. П. Луи заключил, что при пневмонии, рожистом воспалении и дифтерии кровопускание вызывает весьма незначительный эффект. Постепенно использование метода, применявшегося на протяжении столетий, было прекращено

Ж. Гавар первым применил их в медицине. Он подчеркивал, что вывод о преимуществе одного метода лечения перед другим не должен основываться на умозрительном заключении, а должен вытекать из результатов, полученных в процессе наблюдения за достаточным количеством больных, получавших лечение по сравниваемым методикам. Ж. Гавар считал : « Для того чтобы предпочтение было отдано какому - либо вмешательству, оно должно не только приводить к лучшим результатам, чем сравниваемые методы лечения, но различие в эффективности должно превышать определенную пороговую величину, которая зависит от числа наблюдений. Если различие ниже этой пороговой величины, его следует игнорировать и считать несущественным »

Необходимо отметить, что вплоть до начала XIX в. диагностике заболеваний не уделялось должного внимания. Лабораторные методы исследования в то время были недоступны, заболевания диагностировались только на основании клинической картины. Болезни рассматривались как клинические синдромы, и диагностика сводилась к умению их распознавать. Обследование больного было весьма поверхностным – расспрос, общий осмотр, оценка состояния пациента, определение характера пульса, цвета мочи и ее осадка, температуры тела на ощупь

Однако в XVIII начале XIX в. появляются новые объективные методы исследования : Г. Д. Фаренгейт (1686–1736) в 1714 г. изобрел ртутный термометр, А. Цельсий (1701–1744) в 1742 г. предложил температурную шкалу, Л. Ауэнбруггер (1722–1809) в 1761 г. – перкуссию грудной клетки, которая благодаря Ж. Н. Корвизару (1755–1821) была введена в широкую клиническую практику. Р. Лаэннек (1781–1826) изобрел стетоскоп (1816 г.) и разработал аускультацию (1819 г.). Использование данных открытий существенно пополнило семиотику болезней и способствовало расцвету клинической практики

Развивается клинико - анатомическое направление в медицине, основоположником которого является Д. Б. Морганьи (1682–1771). Приверженцы данного направления проводили тщательное клиническое обследование пациентов, а после их смерти соотносили клинические симптомы с анатомическими изменениями, обнаруженными при вскрытии

Начиная с середины XIX в. становится ясно, что одного описания клинических и анатомических проявлений заболевания недостаточно, и постепенно получает признание идея оценки функционального состояния органов и систем больного. Этому способствовали грандиозные успехи естествознания в области биологии и медицины. Пожалуй, первым заболеванием, при котором результаты лабораторных исследований позволили избрать рациональную терапию, стал гипотиреоз. Как отдельная нозологическая единица гипотиреоз был выделен в 70- х гг. XIX в., а спустя несколько лет Т. Кохер (1841–1917) и Ж.- Л. Реверден (1848–1929) описали аналогичную клиническую картину у пациентов после удаления щитовидной железы. В 1884 г. М. Шифф (1823–1896) обнаружил, что подсадка ткани щитовидной железы предотвращает экспериментальный гипотиреоз у собак, а в 1892 г. в практику лечения гипотиреоза было введено использование высушенной ткани железы. Данный пример наглядно демонстрирует связь между клинической практикой и лабораторными исследованиями, что стало основой успешного развития медицины в XX в.

Развитие контролируемых исследований в медицине. В 1898 г. И. Фибигер (1867–1928) опубликовал результаты клинического испытания, в ходе которого сравнивались результаты терапии больных дифтерией, распределенных на группы получавших и не получавших сыворотку для лечения [36]. Однако исследование осталось незамеченным. Лишь в 1948 г. были опубликованы результаты изучения эффекта стрептомицина при лечении больных туберкулезом. Именно данное испытание считается первым контролируемым исследованием, соответствующим современным методологическим стандартам рандомизации ( случайного распределения ) и проведения статистического анализа

После Второй мировой войны по мере экономического подъема в различных странах появился целый ряд новых методов лечения заболеваний. Обычно сторонники нового метода аргументировали свою точку зрения только тем, что эффективность его использования вытекает из существующих знаний о механизмах развития болезни, однако впоследствии было показано, что некоторые из этих методов лечения бесполезны.

Примером может служить использование антикоагулянтов при инфаркте миокарда. В 50- х годах ХХ в. механизмы свертывания крови привлекли пристальное внимание ученых - медиков, и применение недавно открытых антагонистов витамина К при тромбозе коронарных артерий было признано теоретически оправданным. Более того, данную точку зрения подтверждали результаты клинических исследований, опубликованные в разных странах и свидетельствовавшие об улучшении выживаемости больных, получавших эти препараты. Однако после проведения рандомизированных испытаний стало ясно, что использование антагонистов витамина К при данном заболевании не вызывает положительный эффект

ОСНОВНЫЕ ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ

Встает вопрос : как могло получиться, что из поколения в поколение врачи назначали неправильное лечение, полагаясь на различные теории ? Большинство хронических болезней характеризуется волнообразным течением, и больные, как правило, обращаются к врачу в момент обострения. Логично ожидать, что вслед за ухудшением состояние пациента начнет улучшаться, причем независимо от того, каким будет лечение. Не исключено, что именно этот феномен на протяжении многих столетий служит одной из причин самообмана врачей и пациентов. С другой стороны, если больной не выздоравливает, считается, что это происходит вопреки назначенному лечению

!!! ни одно контролируемое клиническое исследование или метаанализ не может научить врача, как ему лечить конкретного пациента. Например, вмешательство А представляет собой хирургическую операцию, а Б – медикаментозное лечение. Если пациент пожилого возраста или страдает тяжелыми сопутствующими заболеваниями, врач может предпочесть более безопасное вмешательство Б, хотя такой выбор будет противоречить результатам контролируемого клинического испытания

Концепции доказательной медицины распространяются по трем основным направлениям : 1) Разработка клинических рекомендаций, описывающих действия специалистов - медиков в определенной клинической ситуации. 2) Формирование базы данных систематических обзоров рандомизированных контролируемых исследований. 3) Издание специализированных обучающих и справочных бумажных и электронных журналов, руководств, книг и Интернет - ресурсов. К сведению. При проведении Кокрановских систематических обзоров было рассмотрено 68 российских публикаций. Из них только 7 (9%) были расценены как достаточно качественные для включения в обзоры

Несмотря на значительное распространение принципов доказательной медицины в странах Западной Европы и США, в СНГ развитие этой современной концепции существенно сдерживается, что объясняется следующими причинами : низкой степенью мотивации специалистов, ответственных за принятие решений ; активным влиянием на этих специалистов представителей фармацевтической индустрии, пытающихся превратить доказательную медицину в инструмент поиска конкурентных преимуществ ; отсутствием системы подготовки специалистов здравоохранения по доказательной медицине.

Теория вероятностей в доказательной медицине. ЗАВЕДУЮЩИЙ КАФЕДРОЙ ОЗиЗ Шульмин А. В.

План лекции : 1. Определение понятия. 2. Теорема сложения вероятностей. 3. Теорема умножения вероятностей. 4. Формула Байеса. 5. Постановка эксперимента Бернулли. 6. Биномиальное распределение

Что такое события и какими они бывают? ЗНАЕТЕ ЛИ ВЫ, … Что такое теория вероятностей? Что можно сравнивать шансы? Что точка может быть случайной? Что вероятность можно просчитать? Что изучает теория вероятностей? Какие инструменты используют в теории вероятностей?

знакомы ли вам следующие фразы? Это очень возможно Это невозможно Это маловероятно Это никогда не случится Это непременно произойдет А что они означают?

«Наука – враг случайности, но врага надо изучать, а это делает теория вероятностей!» А.Я. Хинчин

В современном мире автоматизации производства теория вероятности(Т.В) необходима специалистам для решения задач, связанных с выявлением возможного хода процессов, на которые влияют случайные факторы(например, ОТК: сколько бракованных изделий будет изготовлено). Возникла Т.В. в 17 веке в переписке Б. Паскаля и П.Ферма, где они производили анализ азартных игр. Советские и русские ученые также принимали участие в развитии этого раздела математики: П.Л. Чебышев, А.А. Марков, А.М. Ляпунов, А.Н. Колмогоров.

Случайные события Событие называется детерминированным, если в результате опыта оно происходит или не происходит наверняка. В детерминированном случае мы точно знаем, что данная причина приведет к единственному, вполне определенному следствию. Событие называется случайным, если в результате опыта мы не можем заранее предсказать - произойдет событие или нет. При этом предполагается, что опыт можно повторять неограниченное число раз при неизменных условиях. События, исход которых нельзя предсказать, но и невозможно повторять многократно, называются неопределенными.

Определение понятия Теория вероятностей математическая наука, устанавливающая закономерности случайных явлений Под случайным событием понимается всякое явление, о котором имеет смысл говорить, что оно происходит или не происходит. Достоверным назовем событие которое обязательно произойдет при выполнении определенного количества условий Невозможным назовем событие которое не происходит при выполнении определенного количества условий (2 пример ).

Диаграммы Венна Ω СобытиеА Событие Ã (не A ) A B Пересечение событий A и B AB Объединение событий A или B A B События A и B несовместимы, если AB= (пустое множество) Два события называются несовместными, если появление одного из них исключает появление другого. В противном случае события называются совместными.

Вероятность события A df 1 (классическое) отношение числа m бла- гоприятствующих событию A равновоз- можных исходов к общему числу всех элементарных, несовместимых и равно- возможных исходов (N) испытания. Если возможные исходы (результаты) опыта являются событиями несовместными, достоверными, то каждый из результатов испытания назовем элементарным исходом. Те элементарные исходы, при которых интересующее нас событие наступает назовем благоприятствующими этому событию исходами.

Вероятность: пример Русская рулетка с 1 патроном в барабане (7- зарядный револьвер)Русская рулетка с 1 патроном в барабане (7- зарядный револьвер) –7 элементарных несовместимых исходов –элементарные исходы равновозможны

Свойства вероятности

При многократном повторении опыта частота события принимает значения, близкие к некоторому постоянному числу. Например, при многократном бросании игральной кости частота выпадения каждого из чисел очков от 1 до 6 колеблется около числа Многократно проводились опыты бросания однородной монеты, в которых подсчитывали число появления «герба», и каждый раз, когда число опытов достаточно велико, частота события «выпадения герба» незначительно отличалась от для наглядности рассмотрим таблицу результатов, полученных в 18 веке французским естествоиспытателем Жоржем Луи Леклерк Бюффоном(1707 – 1788) и в начале 20 века – английским статистиком Карлом Пирсоном(1857 – 1936).

Экспериментатор Число бросаний Число выпадений герба Частота Ж. Бюффон ,5080 К. Пирсон ,5016 К. Пирсон ,5006

Вероятность события A (частотное) предел отношения числа m испытаний, при котором произошло событие A, к общему числу (N) испытаний, при N.

Вероятности и доли Доля – это отношение количества представителей выборки, обладающих признаком, к общему объему выборки 0 p 1

Вероятность события A (субъективное) степень рациональной уверенности в том, что событие может произойти

Взаимоисключающие события появление одного события в испытании достоверно препятствует появлению другого события в том же испытании Пример:Пример: –выпадение рештки и –зависание монеты в воздухе

Законы взаимодействия вероятностей 1. Правило сложения вероятностей 2. Правило перемножения вероятностей 3. Закон биномиального распределения

Свойства вероятности Ω СобытиеА N исходов m исходов

Правило сложения вероятностей Вероятность того, что произойдет одно из нескольких независимых событий, равна сумме вероятностей каждого отдельного события.

Сложение вероятностей Какая вероятность появления одного из событий A и B или обоих событий сразу?Какая вероятность появления одного из событий A и B или обоих событий сразу? A B N исходов m исходов k исходов z исходов

Пример правила сложения Пример. Пациент обратился к двум врачам. Вероятность установит правильный диагноз у первого - 0.8, второго Какова вероятность, что попадет хотя бы один? Используем полученную формулу: *0.7=0.94

Пример Доля людей в популяции с группой крови I(0) составляет 36%, а доля резусположительных – 1%. Какова вероятность, что у случайно взятого человека группа крови будет или первая группа крови, или голубые глаза? p = 0,36 + 0,01 = 0,037

Правило умножения вероятностей Вероятность того, что произойдет сразу два и более независимых события, равна произведению вероятностей каждого отдельного события.

Правило умножения Как можно вычислить вероятность пересечения событий A и B, имея данные о P(A|B) и P(B)?Как можно вычислить вероятность пересечения событий A и B, имея данные о P(A|B) и P(B)? A B P(B) P(A|B)

Пример Пожизненный риск заболевания раком легких составляет 3%, а заболевания шизофренией – 0,1%. Каков пожизненный риск заболеть одновременно шизофренией и раком легких? p = 0,03 x 0,001 = 0,00003

Пример применение формулы Байеса. Имеется 3 корзины. В первой корзине 1 белый 1 черный шар. Во второй корзине 3 белых 1 черный шар. В третьей корзине 1 белый 2 черных шара. Какова вероятность из выбранной наугад корзины выбрать белый шар (А)? Решение.

*

*

*

Пример применение формулы Байеса. Решение. Вероятность выбрать белый шар из первой корзины B 1 P(A|B 1 )=1/2 Вероятность выбрать белый шар из второй корзины B 2 P(A|B 2 )=3/4 Вероятность выбрать белый шар из третьей корзины B 3 P(A|B 3 )=1/3 Вероятность выбрать первую корзину P(B 1 )=1/3 Вероятность выбрать вторую корзину P(B 2 )=1/3 Вероятность выбрать третью корзину P(B 3 )=1/3 Подставляем числа в формулу

Условная вероятность Какова вероятность того, что событие A произошло, если мы знаем, что событие B произошло?Какова вероятность того, что событие A произошло, если мы знаем, что событие B произошло? NB Нам нужно думать не о всех исходах, а только о тех, что входят в событие B A B N исходов m исходов k исходов z исходов

*

Пример. Имеется 3 корзины. В первой корзине 1 белый шар. Во второй корзине 3 белых 1 черный шар. В третьей корзине 1 белый 2 черных шара. Какова вероятность из выбранной наугад корзины выбрать белый шар (А)? Решение. Вероятность выбрать белый шар из первой корзины B 1 P(A|B 1 )=1/1 Вероятность выбрать белый шар из второй корзины B 2 P(A|B 2 )=3/4 Вероятность выбрать белый шар из третьей корзины B 3 P(A|B 3 )=1/3 Вероятность выбрать первую корзину P(B 1 )=1/3 Вероятность выбрать вторую корзину P(B 2 )=1/3 Вероятность выбрать третью корзину P(B 3 )=1/3 Подставляем числа в формулу

Биномиальное распределение Процесс Бернулли (Bernoulli process) – это испытание, в котором возможно получение только двух результатов – «успех» или «неудача». Вероятность получения «успеха» в каждом отдельном испытании равна доле «успехов» в популяции.

Схема испытаний Бернулли Пусть в результате некоторого случайного испытания может произойти или не произойти определенное событие А. Если событие произошло, будем называть испытание успешным, а само событие – успехом. Испытание повторяется n раз. При этом соблюдаются следующие условия: вероятность успеха P(A)=p в каждом испытании одна и та же; результат любого испытания не зависит от исходов предыдущих испытаний. Такая последовательность испытаний с двумя исходами (успех/ неуспех) называется последовательностью независимых испытаний Бернулли или – схемой испытаний Бернулли.

Биномиальное распределение Вероятность получения «успеха» в серии из нескольких испытаний подчиняется биномиальному распределению вероятностей. Биномиальное распределение – это вероятность получить точно r «успехов» из N испытаний при популяционной доле «успехов», равной π.

Вероятность поломки одного из пяти работающих независимо друг от друга дефибрилляторов равна 0,2. Если происходит поломка, аппарат до конца дня не работает. Какова вероятность, что 0, 1 станков сломаются в течение дня? Р (r) = 5Сr (0,2/ (0,8)5-r, r = 0, 1,..., 5.

Биномиальное распределение Пример: Есть две монеты: 1)настоящая, для которой вероятности выбросить «орла» или «решку» равны между собой и равны 0,5. 2)Фальшивая, для которой вероятность выбросить «орла» составляет всего 0,3. Вы видите два биномиальных распределения – результаты 6 бросков каждой монеты.

Условия использования биномиального распределения Признаки должны быть: 1)Дихотомическими – иметь только два значения (1 и 0, «да» и «нет» и т.п.) 2) Взаимно исключающимися 3) Независимыми 4) Выбранными случайно

Пример использования биномиального распределения Генетическое консультирование Если вероятность рождения ребенка с идиотией Тея-Сакса составляет у данной пары родителей 25%, то вероятность того, что ни один из двух рожденных последовательно детей не будет страдать этим расстройством, составляет 0,56 (см. график).

Ограничение биномиального распределения Биномиальное распределение дискретно: поскольку количество испытаний может быть только целым числом, вероятность принимает строго определенные значения. При увеличении числа испытаний биномиальное распределение становится практически идентичным нормальному.

Двусторонний тестОдносторонний тест N α

Расчеты с качественными признаками Для количественных данных используется критерий Стьюдента, который при объеме выборки выше 100 человек можно заменить z- критерием, так как распределения t и z становятся идентичными. Аналогично для качественных признаков используются различные критерии в зависимости от объема выборки, числа выборок и числа различных значений признаков.

Критерий z для одной выборки Условия применения критерия: 1.Выборка больше 30 человек. 2.Случайная выборка из генеральной совокупности 3.Нулевая гипотеза: доля в популяции не отличается от заранее заданной доли.

Расчет критерия z p – это наблюдаемая в выборке доля. n – объем выборки (> 30). π – ожидаемая доля в популяции. Нулевая гипотеза: p = π Доверительный интервал для доли: ДИ=p±zs p

Расчет z для одной выборки - пример Допустим, исследователи изучают новое антацидное средство в группе из 100 пациентов. У 9 пациентов из ста на фоне приема препарата появились жалобы на головокружение и сонливость. Приемлемой была принята частота осложнений, равная 15%. Требуется доказать, что частота осложнений в популяции не больше 15%.

Расчет z для одной выборки - пример Нулевая гипотеза: p > π Альтернативная гипотеза: p π 1. p = 9/100 = 0.09 SE = z = ( ) / = z < z крит., следовательно, нулевая гипотеза принята % доверительный интервал для p: 0,09 - 1,96x0,0357 p 0,09 + 1,96x0, p 0,16 Доверительный интервал содержит 0,15. Следовательно, популяционная доля не меньше 0,15.

Биномиальный тест для одной выборки При небольшом объеме выборки даже поправка Йейтса на непрерывность не может ликвидировать различий биномиального и нормального распределений, поэтому критерием z пользоваться невозможно. В такой ситуации используются дискретные критические значения самого биномиального распределения.

Критерий z для двух выборок Условия применения: 1.Выборки объемом более 30 человек. 2.np и n(1-p) в обеих выборках должны быть больше 5 (другими словами, признак должен быть не менее, чем у 5 человек в каждой выборке). 3.Выборки случайные 4.Выборки независимые

Расчет двухвыборочного критерия z p – это наблюдаемая в выборке доля. n – объем выборки (> 30). π – ожидаемая доля в популяции. Нулевая гипотеза: p = π Доверительный интервал для доли: ДИ= (p 1 -p 2 ) ± zs p

Расчет z для двух выборок - пример Исследуется смертность от сосудистых осложнений на фоне приема двух антиангинальных препаратов – один из них является широко распространенным, проверенным средством, а другой – экспериментальный. В группе из 100 человек, получавших старый препарат, за год умерло 7 человек. В группе из 90 человек, получавших новый препарат, за год умерло 5 человек. Достоверны ли различия в смертности?

Расчет z для двух выборок - пример Нулевая гипотеза: p1 = p2 Альтернативная гипотеза: p1 p2 1. p1 = 7/100 = 0.07; p2 = 5/90 = 0,055 SE = z = (| | ) / = z < z крит., следовательно, нулевая гипотеза принята 2. 95% доверительный интервал для разности долей: 0, ,96x0,035 (p1-p2) 0, ,96x0, p Доверительный интервал содержит 0. Следовательно, различий между группами нет.

Точный тест Фишера для двух выборок Точный тест Фишера применяется, когда нарушается второе условие использования критерия z – то есть признак наблюдается менее, чем у 5 человек в выборке. Тест Фишера основан на гипергеометрическом распределении и является полным аналогом биномиального теста, только для двух выборок. Выборки при использовании теста Фишера должны быть независимыми и случайными.

Доверительные интервалы для долей Доверительный интервал (confidence interval) для доли – это диапазон значений, в пределах которого с заданной вероятностью (обычно 95%) находится истинная популяционная доля. Для достаточно больших выборок распределение выборочных долей можно считать нормальным. Тогда: Доверительный интервал для доли: ДИ=p±zs p

Доверительные интервалы для долей Доверительные интервалы для долей, рассчитанные выше, являются лишь приблизительными. Точные доверительные интервалы рассчитываются, исходя из биномиального распределения. Вручную их можно определить по специальным номограммам, а на практике – в компьютерных статистических пакетах. Доверительные интервалы должны в обязательном порядке указываться для всех переменных при описании данных.

Доверительные интервалы для долей Пример: Исследователь указывает, что он исследовал 10 больных до и после лечения. Затем в таблице мы увидим, что до лечения боли в животе были у 70%, а после лечения – лишь у 20%. Данные выглядят очень убедительно - различия составляют 50%!. Теперь укажем доверительные интервалы: - До лечения - 70% (35% - 93%), после лечения - 20% (25% - 56%). Доверительные интервалы даже перекрываются! Поэтому проверим значимость различий: различия действительно значимы (p=0.02). Применение доверительных интервалов показывает, какой диапазон значений может принимать показатель в популяции, а не в конкретной выборке.

Доверительные интервалы для долей График без доверительных интервалов – дает представление только о выборке, изученной исследователем.

Доверительные интервалы для долей Тот же график, но уже с границами доверительных интервалов – диапазон, который могут принимать истинные значения в популяции.

Распределение хи-квадрат Распределение хи-квадрат является теоретическим распределением (наряду с нормальным, биномиальным, F- распределением и т.п.) В отличие от нормального и биномиального, это распределение не встречается в естественных процессах, а, как и распределение F, является результатом сравнения экспериментального и расчетного значений.

Область применения распределения хи-квадрат Тесты согласия (goodness-of-fit): соответствует ли данные в выборке какой-либо вероятностной модели? Тесты на гомогенность (равенство) (homogeneity): являются ли обе выборки выборками из одного (неизвестного) распределения? Тесты на связь (association) или независимость (independence): существует ли связь между двумя и более переменными или же они независимы?

Распределение хи-квадрат Распределение не симметрично, оно существенно смещено вправо. Распределение имеет разную форму в зависимости от степени свободы (вычисляется по- разному в зависимости от конкретного приложения).

Распределение хи-квадрат Распределение хи-квадрат определяется исключительно значением степени свободы. Среднее значение распределения равно числу степеней свободы (df). Стандартное отклонение равно 2 x df. С увеличением степени свободы распределение становится все симметричнее.

Распределение хи-квадрат Примеры: При df=4 нижние 2,5% распределения отсекаются значением, равным 0,4844 При df=15 верхние 5% распределения отсекаются значением, равным 24,9958

Использование хи-квадрат для проверки гипотез в одной выборке Сравнение доли в выборке с предполагаемой популяционной при помощи критерия хи-квадрат очень напоминает использование критерия z. Число степеней свободы для одной выборки и двух вариантов исходов (дихотомический признак) равно 1.

Использование хи-квадрат для проверки гипотез в одной выборке Пример: в отдаленной сельской местности изучена выборка из 100 человек, среди них 62 женщины и 38 мужчин. Исследователей интересует вопрос, достоверно ли отличаются данные показатели от 50%, предполагаемых для популяции? Наблюдаемые числа: 62 и 38 Ожидаемые числа: 50 и 50

Использование хи-квадрат для проверки гипотез в одной выборке Поправка ½ (поправка Йейтса на непрерывность) вводится лишь когда число степеней свободы равно 1 из-за того, что экспериментальное распределение дискретно (как и биномиальное), а хи-квадрат – непрерывно. Значение 5,29 при 1 степени свободы соответствует вероятности около 0,024, что меньше критического значения. Нулевая гипотеза отвергается, отличие от 50% есть.

Использование хи-квадрат для проверки гипотез в двух выборках Логика проверки гипотезы аналогична: Значения заносятся в таблицу 2x2: +-Всего Выборка Выборка Всего

Использование хи-квадрат для проверки гипотез в двух выборках Рассчитываются ожидаемые значения при предположении, что доли в выборках равны: +-Всего Выборка 1 37,562,5100 Выборка 2 37,562,5100 Всего

Использование хи-квадрат для проверки гипотез в двух выборках Далее рассчитывается критерий хи-квадрат по аналогичной формуле. Число степеней свободы для таблицы 2x2 равно 1. При df = 1 это значение соответствует вероятности 0,041. Следовательно, различия есть.

Полиномиальные таблицы и хи- квадрат Хи-квадрат можно использовать не только для сравнения дихотомических данных, но и для сравнения номинальных данных с несколькими категориями. Наиболее типичное применение такого критерия в биологии – это менделирующие признаки, для которых известно теоретическое распределение вероятностей. Возьмем классический пример Менделя с горохом и рассмотрим его с точки зрения хи-квадрат.

Полиномиальные таблицы и хи- квадрат Исследователь оценивает горошину по двум параметрам: цвет (желтый или зеленый) и поверхность (гладкая или бугристая). Соответственно, он получил 4 комбинации: Желтый гладкий – 315 Желтый бугристый – 101 Зеленый гладкий – 108 Зеленый бугристый - 32

Полиномиальные таблицы и хи- квадрат Если признаки действительно менделирующие и независимые, причем желтый и гладкий – доминантные, а зеленый и бугристый – рецессивные, распределение их должно соответствовать 9:3:3:1, то есть ожидаются числа: Желтый гладкий – 313 Желтый бугристый – 104 Зеленый гладкий – 104 Зеленый бугристый – 35 Нулевая гипотеза выглядит так: (9/16) x p1 = (3/16) x p2 = (3/16) x p3 = (1/16) x p4

Полиномиальные таблицы и хи- квадрат В данном случае число степеней свободы равно количеству категорий минус единица, то есть df = 4 – 1 = 3 Поправку Йейтса на непрерывность делать не надо, и статистика хи-квадрат становится совсем простой: Критическое значение существенно больше (7,815), поэтому достоверных отличий от распределения Менделя нет.

Критерий согласия на основе хи-квадрат В предыдущем примере мы сравнили распределение долей по категориям с теоретическим распределением. Это напрямую приводит нас к критерию согласия на основе хи-квадрат: если мы разобьем количественный признак на много категорий, и подсчитаем частотное распределение по этим категориям (иными словами, сгуппированное частотное распределение), то его можно будет прямо сравнить с теоретическим нормальным распределением!

Критерий согласия на основе хи-квадрат Основным недостатком критерия согласия на основе хи-квадрат является этап перевода распределения количественного признака в категориальную форму. При этом часть информации о распределении теряется, поэтому хи-квадрат – не самый чувствительный критерий нормальности. Но с помощью критерия согласия на основе хи-квадрат можно сравнить выборочное распределение с любым теоретическим.

Таблицы сопряженности Таблицы сопряженности (contingency tables) или кросстабуляция (cross tabulation, cross-tables) – это метод оценки различных взаимодействий между качественными (номинальными и категориальными данными).

Таблицы сопряженности BВсего A 12…c 1y11y12…у1cR1 2y21y22…у2c …………… ryr1yr2…уrcRr Всего С1С1С2С2СcСcSum Общий вид таблицы сопряженности

Таблицы сопряженности Вариант 1: A – фактор (определяется исследователем), B – отклик или исход. В этом случае таблица рассматривается как набор из r выборок объема R1… Rr, в которых возможны варианты отклика B. Вопрос, который задает исследователь: Является ли распределение отклика (B) равномерным при разных значениях A?

Таблицы сопряженности Вариант 1 – пример: A – это раса (исследователь выбрал этот фактор) B – частота гастрита B у разных рас (это тот исход, который исследователь изучает). Если распределение равномерно относительно А, значит, частота гастрита у всех рас: С1/Sum= y11/R1 = y21/R2 = yr1/Rr

Таблицы сопряженности BВсего A 12…c 1y11y12…у1cR1 2y21y22…у2c …………… ryr1yr2…уrcRr Всего С1С1С2С2СcСcSum

Таблицы сопряженности Вариант 1 – пример: С1/Sum= y11/R1 = y21/R2 = yr1/Rr Отсюда получаем, что ожидаемое число в конкретной ячейке y11=R1 x (C1/Sum) Или в общей случае E = Rr x Cc /Sum Где Rr – сумма значений по данной строке (объем одной выборки) Сс – сумма значений по данному столбцу Sum – общая сумма значений в таблице

Таблицы сопряженности BВсего A 12…c 1Ey12…у1cR1 2y21y22…у2c …………… ryr1yr2…уrcRr Всего С1С1С2С2СcСcSum

Таблицы сопряженности Вариант 2: A и B - отклики или исходы. В этом случае таблица рассматривается как одна выборка размера Sum, в которой изучаются две переменные. Вопрос, который задает исследователь: Зависит ли распределение А от распределения B? Или: независимо ли А от B?

Таблицы сопряженности Вариант 2 – пример: A – это заболеваемость раком легких B – это заболеваемость шизофренией Нулевая гипотеза заключается в том, что рак легких и шизофрения – это независимые заболевания, и одно заболевание никак не влияет на вероятность заболеть другим.

Таблицы сопряженности Вариант 2 – пример: Как вы помните, в этом случае вероятность для отдельного человека получить сразу оба заболевания равна произведению вероятностей. При независимости признаков для признака А вероятность составляет: R1/Sum При независимости признаков для признака B вероятность составляет: C1/Sum

Таблицы сопряженности Вариант 2 – пример: Тогда вероятность заболеть обоими заболеваниями сразу составляет: p = (R1/Sum) x (C1/Sum) Чтобы перевести вероятность в число человек в выборке, ее надо домножить на объем выборки (это Sum), то есть y11 = (R1/Sum) x (C1/Sum) x Sum y11 = (R1 x C1) / Sum

Таблицы сопряженности BВсего A 12…c 1Ey12…у1cR1 2y21y22…у2c …………… ryr1yr2…уrcRr Всего С1С1С2С2СcСcSum

Таблицы сопряженности Вариант 2 – пример: В оставшихся ячейках (для таблицы 2 x 2) аналогично получается вероятность: 1)Получить заболевание A и не получить заболевание B 2) Получить заболевание B и не получить заболевание A 3) Не получить заболевание A и не получить заболевание B

Таблицы сопряженности Итог по двум вариантам: Если вы заметили, в итоге в обоих вариантах мы получили E = (Rr x Cc) / Sum Это значение подставляется в формулу для хи- квадрат с df = (r-1)(c-1) Поправка Йейтса используется только при df=1

Критерий хи-квадрат в таблицах сопряженности Общие условия: 1.При таблицах 2 x 2 ожидаемые числа в каждой ячейке не должны быть меньше 5. 2.При таблицах r x c количество ячеек с ожидаемыми числами меньше 5 не должно быть больше 20%. 3.При невыполнении первых двух условий используется точный тест Фишера, который, однако, полностью не заменяет хи-квадрат.

Таблицы сопряженности На основе теста хи-квадрат и таблиц сопряженности для номинальных и порядковых данных разработаны многочисленные меры связанности (коэффициенты корреляции, конкордантности, согласия, сопряженности).

Таблицы сопряженности Таблицы сопряженности одновременно являются математической базой для латинского квадрата в эпидемиологии. Они являются математическим обоснованием для: -Чувствительности -Специфичности -Относительного риска -Отношения шансов -Отношения правдоподобия -и т. п.

Таблицы сопряженности Логарифмическое преобразование таблиц сопряженности служит основой для вычисления доверительных интервалов всех эпидемиологических показателей «латинского квадрата». Кроме того, на основе хи-квадрат существует тест Мантеля-Гензеля, позволяющий сравнивать несколько отношений шансов.

Таблицы сопряженности Расширение таблиц сопряженности до трех- и более измерений привело к появлению лог-линейного анализа – мощного инструмента для оценки множественных взаимодействий между различными типами переменных. Лог-линейный анализ напрямую связан с многофакторным дисперсионным анализом.

Таблицы сопряженности и хи- квадрат Таким образом, мы будем возвращаться к таблицам сопряженности и статистике хи- квадрат на протяжении всего оставшегося курса. Данная тема является ключевой в понимании дальнейшего материала.

Благодарю за внимание