Статистические критерии, проверка гипотез Д.т.н., профессор кафедры мед.кибернетики и информатики Новокузнецкого ГИУВа Жилина Наталья Михайловна.

Презентация:



Advertisements
Похожие презентации
СРС На тему : « Сравнение средних значений признаков по критерию Стьюдента : Критерий Стьюдента для независимых выборок. Критерий Стьюдента для связанных.
Advertisements

Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Объемы выборок. Чувствительность критериев Жилина Наталья Михайловна.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Проверка гипотезы осуществляется с помощью критериев статистической оценки различий. ФОРМУЛИРОВАНИЕ ГИПОТЕЗЫ - систематизация предположения исследователя.
Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.
Статистический анализ в медицине Жилина Наталья Михайловна.
Основы корреляционного анализа Лекция 21. лекция 12 для студентов 1 курса, обучающихся по специальности – Клиническая психология д.б.н., профессор.
Проверка статистических гипотез Лекция 20. План лекции: 1.Проверка статистических гипотез. 2.Критерии асимметрии и эксцесса. 3.Критерий Пирсона.
РАЗДЕЛ 1. "ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ ОБЩЕСТВЕННОГО ЗДОРОВЬЯ И ОРГАНИЗАЦИИ ЗДРАВООХРАНЕНИЯ" Тема 1.2. «Основы медицинской статистики и организации статистического.
Статистическая гипотеза. Нулевая гипотеза Кошкарова М.
Система показателей структурных различий Аналитические возможности и особенности построения для парных и множественных сравнений Автор – Иванов Н. А. (НИУ.
Транксрипт:

Статистические критерии, проверка гипотез Д.т.н., профессор кафедры мед.кибернетики и информатики Новокузнецкого ГИУВа Жилина Наталья Михайловна

Типы признаков: Количественные признаки измеряются числовыми значениями (например, возраст, рост, вес, давление). Порядковые признаки – могут быть измерены в шкалах (например, школьные оценки, степень тяжести заболевания – легкая (1), средняя (2), тяжелая (3) и т.д.). Качественные признаки – характеризуют некоторое состояние объекта, но не могут быть измерены количественно (например, пол, профессия, диагноз).

ПРИЗНАК ИССЛЕДОВАНИЕ Две незави- симые группы Более двух независи- мых групп Группа до и после лечения Одна группа несколько видов лечения Связь признаков Количествен- ный (нормальное распред.) Крите- рий Стью- дента Дисперсион- ный анализ Парный критерий Стью- дента Дисперсион- ный анализ повторных измерений Линейная регрессия, корреляция Пирсона Качественн. Критерий 2 Z- критерий Критерий 2 Критерий Мак- Нимара Критерий Кокрена Коэффициент сопряжен- ности Порядковый Крите- рий Манна Уитни Критерий Крускала Уоллиса Критерий Уилкок- сона Критерий Фридмана Ранговая корреляция Спирмена

Параметрические и непараметрические критерии: Парамет- рические критерии Стью- дента Дисперси- онный анализ Парный критерий Стью- дента Дисперсион- ный анализ повторных измерений Линейная регрессия, корреляция Пирсона Непараме- трические критерии Критерий 2 Z- критерий Критерий 2 Мак- Нимара Кокрена Коэффиц. сопряжен- ности Манна Уитни Крускала Уоллиса Уилкок- сона Фридмана Ранговая корреляц. Спирмена

Принцип действия критериев: Сравниваются нужные признаки в соответствующем виде эксперимента. Проверяется нулевая гипотеза. Находится фактическая вероятность ошибки отклонить верную нулевую гипотезу (Р). Говоря упрощенно, Р это вероятность справедливости нулевой гипотезы. Максимальную приемлемую вероятность отвергнуть нулевую гипотезу называют уровнем значимости и обозначают. Обычно в медико-биологических исследованиях принимают = Если Р < 0,05 нулевая гипотеза отвергается, следовательно найдено статистически значимое различие в сравниваемых группах.

Условия нормальности распределения количественного признака: 95% значений заключаются в пределах двух стандартных отклонений (±2σ); 68% - в пределах одного стандартного отклонения (±σ); медиана близка к среднему значению (расхождение не более 20%), то есть распределение симметрично.

Проверка нормальности распределения количественного признака: Проверить близость среднего и медианы (с помощью вычислений или расчета описательных статистик в пакетах Биостатистика, SPSS или Statistica); Вычислить критерий Колмогорова-Смирнова (в пакетах SPSS или Statistica); Если распределение нормально, можно применять параметрические критерии; Если распределение не является нормальным, нужно пользоваться непараметрическими критериями.

Выбор критерия Колмогорова- Смирнова в пакете SPSS: Выбрать в меню «анализ» Непарамет- рические тесты Критерий К-С на одном примере

КРИТЕРИЙ СТЬЮДЕНТА Критерий Стьюдента применяется, если нужно сравнить только две группы количественных признаков с нормальным распределением (частный случай дисперсионного анализа). Примечание: этим критерием нельзя пользоваться, сравнивая попарно несколько групп, в этом случае необходимо применять дисперсионный анализ. Ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» несуществующие различия. Например, вместо того, чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют лучшим.

Формула для вычисления критерия Стьюдента: Где M 1, m 1 – среднее значение признака и ошибка среднего в основной группе; M 2, m 2 - среднее значение признака и ошибка среднего в группе сравнения. ν = (n 1 + n 2 - 2) – число степеней свободы.

Правила применения критерия Стьюдента: Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп; Если число групп больше двух, необходимо применять дисперсионный анализ; Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив полученный уровень значимости на число возможных сравнений (для корректности применения нужно использовать поправку Бонферрони). Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп; Если число групп больше двух, необходимо применять дисперсионный анализ; Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив полученный уровень значимости на число возможных сравнений (для корректности применения нужно использовать поправку Бонферрони).

Поправка Бонферрони: Если число сравниваемых групп больше 2-х, можно применить поправку Бонферрони, то есть взять за критический уровень значимости различий p=0.05/число сравнений. Например, при сравнении 3-х групп, число сравнений равно 3, то есть р=0.05/3= Если число попарных сравнений велико (при пяти группах их уже 10), то получаем слишком жесткое требование для уровня значимости: можно не найти различий там, где они есть. Лучше применить дисперсионный анализ.

Пример критерия Стьюдента: Пусть есть две группы независимых наблюдений. Признаки – количественные с нормальным распределением (среднее пульсовое давление); Среднее в первой группе равно 64, среднее во второй группе равно 55; В первой и во второй группах по 15 пациентов; Стандартные ошибки среднего в первой группе 3.6, во второй группе 1.8; Определить статистическую значимость различия между группами.

Вычисление результата: Вычисляем по формуле Стьюдента: __________ t = (64-55) / = 2.26 ν = n 1 + n = 28 По таблице Стьюдента для критических значений находим, что для уровня значимости P = 0.05 и степени свободы 28, критическое значение t = > 2.05 – верное неравенство. Следовательно, существует статистически значимое различие в группах с уровнем значимости Вычисляем по формуле Стьюдента: __________ t = (64-55) / = 2.26 ν = n 1 + n = 28 По таблице Стьюдента для критических значений находим, что для уровня значимости P = 0.05 и степени свободы 28, критическое значение t = > 2.05 – верное неравенство. Следовательно, существует статистически значимое различие в группах с уровнем значимости 0.05.

Применение стат. пакетов для вычисления критерия (Биостат): ВЫБОР НУЖНОГО КРИТЕРИЯ В МЕНЮ

Выбор типа данных, пакет Биостатистика, версия 4.03: ОЦЕНИТЕ ФОРМАТ ВАШИХ ДАННЫХ И ВЫБЕРИТЕ НУЖНУЮ СТРОКУ:

Ввод данных для расчета критерия Стьюдента: ВВОДИТЬ ДАННЫЕ ЗДЕСЬ

Результаты вычислений: То есть, различия статистически значимы.

Формат представления данных для расчета критерия в SPSS: Переменная анализа (например, частота пульса) должна быть в одной графе; Группирующая переменная (например, принадлежность к основной группе (1) или контрольной группе (2)) - в другой графе базы данных; Аналогичный формат должен быть и для непараметрических аналогов критерия Стьюдента (критериев Манна-Уитни, Колмогорова-Смирнова, Крускала-Уоллиса).

Расчет критерия Стьюдента в статистическом пакете SPSS. Выбор метода анализа:

Расчет критерия Стьюдента в SPSS. Отбор переменных.

Парный критерий Стьюдента: Парный критерий Стьюдента применяется, если нужно сравнить связные (зависимые) группы по количественному признаку с нормальным распределением; Например, изменение веса пациентов после проведенного лечения. То есть единицы наблюдения (больные) одни и те же, показатель – в динамике.

Алгоритм парного критерия Стьюдента: Вычисляется величина изменения (d) каждого больного. Вычисляется среднее этих изменений M d и его стандартная ошибка m. Вычисляется значение критерия Стьюдента: t = M d /m Полученное значение сравнивается с критическим для числа степеней свободы ν=n-1. Если обычный критерий Стьюдента требует нормального распределения самих данных, то парный критерий Стьюдента требует нормального распределения их изменений. Вычисляется величина изменения (d) каждого больного. Вычисляется среднее этих изменений M d и его стандартная ошибка m. Вычисляется значение критерия Стьюдента: t = M d /m Полученное значение сравнивается с критическим для числа степеней свободы ν=n-1. Если обычный критерий Стьюдента требует нормального распределения самих данных, то парный критерий Стьюдента требует нормального распределения их изменений.

Расчет критерия для связных выборок количественного признака с нормальным распределением: В статистических пакетах выбор критерия осуществляется с помощью меню критериев; Обязательно выбрать парный критерий Стьюдента. Непараметрическим аналогом парного критерия Стьюдента является критерий Уилкоксона.

Формат данных для парного критерия Стьюдента (SPSS): Вес до лечения Вес после лечения

Расчет парного критерия Стьюдента в SPSS. Отбор переменных.

Результаты расчета парного критерия Стьюдента (SPSS): Значение парного критерия Число степеней свободы Уровень значимости различия (р)

Аналог критерия Стьюдента для качественных признаков: Z-критерий Z-критерий применяется для сравнения двух групп дихотомических качественных или порядковых признаков, выраженных в относительных показателях (долях). Формула для вычисления критерия: где Р1, Р2 – относительные значения показателей в сравниваемых группах (периодах); m1, m2 – средние ошибки относительных показателей.

Формулы для средних ошибок : где p – относительное значение показателя, q = 100 – p, для показателей, вычисляемых в процентах; q = 1000 – p, для показателей, вычисляемых в промилле и т.д.; n – число наблюдений (записей в БД для требуемого показателя). Формула корректна при n 30; При n 30 в знаменателе под корнем (n-1).

Пример вычисления Z-критерия: По данным социально-гигиенического мониторинга в г. Новокузнецке: в 2000 г. значение показателя санитарного фона было 9% на 40 смывов, в 2001 г. 30% на 50 смывов. Произошло ли за год статистически значимое изменение в группах по данному показателю?

Решение в пакете Биостатистика: В меню Критерии выбираем Z-критерий. Появляется шаблон для ввода данных группы 1. Заполняем численность группы 1 – 40 смывов, доля показателя санитарного фона , что соответствует 9% Далее на экране появляется шаблон для ввода значений группы 2. Вводим в шаблон цифры 50 – число смывов во второй группе, 0.3 – доля показателя (соответствует 30%). Входные данные введены.

Результат и интерпретация: Поскольку уровень значимости Р = (Р < 0,05), нуле- вая гипотеза, предполагающая, что различия в группах статистически не значимы, отвергается. Таким образом, в 2001 году значение показателя санитарного фона по смывам в г. Новокузнецке значимо возросло по сравнению с 2000 г.

Непараметрический аналог критерия Стьюдента: критерий Манна-Уитни: Если распределение количественных признаков в двух независимых группах не является нормальным, можно воспользоваться критерием Манна Уитни; Данные обеих групп объединяются и упорядочиваются по возрастанию. Ранг 1 присваивается наименьшему из всех значений, ранг 2 – следующему и так далее. Наибольший ранг присваивается самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, два значения поделили 3-е и 4-е места, обоим присваивается ранг 3,5); Для меньшей группы вычисляется Т – сумма рангов ее членов. Если численность групп одинакова, Т вычисляется для любой из них. Полученное значение сравнивается с критическими значениями стандартных таблиц. В зависимости от результата сравнения нулевая гипотеза отвергается (различия статистически значимы) или принимается. Если распределение количественных признаков в двух независимых группах не является нормальным, можно воспользоваться критерием Манна Уитни; Данные обеих групп объединяются и упорядочиваются по возрастанию. Ранг 1 присваивается наименьшему из всех значений, ранг 2 – следующему и так далее. Наибольший ранг присваивается самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, два значения поделили 3-е и 4-е места, обоим присваивается ранг 3,5); Для меньшей группы вычисляется Т – сумма рангов ее членов. Если численность групп одинакова, Т вычисляется для любой из них. Полученное значение сравнивается с критическими значениями стандартных таблиц. В зависимости от результата сравнения нулевая гипотеза отвергается (различия статистически значимы) или принимается.

Пример применения критерия Манна-Уитни: Была исследована проницаемость сосудов сетчатки в двух группах – здоровых (Х) и больных (Y). Х={0.5, 0.7, 0.7, 1.0, 1.0, 1.2, 1.4, 1.4, 1.6, 1.6, 1.7, 2.2}; Y={1.2, 1.4, 1.6, 1.7, 1.7, 1.8, 2.2, 2.3, 2.4, 6.4, 19.0, 23.0}. Определить, значимы ли различия в группах. Была исследована проницаемость сосудов сетчатки в двух группах – здоровых (Х) и больных (Y). Х={0.5, 0.7, 0.7, 1.0, 1.0, 1.2, 1.4, 1.4, 1.6, 1.6, 1.7, 2.2}; Y={1.2, 1.4, 1.6, 1.7, 1.7, 1.8, 2.2, 2.3, 2.4, 6.4, 19.0, 23.0}. Определить, значимы ли различия в группах.

Проверка в Биостат нормальности распределения признаков: Во второй группе медиана значительно (в 2,7 раза) отличается от среднего значения, следовательно, распределение не является нормальным. Таким образом, в данном случае мы не имеем права применять параметрические методы. В МЕНЮ «КРИТЕРИИ» ВЫБИРАЕМ «ОПИСАТЕЛЬНАЯ СТАТИСТИКА»

Результат и интерпретация Вероятность ошибки отвергнуть справедливую нулевую гипотезу, предполагающую, что различия в группах незначимы, меньше 0,05: p=0,002. Следовательно, критерий Манна-Уитни выявил значимые различия по признаку проницаемости сосудов сетчатки между группой больных и здоровых.

Решение примера в SPSS: Формат данных: все значения признаков, то есть значения проницаемости сосудов сетчатки как у больных, так и у здоровых, должны быть в одной графе; Группирующая переменная должна описывать, к какой группе относится пациент, например, в нашем случае: «здоров»=1, «болен»=2; Аналогичный формат данных должен быть для вычисления в SPSS и других критериев, если рассматриваются независимые группы.

Выбор критерия Манна-Уитни в SPSS:

Подготовка данных для расчета:

РЕЗУЛЬТАТЫ РАСЧЕТА В SPSS: В ПЕРВОЙ ТАБЛИЦЕ РАССЧИТАНЫ РАНГИ: Т=203, ВО ВТОРОЙ УРОВЕНЬ ЗНАЧИМОСТИ: P=0.002 РЕЗУЛЬТАТ СОВПАДАЕТ С ПОЛУЧЕННЫМ В БИОСТАТИСТИКЕ

Анализ качественных признаков. Критерий хи-квадрат ( 2 ): Критерий для сравнения двух или более групп качественных признаков; Если признак может принимать одно из двух возможных значений, он называется дихотомическим; Критерий может применяться как для дихотомических, так и для признаков с большим числом возможных значений. Число возможных сочетаний числа выборок и значений признака называется таблицей сопряженности.

Формула критерия хи-квадрат: Для таблиц сопряженности 2 2 применяется поправка Йейтса: в числителе вычитается ½ для компенсации излишнего «оптимизма» (несколько ужесточает критерий).

Правомерность применения: Применение критерия 2 для таблиц размерности 2 2 правомерно, если ожидаемое число в любой из ячеек таблицы больше или равно 5; В противном случае нужно использовать более точный критерий Фишера (перебор всех возможных вариантов заполнения таблицы сопряженности при данной численности групп).

Правомерность применения: Для таблиц сопряженности размерности больше, чем 2 2, критерий 2 применим, если все ожидаемые числа не меньше 1, и доля клеток с ожидаемыми числами меньше 5 не превышает 20%. При невыполнении этих условий критерий может дать ложные результаты. В этом случае нужно объединить несколько строк или столбцов, то есть преобразовать таблицы сопряженности.

Пример критерия хи-квадрат: Пусть есть две группы: не вакцинированных и вакцинированных по 20 человек в каждой. В первой группе заболело 12 человек, а во второй – 4 человека. Определить значимо ли различие в группах, то есть эффективна ли вакцинация?

Таблица сопряженности: ГруппыЗаболелоНе заболело Не вакцинированные факт12факт8 ожид.8 12 Вакцинированныефакт4 16 ожид.8 12 Ожидаемые значения – при условии справедливости нулевой гипотезы

Решение задачи в пакете Биостатистика: Признак качественный («заболел» с возможными значениями «да» или «нет»), две независимых группы. Следовательно, необходимо воспользоваться критерием χ2. Важно: в условии задачи дана численность всей группы и число заболевших. Во входную таблицу для пакета «Биостатистика» необходимо по группам ввести число заболевших и не заболевших (как разность между общей численностью группы и числом заболевших). Для таблиц сопряженности 2 2 в пакете автоматически вычисляется поправка Йейтса

Результат и интерпретация: Результат вычислений представлен на рисунке. Интерпретация результата. Нулевая гипотеза предполагает, что между числом заболевших в группах нет статистически значимого различия. В пакете «Биостатистика» вычислена вероятность ошибки Р = 0,024. Р < 0,05, следовательно, нулевая гипотеза отвергается. То есть, найдено статистически значимое различие по признаку «заболел гриппом» между группой вакцинированных и не вакцинированных. Значит вакцинация эффективна.

Качественные признаки, связные группы: Критерий Мак-Нимара Критерий предназначен для анализа повторных измерений качественных признаков, достаточно часто встречающихся в медицине, например, диагноз – типичный качественный признак. Критерий Мак-Нимара, подобно парному критерию Стьюдента, часто используется для выявления изменений в наблюдениях типа «до-после», когда интересующий признак принимает одно из двух значений «есть-нет».

Шаги критерия Мак-Нимара: Исключаются из рассмотрения больные, реакция которых неизменна, и подсчитывается число тех, чья реакция изменилась. Полученное число делится пополам. Вычисляется мера отклонения наблюдаемого числа меняющих реакцию больных от ожидаемого, используя критерий 2 с поправкой Йейтса. Сравнивается полученное значение 2 с критическим, имеющим одну степень свободы.

Пример применения критерия Мак-Нимара: Пусть из группы больных с черепно-мозговой травмой (ЧМТ) из 90 человек до лечения в подгруппе с минимальным отклонением во фронтальной плоскости находилось 33 человека; после лечения численность этой подгруппы увеличилась до 56 человек. Ухудшения состояния после лечения не наблюдалось. Можно ли говорить об эффективности примененного лечения?

Решение с помощью пакета Биостатистика: 1. Расчет значений входной таблицы. Таблица входных данных включает в себя ячейки: число больных со стабильным состоянием (33 человека); улучшением (56-33=23 человека); ухудшением (0 человек); не вошедшими в данную подгруппу (90-56=34 человека):

Ввод данных в пакете Биостат: ВЫБРАТЬ В МЕНЮ НУЖНЫЙ КРИТЕРИЙ ВВЕСТИ ЗНАЧЕНИЯ ВХОДНОЙ ТАБЛИЦЫ

Результат и интерпретация: Нулевая гипотеза в данном случае предполагает, что нет статистически значимого улучшения состояния больных в результате лечения (состояние улучшилось и ухудшилось у равного числа больных). Вычисленный уровень значимости меньше (Р=0.000), то есть нулевая гипотеза отвергается. Лечение эффективно.

Корреляционный анализ: Корреляционные методы применяются для выявления связи между признаками. Линейная корреляция Пирсона для анализа количественных признаков с нормальным распределением; Ранговая корреляция Спирмена для порядковых признаков; Коэффициент сопряженности – для анализа качественных признаков. Корреляционные методы применяются для выявления связи между признаками. Линейная корреляция Пирсона для анализа количественных признаков с нормальным распределением; Ранговая корреляция Спирмена для порядковых признаков; Коэффициент сопряженности – для анализа качественных признаков.

Коэффициент корреляции (k): Возможные значения k=[-1; +1]; Если k=0 – связь между признаками отсутствует; Если k>0 – связь прямая, то есть с увеличением значений одного из признаков, второй также растет. Если k0 – связь прямая, то есть с увеличением значений одного из признаков, второй также растет. Если k

Продолжение. Коэффициент корреляции (k): Если (-1 k < -0.7) – сильная обратная связь; Если (-0.7 k < -0.3)– средняя обратная связь; Если(-0.3 k < 0.0)– слабая обратная связь; Если (0.0 < k 0.3)– слабая прямая связь; Если (0.3 < k 0.7)–средняя прямая связь; Если (0.7 < k < 1)– сильная прямая связь; Если k=1 – связь функциональная; Если k>1- ищите ошибку в вычислениях. Если (-1 k < -0.7) – сильная обратная связь; Если (-0.7 k < -0.3)– средняя обратная связь; Если(-0.3 k < 0.0)– слабая обратная связь; Если (0.0 < k 0.3)– слабая прямая связь; Если (0.3 < k 0.7)–средняя прямая связь; Если (0.7 < k < 1)– сильная прямая связь; Если k=1 – связь функциональная; Если k>1- ищите ошибку в вычислениях.

Пример на использование корреляционного метода: Существует ли связь между проницаемостью сосудов сетчатки (Х) и электрической активностью сетчатки (Y)? Х={19.5, 15.0, 13.5, 23.3, 6.3, 2.5, 13.0, 1.8, 6.5, 1.8}; Y={0.0, 38.5, 59.0, 97.4, 119.2, 129.5, 191.7, 248.7, 318.0, 438.5}.

Решение. Ввод данных в пакете Биостатистика: 1. В меню «критерии» выбираем ранговую корреляцию Спирмена 2. Вводим или импортируем данные

Результат решения: k=-0.779, то есть выявлена сильная обратная связь между проницаемостью сосудов и электрической активностью сетчатки. Результат статистически значим с уровнем значимости p=0,01.

Решение в SPSS аналогично:

Результат решения в SPSS (корреляционная матрица): Коэффициент корреляции Спирмена Уровень значимости (p)

Линейная регрессия. Метод наименьших квадратов: ЛИНИЯ РЕГРЕССИИ КОРРЕЛЯЦИОННОЕ ПОЛЕ (ОБЛАКО) Линия, сумма квадратов расстояний до которой из точек корреляционного поля минимальна называется линией регрессии. Метод можно использовать для прогноза.

Логистическая регрессия Логит-регрессия прогнозирует вероятность некоторого события, находящуюся в пределах от 0 до 1. В качестве зависимой переменной используется дихотомическая, имеющая два возможных значения. Пример. Определить, в какую группу (здоровых-1 или больных-2) попадет пациент, в зависимости от значения уровня сахара в крови. В данном упрощенном примере всего одна независимая переменная «уровень сахара», понятно, что независимых переменных может быть несколько, например, динамика измерений уровня сахара у пациентов или добавлен какой-то уточняющий признак, например, возраст, вес пациента и т.д.

Решение. Расчет Логит-регрессии в SPSS-17.0

При расчете обязательно вывести предсказанные значения: Отметить «галочкой»

Результаты расчета логит-регрессии Коэффициенты уравнения регрессии Уровень значимости

Полученное уравнение логит- регрессии: e – основание натуральных логарифмов 2,71…

ROC-кривая ROC-кривая показывает зависимость количества верно классифицированных положительных примеров (чувствительность) от количества неверно классифицированных отрицательных примеров (1- специфичность). Чем ближе к 1 показатель AUC (площади под кривой), тем лучшей прогностической силой обладает модель.

Расчет ROC-кривой

Результаты ROC-анализа Площадь под кривой Тестовая переменная(ые): Предсказанная вероятность Площадь AUC=0,890 Чем ближе к 1 площадь, тем лучше результаты логит-регрессии

АНАЛИЗ ВЫЖИВАЕМОСТИ Методика полноценного использования имеющихся неполных данных называется анализом выживаемости ПРИМЕРЫ наблюдаемых событий: - Смерть пациента; - Рецидив заболевания (не обязательно смерть); - Вступление в брак; - Рождение 1-го или 2-го ребенка; - Отчисление из ВУЗа; - Несчастный случай для застрахованного и т.д.

Полные и цензурированные данные Полные данные – включают время от начала наблюдения до осуществления события, например: от операции онкобольному до летального исхода; Цензурированные данные – если наблюдение не заканчивается искомым событием; например: послеоперационный больной погиб от несчастного случая, уехал, отказался от наблюдения, расторг договор страхования и т.д. Эти случаи считаются «выбывшими».

Требования к исследованиям выживаемости: Для всех исследуемых известно время начала наблюдения; Для всех исследуемых известно время окончания наблюдения и исход - полный случай или цензурируемый (выбывание); Выбор наблюдаемых – случаен.

Кривая выживаемости Кривая выживаемости – задает вероятность пережить любой из моментов времени после начального события; Медиана выживаемости – наименьшее время, для которого выживаемость меньше 0,5, например, 50% пациентов умерло. Возможные исследования: - изучение продолжительности жизни (исход – смерть); - изучение срока лечения определенного заболевания (исход – ремиссия); - Длительность лечения бесплодия или эффективность контрацепции (исход – беременность); - Долговечность протеза (исход – поломка) и т.д.

Ввод данных и кривая выживаемости в Биостат Время смерти i-го пациента

Результат анализа выживаемости и интерпретация В начале наблюдения было 11 исследуемых; в 1 год умерло 2 человека, выживаемость – 0,812, во второй еще 3 человека, в третий – 1. Медиана выживаемости равна 3, то есть, половина наблюдаемых умерла до конца третьего года наблюдения.

ИСХОД ПОЛНЫЙ ИСХОД ЦЕНЗУРИРУЕМЫЙ (ВЫБЫТИЕ) ИСХОД ПОЛНЫЙ ВВОД ЦЕНЗУРИРУЕМЫХ ДАННЫХ В БИОСТАТ

РЕЗУЛЬТАТ ВЫЖИВАЕМОСТИ С ЦЕНЗУРИРОВ. ДАННЫМИ

Сравнение кривых выживаемости Необходимо сравнить выживаемость в двух разных группах больных; Возможные методы: - Логранговый критерий (основан на отношении смертности ψ). Функции выживаемости связаны соотношением: - Если ψ1, - раньше, чем в первой; - Если ψ=1, кривые выживаемости совпадают.

ВВОДЯТСЯ МОМЕНТЫ СМЕРТИ ПАЦИЕНТОВ 1-й И 2-й ГРУПП

Наблюдалось по 17 человек в группах в четыре условных момента времени. На входе вводятся моменты смерти пациентов. В момент наблюдения «0» в первой группе никто не умер, во второй группе – умерло 8 человек. Найдены статистически значимые различия с уровнем значимости p=0,005, во второй группе пациенты умирали раньше. Результат сравнения кривых выживаемости

Критерий Гехана (для сравнения выживаемости в двух группах) Критерий Гехана является обобщением критерия Уилкоксона. На его результаты сильно влияет число ранних смертей. Логранговый критерий предпочтительнее, если справедливо предположение о постоянном отношении смертности, то есть кривые выживаемости не пересекаются

Заключение. Исследователь должен понимать, что главное в статистическом анализе корректно поставить задачу и адекватно выбрать метод решения. Выбор инструмента (статистического пакета) зависит от умений и навыков исследователя, а также от формата данных, которые необходимо проанализировать. Например, если у Вас есть только таблица сопряженности (для критерия 2 ), Вы можете работать с Биостатом, в то время как для SPSS нужна первичная информация БД. Успехов! Исследователь должен понимать, что главное в статистическом анализе корректно поставить задачу и адекватно выбрать метод решения. Выбор инструмента (статистического пакета) зависит от умений и навыков исследователя, а также от формата данных, которые необходимо проанализировать. Например, если у Вас есть только таблица сопряженности (для критерия 2 ), Вы можете работать с Биостатом, в то время как для SPSS нужна первичная информация БД. Успехов!

Основная литература: Гланц, С. Медико-биологическая статистика Текст / С. Гланц – М. : Практика, с. Жилина, Н.М. Приложения математической статистики к медицинским научным исследованиям : учебное пособие / Н.М. Жилина. – Новокузнецк : Изд-во МОУ ДПО ИПК, – 41 с. Жилина, Н.М. Применение методов обработки данных в медицинских исследованиях : методические рекомендации / Наталья Михайловна Жилина. – Новокузнецк : ГОУ ДПО «НГИУВ» Росздрава, – 44 с. Платонов, А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы / А.Е. Платонов. – М. : Изд-во РАМН, – 52 с. Электронный самоучитель по SPSS. Гланц, С. Медико-биологическая статистика Текст / С. Гланц – М. : Практика, с. Жилина, Н.М. Приложения математической статистики к медицинским научным исследованиям : учебное пособие / Н.М. Жилина. – Новокузнецк : Изд-во МОУ ДПО ИПК, – 41 с. Жилина, Н.М. Применение методов обработки данных в медицинских исследованиях : методические рекомендации / Наталья Михайловна Жилина. – Новокузнецк : ГОУ ДПО «НГИУВ» Росздрава, – 44 с. Платонов, А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы / А.Е. Платонов. – М. : Изд-во РАМН, – 52 с. Электронный самоучитель по SPSS.

Дополнительная литература: Бесплатный электронный учебник по статистике компании StatSoft (доступен в интерактивном режиме и в виде архива на Боровиков, В.П. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. – СПб.: Питер, – 650 с. Кови, С.Р. Семь навыков высокоэффективных людей / С.Р. Кови. – М.: ВЕЧЕ* ПЕРСЕЙ*АСТ, – 479 с. Медик, В.А. Математическая статистика в медицине : учебное пособие / В.А. Медик, М.С. Токмачев. - М. : Финансы и статистика, – 800 с. Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях.- М.: ГЭОТАР Медицина, с. Бесплатный электронный учебник по статистике компании StatSoft (доступен в интерактивном режиме и в виде архива на Боровиков, В.П. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. – СПб.: Питер, – 650 с. Кови, С.Р. Семь навыков высокоэффективных людей / С.Р. Кови. – М.: ВЕЧЕ* ПЕРСЕЙ*АСТ, – 479 с. Медик, В.А. Математическая статистика в медицине : учебное пособие / В.А. Медик, М.С. Токмачев. - М. : Финансы и статистика, – 800 с. Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях.- М.: ГЭОТАР Медицина, с.

Продолжение. Дополнительная литература: Сепетлиев, Д. Статистические методы в научных медицинских исследованиях Текст / Д. Сепетлиев. пер. с болг. - М. : Изд-во Медицина, – 419 с. Социальная статистика : учебник / Под редакцией И.И. Елисеевой. – М. : Финансы и статистика, – 416 с. Спицнадель, В.Н. Основы системного анализа Текст / В.Н. Спицнадель. – Санкт-Петербург : Издательский дом «Бизнес-пресса», с. Чеченин, Г.И. Системный подход и системный анализ в здравоохранении и медицине : учебное пособие / Г.И.Чеченин Новокузнецк : Изд-во МОУ ДПО ИПК, с. Сепетлиев, Д. Статистические методы в научных медицинских исследованиях Текст / Д. Сепетлиев. пер. с болг. - М. : Изд-во Медицина, – 419 с. Социальная статистика : учебник / Под редакцией И.И. Елисеевой. – М. : Финансы и статистика, – 416 с. Спицнадель, В.Н. Основы системного анализа Текст / В.Н. Спицнадель. – Санкт-Петербург : Издательский дом «Бизнес-пресса», с. Чеченин, Г.И. Системный подход и системный анализ в здравоохранении и медицине : учебное пособие / Г.И.Чеченин Новокузнецк : Изд-во МОУ ДПО ИПК, с.

Благодарю за внимание! Р.тел. (384-3)