Объемы выборок. Чувствительность критериев Жилина Наталья Михайловна.

Презентация:

Advertisements

Похожие презентации

Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.

Advertisements

Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.

5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.

Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.

Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции

1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:

Статистические оценки параметров распределения Доверительные интервалы.

Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.

РАЗДЕЛ 1. "ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ ОБЩЕСТВЕННОГО ЗДОРОВЬЯ И ОРГАНИЗАЦИИ ЗДРАВООХРАНЕНИЯ" Тема 1.2. «Основы медицинской статистики и организации статистического.

ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.

Обработка и представление результатов измерений. Оценка случайной погрешности измерений Полученные при непосредственном измерении величины неизбежно содержат.

Статистические гипотезы Лекция 2.

Статистическая гипотеза. Нулевая гипотеза Кошкарова М.

Выборочное наблюдение. Понятие выборочного наблюдения. Выборочное наблюдение – это такой вид статистического наблюдения, при котором обследованию подвергается.

Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.

СРС На тему : « Сравнение средних значений признаков по критерию Стьюдента : Критерий Стьюдента для независимых выборок. Критерий Стьюдента для связанных.

Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.

Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.

СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.

Транксрипт:

Объемы выборок. Чувствительность критериев Жилина Наталья Михайловна

Доверительный интервал Характеристика, которая дополняет и даже заменяет качественное суждение (значимо – незначимо), это доверительный интервал. Характеристика, которая дополняет и даже заменяет качественное суждение (значимо – незначимо), это доверительный интервал. Доверительным называется интервал, в котором с заданной вероятностью находится некоторая величина. Доверительным называется интервал, в котором с заданной вероятностью находится некоторая величина. Пример. Истинное среднее в совокупности попадает в промежуток 4m, (где m- ошибка среднего) в 95% случаев. Промежуток длиной в четыре ошибки среднего – это и есть 95% доверительный интервал. Пример. Истинное среднее в совокупности попадает в промежуток 4m, (где m- ошибка среднего) в 95% случаев. Промежуток длиной в четыре ошибки среднего – это и есть 95% доверительный интервал. Доверительные интервалы можно определять для различных величин: разности средних (величины эффекта) и доли. Доверительные интервалы можно определять для различных величин: разности средних (величины эффекта) и доли. Доверительный интервал можно использовать вместо обычных критериев значимости, а также для определения границ нормы лабораторного показателя. Доверительный интервал можно использовать вместо обычных критериев значимости, а также для определения границ нормы лабораторного показателя.

Пример расчета доверительного интервала: При наблюдении 100 детей дошкольного возраста (n=100) с речевыми расстройствами установлено, что 15% из них – левши (M=15). При проведении аналогичных исследований с другими группами детей в некоторых процент левшей будет выше 15, в некоторых – ниже. Можно указать интервал, в границах которого будет находиться интересующий исследователя процент: [M-, M+ ], где М – полученный процент, - размер неточности, допущенной вследствие не сплошного характера наблюдения. Это и есть доверительный интервал. При наблюдении 100 детей дошкольного возраста (n=100) с речевыми расстройствами установлено, что 15% из них – левши (M=15). При проведении аналогичных исследований с другими группами детей в некоторых процент левшей будет выше 15, в некоторых – ниже. Можно указать интервал, в границах которого будет находиться интересующий исследователя процент: [M-, M+ ], где М – полученный процент, - размер неточности, допущенной вследствие не сплошного характера наблюдения. Это и есть доверительный интервал. где n – число наблюдаемых случаев; M – найденный процент; t – доверительный коэффициент, равный 2. При P (t) = 0.01 (возможность ошибиться в 1% случаев) t ~

Продолж. Пример расчета доверительного интервала: при P (t) = 0.95: при P (t) = 0.95: То есть с вероятностью 95% можно утверждать, что в данном примере процент леворуких детей дошкольного возраста с речевыми расстройствами изменяется от 8 до 22%. То есть с вероятностью 95% можно утверждать, что в данном примере процент леворуких детей дошкольного возраста с речевыми расстройствами изменяется от 8 до 22%. M± = 15 ± 7. M± = 15 ± 7. При увеличении числа наблюдений величина допущенной неточности уменьшается. При увеличении числа наблюдений величина допущенной неточности уменьшается.

Необходимая величина выборки (качественный признак): Если из формулы для выразить n, можно найти необходимую величину выборки, которая требуется для получения приемлемой неточности (например, 5%), и P (t) = 0.95: Если из формулы для выразить n, можно найти необходимую величину выборки, которая требуется для получения приемлемой неточности (например, 5%), и P (t) = 0.95: Подставляя конкретные значения, получим, что величина выборки n = 204. Подставляя конкретные значения, получим, что величина выборки n = 204.

Необходимая величина выборки (количественный признак): Пример. Планируется изучить физическое развитие девочек 9 лет. Пример. Планируется изучить физическое развитие девочек 9 лет. На основании пробного (пилотного) исследования 10 девочек установлено, что их средняя масса тела 38,3 кг., при σ=±1,3; На основании пробного (пилотного) исследования 10 девочек установлено, что их средняя масса тела 38,3 кг., при σ=±1,3; Предположим, что исследователя устраивает погрешность (приемлемая неточность) Δ= ±0,5 кг. Предположим, что исследователя устраивает погрешность (приемлемая неточность) Δ= ±0,5 кг.

Сколько девочек должно попасть в выборку? Предположим также, что вероятность безошибочного прогноза 95%, то есть t=2. Тогда Предположим также, что вероятность безошибочного прогноза 95%, то есть t=2. Тогда То есть, выборка при данных условиях должна содержать не менее 27 девочек. То есть, выборка при данных условиях должна содержать не менее 27 девочек.

Понятия чувствительности и специфичности в диагностике: В диагностике для характеристики проб используются следующие показатели: В диагностике для характеристики проб используются следующие показатели: (вероятность положительного результата у больного, характеризует способность пробы выявлять болезнь) чувствительность (вероятность положительного результата у больного, характеризует способность пробы выявлять болезнь) специфичность (вероятность отрицательного результата у здорового, характеризует способность пробы выявлять отсутствие болезни). специфичность (вероятность отрицательного результата у здорового, характеризует способность пробы выявлять отсутствие болезни). Диагностические пробы выявляют болезни, критерии значимости выявляют различия в группах. Диагностические пробы выявляют болезни, критерии значимости выявляют различия в группах.

ПРИМЕР С ПНЕВМОНИЕЙ: Определить чувствительность, специфичность, прогностическую ценность положительного и отриц. результатов, если было осмотрено 300 пациентов, при этом врач при прослушивании выявил пневмонию у 190 пациентов, не выявил у 110, рентген показал наличие болезни в 200 случаях, отсутствие – в 100 случаях. Определить чувствительность, специфичность, прогностическую ценность положительного и отриц. результатов, если было осмотрено 300 пациентов, при этом врач при прослушивании выявил пневмонию у 190 пациентов, не выявил у 110, рентген показал наличие болезни в 200 случаях, отсутствие – в 100 случаях.

Пример (латинский квадрат): Осмотрел врач (300 чел.) Рентген (300 чел.) Болезнь есть (200 человек) Болезни нет (100 человек) Пневмония выявлена (190 чел.) Истинно положительный результат (150 чел.) Ложноположитель ный результат (40 чел.) Пневмония не выявлена (110 чел.) Ложноотрицатель ный результат (50 чел.) Истинно- отрицательный результат, 60

Для примера с пневмонией: Чувст.=ИП 100/(ИП+ЛО)= /200=75 Чувст.=ИП 100/(ИП+ЛО)= /200=75 Спец.= ИО 100/(ИО+ЛП)=60 100/100=65% Спец.= ИО 100/(ИО+ЛП)=60 100/100=65% ПЦП= ИП 100/(ИП+ЛП)= /190=79% ПЦП= ИП 100/(ИП+ЛП)= /190=79% ПЦО=ИО 100/(ИО+ЛО)=60 100/110=54,5% ПЦО=ИО 100/(ИО+ЛО)=60 100/110=54,5%

Понятие специфичности для статистических критериев: Все критерии работают на вероятностях, причем доказав статистическую значимость различия в группах, мы говорим об уровне значимости (например, α = 0.05). Все критерии работают на вероятностях, причем доказав статистическую значимость различия в группах, мы говорим об уровне значимости (например, α = 0.05). Уровень значимости – это максимально приемлемая ошибка отклонить верную нулевую гипотезу, то есть найти различия там, где их на самом деле нет. Это ошибка I рода. Уровень значимости – это максимально приемлемая ошибка отклонить верную нулевую гипотезу, то есть найти различия там, где их на самом деле нет. Это ошибка I рода. Специфичность критерия – это безошибочная вероятность отклонить нулевую гипотезу (1- α). Специфичность критерия – это безошибочная вероятность отклонить нулевую гипотезу (1- α).

Понятие чувствительности для статистических критериев: Чувствительность критерия – способность критерия выявлять различия. Если мы не выявили различий с помощью критерия, это еще не означает, что их на самом деле нет. Чувствительность критерия – способность критерия выявлять различия. Если мы не выявили различий с помощью критерия, это еще не означает, что их на самом деле нет. Чувствительность зависит от величины различий, от разброса данных, от объема выборки. Чувствительность зависит от величины различий, от разброса данных, от объема выборки. Пусть мы не выявили существующих различий, то есть приняли неверную нулевую гипотезу. Это ошибка второго рода -. Пусть мы не выявили существующих различий, то есть приняли неверную нулевую гипотезу. Это ошибка второго рода -. Вероятность критерия обнаружить различия (чувствительность критерия) равна 1-. Вероятность критерия обнаружить различия (чувствительность критерия) равна 1-. Чем больше объем выборки, тем чувствительнее критерий. Чем больше объем выборки, тем чувствительнее критерий.

Возможные ошибки при применении критериев: По результатам применения критерия В действительности Различия естьРазличий нет Различия выявлены Истинно положительный результат, 1- Ложноположитель ный результат (ошибка первого рода), α Различий не выявлено Ложноотрицатель ный результат (ошибка второго рода), Истинно- отрицательный результат, 1 – α

Существуют ли различия на самом деле: Для различных критериев чувствительность вычисляется по-разному. Для различных критериев чувствительность вычисляется по-разному. Пренебрежение оценкой чувствительности приводит к тому, что во вполне корректно (в остальном) проведенном исследовании клинически значимый эффект остается не выявленным из-за слишком малой численности групп. Пренебрежение оценкой чувствительности приводит к тому, что во вполне корректно (в остальном) проведенном исследовании клинически значимый эффект остается не выявленным из-за слишком малой численности групп. Таким образом, если различий не выявлено и чувствительность критерия близка к 100%, значит статистически значимых различий в группах на самом деле нет. Таким образом, если различий не выявлено и чувствительность критерия близка к 100%, значит статистически значимых различий в группах на самом деле нет. Если различий не выявлено при низкой чувствительности, значит мы не получили никакого результата. Если различий не выявлено при низкой чувствительности, значит мы не получили никакого результата.

Оценка чувствительности: Чтобы оценить чувствительность критерия, нужно задать величину различий, которую он должен выявлять. Чтобы оценить чувствительность критерия, нужно задать величину различий, которую он должен выявлять. Факторы, влияющие на величину ошибок первого и второго рода: Увеличение разброса данных увеличивает вероятность ошибок; Увеличение разброса данных увеличивает вероятность ошибок; С ростом объема выборки вероятность ошибок уменьшается; С ростом объема выборки вероятность ошибок уменьшается; Чем выше уровень значимости (чем меньше α), тем ниже чувствительность. Чем выше уровень значимости (чем меньше α), тем ниже чувствительность.

Чувствительность (на примере критерия Стьюдента, Биостат): Найти объединенную оценку дисперсии для двух сравниваемых групп. В пакете после расчета критерия Стьюдента найдены стандартные отклонения для обеих групп: 1 и 2. Объединенная дисперсия равна: Найти объединенную оценку дисперсии для двух сравниваемых групп. В пакете после расчета критерия Стьюдента найдены стандартные отклонения для обеих групп: 1 и 2. Объединенная дисперсия равна: Объединенное стандартное отклонение равно. Объединенное стандартное отклонение равно. В меню выбрать [чувствительность] [критерий Стьюдента] [выбрать нужный, внести значения: α, объединенного стандартного отклонения, численности групп] [критерий вычислить]. В меню выбрать [чувствительность] [критерий Стьюдента] [выбрать нужный, внести значения: α, объединенного стандартного отклонения, численности групп] [критерий вычислить].

Выбор «чувствительности» в меню критериев, Биостат:

Вычисление чувствительности:

Чувствительность и различия: Если полученная чувствительность близка к 1, и при этом Вы не нашли статистически значимых различий в группах, значит их действительно нет. Если полученная чувствительность близка к 1, и при этом Вы не нашли статистически значимых различий в группах, значит их действительно нет. Если чувствительность невелика, можно поработать с выборкой: например, увеличить ее число значений, взять группы с равной численностью, понизить уровень значимости, например с 0.01 до Если чувствительность невелика, можно поработать с выборкой: например, увеличить ее число значений, взять группы с равной численностью, понизить уровень значимости, например с 0.01 до При более сильном снижении уровня значимости можно увеличить ошибку первого рода, то есть найти различия там, где их нет. При более сильном снижении уровня значимости можно увеличить ошибку первого рода, то есть найти различия там, где их нет.

Литература: Гланц, С. Медико-биологическая статистика Текст / С. Гланц – М. : Практика, с. Гланц, С. Медико-биологическая статистика Текст / С. Гланц – М. : Практика, с. Жилина, Н.М. Приложения математической статистики к медицинским научным исследованиям : учебное пособие / Н.М. Жилина. – Новокузнецк : Изд-во МОУ ДПО ИПК, – 41 с. Жилина, Н.М. Приложения математической статистики к медицинским научным исследованиям : учебное пособие / Н.М. Жилина. – Новокузнецк : Изд-во МОУ ДПО ИПК, – 41 с. Жилина, Н.М. Применение методов обработки данных в медицинских исследованиях : методические рекомендации / Наталья Михайловна Жилина. – Новокузнецк : ГОУ ДПО «НГИУВ» Росздрава, – 44 с. Жилина, Н.М. Применение методов обработки данных в медицинских исследованиях : методические рекомендации / Наталья Михайловна Жилина. – Новокузнецк : ГОУ ДПО «НГИУВ» Росздрава, – 44 с. Платонов, А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы / А.Е. Платонов. – М. : Изд-во РАМН, – 52 с. Платонов, А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы / А.Е. Платонов. – М. : Изд-во РАМН, – 52 с. Сепетлиев, Д. Статистические методы в научных медицинских исследованиях Текст / Д. Сепетлиев. пер. с болг. - М. : Изд-во Медицина, – 419 с. Сепетлиев, Д. Статистические методы в научных медицинских исследованиях Текст / Д. Сепетлиев. пер. с болг. - М. : Изд-во Медицина, – 419 с.