6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.

Презентация:



Advertisements
Похожие презентации
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Advertisements

7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г. Лекция 4. Проверка статистических гипотез 4-1. Гипотеза о доле признака 4-2. Гипотеза.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 2. Доверительные интервалы 2-1. Доверительный интервал для доли 2-2. Доверительный.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г. Лекция 3. Проверка статистических гипотез 3-1. Общий принцип проверки гипотез 3-2. Гипотеза.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Тема 10. Сравнение двух выборок Гипотеза о равенстве средних. Независимые.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
Лабораторная работа 6 Обработка результатов эксперимента в MathCad.
27 сентября 2012 г.27 сентября 2012 г.27 сентября 2012 г.27 сентября 2012 г. Тема 8. Доверительные интервалы 8.1. Точечные и интервальные оценки 8.2. Доверительный.
Проверка статистических гипотез Лекция 7 (продолжение) 1.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.
Транксрипт:

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве средних 5-3. Доверительный интервал для разности средних

2 Иванов О.В., 2005 Просто пример Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных дня в году, а мальчики 3,6. В исследовании участвовало 16 девочек и 22 мальчика. Стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г Зависимые и независимые выборки Пять типовых ситуаций

4 Иванов О.В., Независимые выборки Генеральная совокупность 1 Генеральная совокупность 1 Генеральная совокупность 2 Генеральная совокупность 2 Выборка 1 Выборка Две генеральные совокупности, две независимые выборки Сравнение Случайный отбор

5 Иванов О.В., Независимые выборки Генеральная совокупность Генеральная совокупность Выборка 1 Экспериментальная группа Выборка 1 Экспериментальная группа Выборка 2 Контрольная группа Выборка 2 Контрольная группа 1.2. Одна генеральная совокупность, две независимые выборки Сравнение Большая выборка Случайное разделение

6 Иванов О.В., Зависимые выборки Генеральная совокупность 1 Генеральная совокупность 1 Генеральная совокупность 2 Генеральная совокупность 2 Выборка 1 Выборка Две генеральные совокупности, две зависимые выборки Сравнение Парный отбор

7 Иванов О.В., Зависимые выборки Генеральная совокупность Генеральная совокупность Выборка 1 Выборка Одна генеральная совокупность, две зависимые выборки Сравнение Парный отбор

8 Иванов О.В., Зависимые выборки Генеральная совокупность Генеральная совокупность Группа до теста Группа после теста 2.3. Одна генеральная совокупность, две зависимые выборки до и после теста Сравнение Выборка Экспериментальная группа Выборка Экспериментальная группа

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г Гипотеза о равенстве средних. Независимые выборки Постановка проблемы Гипотезы и статистика Последовательность действий Пример

10 Иванов О.В., 2005 Независимые выборки. Описание проблемы Что мы имеем 1.Две генеральные совокупности, из которых получены простые случайные выборки. Выборки независимые. 2. Обе выборки имеют объем n 30. Если нет, то обе выборки взяты из нормально распределенных генеральных совокупностей. Что мы хотим Проверить гипотезу о равенстве средних двух исследуемых генеральных совокупностей.

11 Иванов О.В., 2005 Гипотеза Нулевая гипотеза: Можно записать нулевую гипотезу иначе: Альтернативная гипотеза:

12 Иванов О.В., 2005 Односторонние гипотезы Можно проверять также односторонние гипотезы. Нулевая гипотеза: Альтернативная гипотеза: Правосторонний критерий Левосторонний критерий

13 Иванов О.В., Статистика ( 1 и 2 известны) Для проверки гипотезы используется статистика: где - выборочные средние - известные генеральные дисперсии - объемы выборок

14 Иванов О.В., 2005 Почему используют этот критерий? Наблюдаемое значение Ожидаемое значение Стандартная ошибка Стандартная ошибка вычислена исходя из следующего:

15 Иванов О.В., 2005 Распределение статистики Статистика имеет стандартное нормальное распределение. Для нахождения критической области пользуемся свойствами нормального закона. Критические z-значения находим по таблицам.

16 Иванов О.В., 2005 Если дисперсии неизвестны… Как проверить гипотезу о равенстве средних, если дисперсии генеральной совокупности неизвестны? В этом случае z-критерий не подойдет. Вместо него используем t-критерий. Существует два варианта. Первый, когда мы ничего не знаем о дисперсиях. Второй, когда мы не знаем значения дисперсий генеральных совокупностей, но у нас есть основания полагать их равными. В этих случаях статистика строится по разному. Разберем подробнее.

17 Иванов О.В., Статистика (предполагаем 1 = 2 ) Для проверки гипотезы используется статистика: где - выборочные средние - смешанная выборочная дисперсия - объемы выборок

18 Иванов О.В., 2005 Смешанная дисперсия (Pooled variance) Смешанная выборочная дисперсия вычисляется по формуле:

19 Иванов О.В., Статистика ( 1 и 2 неизвестны и не равны) Для проверки гипотезы используется статистика: где - выборочные средние - выборочные дисперсии - объемы выборок

20 Иванов О.В., 2005 Распределение статистики Статистика имеет распределение Стьюдента. Для нахождения критической области пользуемся таблицами. Число степеней свободы: Ситуация 2 (дисперсии неизвестны, предполагаются равными) Ситуация 3 (дисперсии неизвестны и не равны)

21 Иванов О.В., 2005 Последовательность действий Шаг 1. Сформулировать основную и альтернативную гипотезы. Шаг 2. Задать уровень значимости. Шаг 3. По таблице найти критические значения и построить критическую область. Шаг 4. По выборке сосчитать значение статистики. Шаг 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять. Шаг 6. Написать ответ.

22 Иванов О.В., 2005 Пример. Кто чаще прогуливает занятия Исследователь предполагает, что среди учеников средней школы девочки чаще, чем мальчики, прогуливают занятия. Выборочное исследование показало, что девочки пропустили в среднем 3,9 дня в году, а мальчики 3,6 дня. В исследовании участвовало 16 девочек и 22 мальчика. Стандартные отклонения составили 0,6 и 0,8 дня соответственно. Проверьте предположение исследователя на уровне значимости α=0,01. Можно считать, что генеральные дисперсии равны.

23 Иванов О.В., 2005 Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. Задан уровень значимости = 0,01. Шаг 3. По условию дисперсии неизвестны, но предполагаются равными. Используем таблицу t- распределения. df = – 1 = 37. Критическое значение t = 2,423. Правосторонняя критическая область: t > 2,423.

24 Иванов О.В., 2005 Решение Шаг 4. По выборке вычисляем смешанную выборочную дисперсию, а затем значение статистики:

25 Иванов О.В., 2005 Решение Шаг 5. Сравним полученное значение с критической областью: Полученное значение статистики не попало в критическую область. Мы принимаем основную гипотезу. Шаг 6. У нас нет оснований думать, что девочки прогуливают занятия чаще мальчиков.

26 Иванов О.В., 2005 Выводы о средних (независимые выборки) 1 и 2 известны? 1 и 2 известны? Считаем, что 1 = 2 ? Считаем, что 1 = 2 ? Используем нормальное распределение со стандартной ошибкой: Редкий случай! Да Используем t- распределение со стандартной ошибкой: Используем t-распределение с объединенной дисперсией и ошибкой: Наиболее часто! Нет

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г Доверительный интервал для разности средних Три разных случая: Дисперсии известны Дисперсии неизвестны, но равны Дисперсии неизвестны и не равны

28 Иванов О.В., 2005 Описание проблемы Что мы имеем Имеем две простые случайные, независимые выборки объема n 1 и n 2 из двух генеральных совокупностей. Генеральные совокупности имеют нормальный закон распределения с параметрами 1, 1 и 2, 2 либо объемы обеих выборок 30. Что мы хотим Оценить разницу ( ) между средними двух генеральных совокупностей. Для этого построить доверительный интервал для разности средних в следующем виде:

29 Иванов О.В., 2005 Доверительный интервал. Ситуация 1 Среднее генеральной совокупности с надежностью 1- /2 находится в доверительном интервале: Стандартные отклонения 1 и 2 известны. Тогда:

30 Иванов О.В., 2005 Доверительный интервал. Ситуация 2 Среднее генеральной совокупности с надежностью 1- /2 находится в доверительном интервале: Стандартные отклонения 1 и 2 неизвестны, но подразумеваются равными. Тогда:

31 Иванов О.В., 2005 Доверительный интервал. Ситуация 3 Среднее генеральной совокупности с надежностью 1- /2 находится в доверительном интервале: Стандартные отклонения 1 и 2 неизвестны и не подразумеваются равными. Тогда:

32 Иванов О.В., 2005 Последовательность действий Шаг 1. Вычислить выборочные средние (и выборочные дисперсии). Шаг 2. По таблицам найти z-значение (или t-значение) для доверительной вероятности 1 - (и числа степеней свободы df). Шаг 3. Вычислить точность интервальной оценки E, используя соответствующую формулу. Шаг 4. Подставить полученные значения в формулу для доверительного интервала: Шаг 5. Написать ответ.

33 Иванов О.В., 2005 Пример. Кто чаще прогуливает занятия Исследователь предполагает, что среди учеников средней школы девочки чаще, чем мальчики, прогуливают занятия. Выборочное исследование показало, что девочки пропустили в среднем 3,9 дня в году, а мальчики 3,6 дня. В исследовании участвовало 16 девочек и 22 мальчика. Стандартные отклонения составили 0,6 и 0,8 дня соответственно. Можно считать, что генеральные дисперсии равны. Постройте доверительный интервал для разности средних.

34 Иванов О.В., 2005 Решение Шаг 1. По условию, выборочные средние равны 3,9 для девочек, 3,6 для мальчиков. Стандартные отклонения 0,6 и 0,8 соответственно. Объемы выборок 16 и 22. Шаг 2. Находим t-значение. В заголовке таблицы A-3 пользуемся значениями для двусторонней области. Доверительная вероятность 99% и количество степеней свободы df = – 1 = 37 соответствуют t-значению 2,704.

35 Иванов О.В., 2005 Решение Шаг 3. Вычисляем смешанную выборочную дисперсию, а затем точность интервальной оценки:

36 Иванов О.В., 2005 Решение Шаг 4. Подставляем полученные значения в формулу для доверительного интервала: Шаг 5. Пишем ответ. Разница между средним числом прогулов девочек и мальчиков с доверительной вероятностью 99% находится в интервале между -0,343 и 0,943: