Гетероскедастичность Лекция. 2 Цели лекции Природа проблемы гетероскедастичности Последствия гетероскедастичности Средства обнаружения гетероскедастичности.

Презентация:



Advertisements
Похожие презентации
Гетероскедастичность Лекция. 2 Цели лекции Природа проблемы гетероскедастичности Последствия гетероскедастичности Средства обнаружения гетероскедастичности.
Advertisements

Гетероскедастичность лекция Цели лекции Природа проблемы гетероскедастичности Последствия гетероскедастичности Средства обнаружения гетероскедастичности.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
Гетероскедастичность лекция Цели лекции Природа проблемы гетероскедастичности Последствия гетероскедастичности Средства обнаружения гетероскедастичности.
Лекция 8.2 Тест Голдфелда – Квандта. 1 Гетероскедастичность – различие дисперсий возмущений для различных наблюдений. Ясно, что видов гетероскедастичности.
Лекция 8.6 Что делать в случае гетероскедастичности?
Лекция 8 Регрессионный анализ временных рядов. Временные ряды Проблема для составления выборки – автокорреляция данных Нарушено условие о независимости.
Лекция 8.1 Гетероскедастичность. 1 X Y = X Y 2 Одно из условий теоремы Гаусса – Маркова состоит в том, что возмущения u имеют нулевое математическое.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Лабораторная работа 6 Обработка результатов эксперимента в MathCad.
ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ 2 ТЕСТИРОВАНИЕ РЕГРЕССИОННЫХ ОСТАТКОВ НА НАЛИЧИЕ ВЫБРОСОВ, НОРМАЛЬНОСТЬ, ГОМОСКЕДАСТИЧНОСТЬ.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Лекция 6 Линейная регрессия. Простая линейная регрессия.
Проверка качества спецификации модели. Качество спецификации модели Под качеством спецификации модели понимается: - качество выбора функции уравнения.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Транксрипт:

Гетероскедастичность Лекция

2 Цели лекции Природа проблемы гетероскедастичности Последствия гетероскедастичности Средства обнаружения гетероскедастичности Средства для решения или смягчения проблемы гетероскедастичности

3 Определение гетероскедастичности Гетероскедастичность – это неоднородность наблюдений. Она характеризуется тем, что не выполняется предпосылка 2 0 использования МНК: Выполнимость предпосылки 2 0 называется гомоскедастичностью.

4 Иллюстрация определения гетероскедастичности

5 Модели с гетероскедастичными остатками Причиной непостоянства дисперсии эконометрической модели часто является ее зависимость от масштаба рассматриваемых явлений. В модель ошибка входит как аддитивное слагаемое. В то же время часто она имеет относительный характер и определяется по отношению к измеренному уровню рассматриваемых факторов.

6 Пример модели с гетероскедастичным случайным членом y x

7 Примеры моделей с гетероскедастичным случайным членом а)в)б) а) Дисперсия 2 растет по мере увеличения значений объясняющей переменной X б) Дисперсия 2 имеет наибольшие значения при средних значениях X, уменьшаясь по мере приближения к крайним значениям в) Дисперсия ошибки наибольшая при малых значениях X, быстро уменьшается и становится однородной по мере увеличения X

8 Перекрестные выборки Чаще гетероскедастичность возникает в моделях, основанных на перекрестных выборках, но встречаются и во временных рядах. Типичные «болезни»: Перекрестные выборки – гетероскедастичность Временные ряды – автокорреляция

9 Виды гетероскедастичности 1. Истинная гетероскедастичность Вызывается непостоянством дисперсии случайного члена, ее зависимостью от различных факторов. 2. Ложная гетероскедастичность Вызывается ошибочной спецификацией модели регрессии.

10 Источники гетероскедастичности – 1 Истинная гетероскедастичность возникает в перекрестных выборках при зависимости масштаба изменений зависимой переменной от некоторой переменной, называемой фактором пропорциональности (Z).

11 Источники гетероскедастичности – 1 Наиболее распространенный случай истинной гетероскедастичности – 1: дисперсия растет с ростом одного из факторов.

12 Источники гетероскедастичности – 2 Истинная гетероскедастичность возникает также и во временных рядах, когда зависимая переменная имеет большой интервал качественно неоднородных значений или высокий темп изменения (инфляция, технологические сдвиги, изменения в законодательстве, потребительские предпочтения и т.д.).

13 Гетероскедастичность как следствие ошибки спецификации модели. Пример Если вместо истинной (гомоскедастичной) модели используется линейная модель, то дисперсия остатков линейной модели пропорциональна квадрату переменной X j :

14 Гетероскедастичность простейшего вида Мы в дальнейшем будем рассматривать, главным образом, только гетероскедастичность простейшего вида:

15 Последствия гетероскедастичности 1. Истинная гетероскедастичность не приводит к смещению оценок коэффициентов регрессии 2. Стандартные ошибки коэффициентов (вычисленные в предположении. гомоскедастичности) будут занижены. Это приведет к завышению t-статистик и даст неправильное (завышенное) представление о точности оценок.

16 Обнаружение гетероскедастичности Обнаружение гетероскедастичности в каждом конкретном случае – довольно сложная задача. Для знания необходимо знать распределение случайной величины Y/X=x i. На практике часто для каждого конкретного значения x i известно лишь одно y i, что не позволяет оценить дисперсию случайной величины Y/X=x i. Не существует какого-либо однозначного метода определения гетероскедастичности.

17 Обнаружение гетероскедастичности Предварительная работа: 1. Нет ли очевидных ошибок спецификации? 2. Можно ли содержательно предполагать какой-то вид гетероскедастичности? 3. Рассмотрение графиков остатков:

18 Обнаружение гетероскедастичности Тесты: 1. Тест ранговой корреляции Спирмена. 2. Тест Парка. 3. Тест Глейзера. 4. Тест Голдфелда-Квандта. 5. Тест Уайта. 6. Тест Бреуша-Пагана.

19 Тест ранговой корреляции Спирмена При использовании данного теста предполагается, что дисперсии отклонений остатков будут монотонно изменяться (увеличиваться или уменьшаться) с увеличением фактора пропорциональности Z. Поэтому значения e i и z i будут коррелированы (возможно, нелинейно!).

20 Тест ранговой корреляции Спирмена. Алгоритм применения 1. Рассчитываются ранги (порядковые номера) значений фактора пропорциональности z i = x ik. 2. Рассчитывается уравнение и вычисляются остатки. 3. Рассчитываются ранги остатков e i.

21 Тест ранговой корреляции Спирмена. Алгоритм применения 4. Рассчитывается коэффициент ранговой корреляции Спирмена, D i – разность рангов z и e. 5. Рассчитывают статистику, распределенную нормально N(0,1) при отсутствии гетероскедастичности.

22 Тест Парка Здесь предполагается, что дисперсии связаны с фактором пропорциональности Z в виде: Т.к. дисперсии неизвестны, то их заменяют оценками квадратов отклонений e i 2.

23 Тест Парка. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки. 2. Выбирается фактор пропорциональности Z и оценивают вспомогательное уравнение регрессии: 3. Проверяют значимость коэффициента при

24 Тест Глейзера Здесь предполагается, что дисперсии связаны с фактором пропорциональности Z в виде: Т.к. средние квадратические отклонения неизвестны, то их заменяют модулями оценок отклонений.

25 Тест Глейзера. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки. 2. Выбирается фактор пропорциональности Z и оценивают вспомогательное уравнение регрессии: Изменяя, строят несколько моделей: 3. Статистическая значимость коэффициента 1 в каждом случае означает наличие гетероскедастичности. 4. Если для нескольких моделей будет получена значимая оценка 1, то характер гетероскедастичности определяют по наиболее значимой из них.

26 Тесты Парка и Глейзера. Выводы Отметим, что как в тесте Парка, так и в тесте Глейзера для отклонений i может нарушаться условие гомоскедастичности. Однако, во многих случаях используемые в тестах модели являются достаточно хорошими для определения гетероскедастичности.

27 Тест Голдфелда-Квандта В этом тесте предполагается: 1. Стандартные отклонения остатков пропорциональны фактору пропорциональности Z, т.е. 2. Случайный член имеет нормальное распределение и отсутствует автокорреляция остатков (предпосылка 3 0 ).

28 Тест Голдфелда-Квандта. Алгоритм применения 1. Выделяют фактор пропорциональности Z = X k. Данные упорядочиваются в порядке возрастания величины Z. 2. Отбрасывают среднюю треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии, используя ту же спецификацию модели регрессии. 3. Количество наблюдений в этих подвыборках должно быть одинаково. Обозначим его l.

29 Тест Голдфелда-Квандта. Алгоритм применения 4. Берутся суммы квадратов остатков для регрессий по первой трети RSS 1 и последней трети RSS 3. Рассчитывают их отношение: 5. Используем F-тест для проверки гомоскедастичности. Если статистика GQ удовлетворяет неравенству то гипотеза гомоскедастичности остатков отвергается на уровне значимости.

30 Тест Голдфелда-Квандта. Замечание Тест Голдфелда-Квандта применим и для случая обратной пропорциональности: При этом используется та же процедура, но тестовая статистика равна:

31 Тест Уайта Предполагается, что дисперсии связаны с объясняющими переменными в виде: где f( ) – квадратичная функция от аргументов. Т.к. дисперсии неизвестны, то их заменяют оценками квадратов отклонений e i 2.

32 Тест Уайта. Алгоритм применения (на примере трех переменных) 1. Строится уравнение регрессии: и вычисляются остатки. 2. Оценивают вспомогательное уравнение регрессии:

33 Тест Уайта. Алгоритм применения (на примере трех переменных) 3. Определяют из вспомогательного уравнения тестовую статистику 4. Проверяют общую значимость уравнения с помощью критерия 2. Если то гипотеза гомоскедастичности отвергается. Число степеней свободы k равно числу объясняющих Переменных вспомогательного уравнения. В частности, Для рассматриваемого случая k = 9.

34 Тест Уайта. Замечания Тест Уайта является более общим чем тест Голдфелда-Квандта. Неудобство использования теста Уайта: Если отвергается нулевая гипотеза о наличии гомоскедастичности то неясно, что делать дальше.

35 Тест Бреуша-Пагана Тест применим в предположении, что: Дисперсии зависят от некоторых дополнительных переменных :

36 Тест Бреуша-Пагана. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки: 2. Вычисляют оценку дисперсии остатков: 3. Строят вспомогательное уравнение регрессии:

37 Тест Бреуша-Пагана. Алгоритм применения 4. Для вспомогательного уравнения регрессии определяют объясненную часть вариации RSS. 5. Находим тестовую статистику: 6. Если верна гипотеза H 0 : гомоскедастичность остатков, то статистика BP имеет распределение. Т.е. о наличии гетероскедастичности остатков на уровне значимости свидетельствует:

38 Тест Бреуша-Пагана. Замечания При не существует естественного преобразования, корректирующего гетероскедастичность При гетероскедастичность может быть скорректирована:

39 Средства при гетероскедастичности 1. Использовать обобщенный метод наименьших квадратов. 2. Переопределить переменные. 3. Вычисление стандартных ошибок с поправкой на гетероскедастичность (метод Уайта).

40 Обобщенный метод наименьших квадратов При нарушении гомоскедастичности и наличии автокорреляции остатков рекомендуется вместо традиционного МНК использовать обобщенный МНК. Его для случая устранения гетероскедастичности часто называют методом взвешенных наименьших квадратов. Основан на делении каждого наблюдаемого значения на соответствующее ему стандартное отклонение остатков. Метод применим, если известны дисперсии для каждого наблюдения.

41 Метод взвешенных наименьших квадратов. Случай парной регрессии Получили уравнение регрессии без свободного члена, но с дополнительной объясняющей переменной Z и с «преобразованным» остатком. Можно показать, что для него выполняются предпосылки 1 0 – 5 0 МНК.

42 Метод взвешенных наименьших квадратов. Случай парной регрессии На практике, значения дисперсии остатков, как правило, не известны. Для применения метода ВНК необходимо сделать реалистичные предположения об этих значениях. Например: Дисперсии пропорциональны X i : Дисперсии пропорциональны X i 2 :

43 Конец лекции