Фиктивные переменные К теме «Множественная регрессия и корреляция»

Презентация:



Advertisements
Похожие презентации
Фиктивные переменные. Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы Примеры качественных факторов:
Advertisements

Модели со стохастическими регрессорами. Ранее мы предполагали, что COV(x i,u i )=0 На практике это не всегда справедливо. Причины: 1. В моделях временных.
Лекция 4 множественная регрессия и корреляция. ( продолжение )
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Проверка качества спецификации модели. Качество спецификации модели Под качеством спецификации модели понимается: - качество выбора функции уравнения.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Модели в виде систем одновременных уравнений. Оценка параметров структурной формы модели Предполагаем, что модель идентифицируема. Для иллюстрации этого.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Лекция 12. Применение фиктивных переменных для моделирования сезонных колебаний.
СОДЕРЖАНИЕ Полная и неполная индукция Принцип математической индукции Метод математической индукции Применение метода математической индукции к суммированию.
Лекция 6 множественная регрессия и корреляция. ( продолжение )
Лекция 5 множественная регрессия и корреляция. Множественная регрессия широко используется в решении проблем спроса, доходности акций, изучение функции.
Эконометрика Лекция 1. Введение.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
Лекция 8.6 Что делать в случае гетероскедастичности?
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Лекция 5 множественная регрессия и корреляция. Множественная регрессия широко используется в решении проблем спроса, изучении доходности акций, изучении.
Модели в виде систем одновременных уравнений. Проблемы построения моделей из одновременных уравнений 1.Авторегрессия Рассмотрим элементарную макроэкономическую.
Последствия ошибок в спецификации моделей Замещающие переменные.
Уравнение множественной регрессии y t = a 0 +a 1 x 1t +a 2 x 2t +a 3 x 3t +…+a k x kt +U t (8.1) Наилучшая линейная процедура получения оценок параметров.
Транксрипт:

Фиктивные переменные К теме «Множественная регрессия и корреляция»

Фиктивные переменные На практике приходится учитывать в моделях факторы, носящие качественный характер, значения которых в наблюдениях не возможно измерить с помощью числовой шкалы. Примеры. Моделирование влияния пола специалистов на уровень зарплаты. Моделирование доходов граждан от типа учебного заведения, в котором он получил образование (государственное, частное, специализированное,…) Модель инфляции с учетом различных видов регулирования со стороны государства)

Фиктивные переменные Возможны два подхода к решению задачи: - построить несколько моделей отдельно для каждого значения (градации) качественной переменной - учесть влияние качественного фактора в одной модели Второй способ представляется более прогрессивным, т.к в этом случае появляется возможность оценить статистическую значимость влияния данного фактора на поведение эндогенной переменной на фоне других факторов, внесенных в спецификацию модели

Фиктивные переменные Пример. Изучается зависимость расходов на образование «С» в «обычных» и «специализированных» школах в зависимости от числа учащихся N Предположим: 1.Зависимость затрат на обучение от количества учащихся N в обоих типах школ одинакова 2. Разница в затратах объясняется необходимостью приобретения специализированного оборудования для обучения специальным дисциплинам Тогда если строить различные модели для каждого типа школ, то спецификацию моделей можно записать в виде: Y o = a 0 + a 1 N +u Y s = b 0 + a 1 N + v

Фиктивные переменные Пример 1 (Продолжение) На рис.1 приведены диаграммы рассеяния и соответствующие модели для небольшой выборки школ в Китае Y o =a 0 +a 1 N Y s =b 0 +a 1 N b 0 =a 0 +δ

Фиктивная переменная сдвига Обе модели можно объединить, если ввести переменную d, область определения которой два целых числа : 0 и 1. При этом: Спецификация такой модели имеет вид: Y = a 0 + a 1 N + δd + u Тогда при d=0 получим Y o = a 0 + a 1 N + u при d=1 получим Y s = (a 0 +δ) +a 1 N + v

Фиктивная переменная сдвига Отметим: 1.Имея модель вида Y = a 0 + a 1 N + δd + u, есть возможность после применения МНК оценить значения параметров a 0, a 1 и δ, стандартные ошибки их оценок, а следовательно, проверить гипотезу статистической значимости влияния фиктивной переменной d (влияние типа школ) на значения эндогенной переменной Y (затраты на обучение) 2. Графики моделей для d=0 и d=1 будут параллельны, т.к предполагается, влияние переменной N в обоих случаях остается неизменным

Фиктивная переменная сдвига Модель Y= N d соответствует Y o = N Y s = N

Фиктивная переменная сдвига Фиктивные переменные часто применяются при построении динамических моделей, когда с определенного момента времени начинает действовать какой-либо качественный фактор Пример 2. Модель расходов на автотранспорт в Европе в период с 1963 по 1982 годы. Замечание. В 1974 году в Европе начался крупный нефтяной кризис, который резко поднял цены на ГСМ. В результате в 1974 году резко снизились расходы на автотранспорт, но затем затраты вновь стали расти с прежней скоростью. Для учета этой ситуации вводится фиктивная переменная d, которая равна:

Фиктивная переменная сдвига ГодРасходы YdВремя t , , , , , , , , , , , , , , , , ,8119 1,0118-7,07920,114 0,15761,82681,0024 0,75372,0549#N/A 26,01617#N/A 219,7271,787#N/A Результат ф-ции «ЛИНЕЙН» Модель имеет вид: Y= d +1.01t

Фиктивная переменная сдвига (общий случай) Пусть некоторый качественный фактор имеет несколько градаций (более 2-х) Введение в модель фиктивных переменных с несколькими градациями рассмотрим на примере шанхайских школ, где имеются 4 категории школ: общеобразовательные, технические, ПТУ и специализированные. Казалось достаточно ввести фиктивную переменную сдвига d, придав ей четыре различных значения и проблема будет решена. Такой подход мало эффективен, т.к не удается оценить статистическую значимость влияния каждой градации на значения эндогенной переменной

Фиктивная переменная сдвига (общий случай) В этом случае имеет смысл ввести отдельную переменную для каждой градации фактора. Например:

Фиктивная переменная сдвига (общий случай) Однако, если взять спецификацию модели в виде: Y=a 0 + a 1 d 1 +a 2 d 2 +a 3 d 3 +a 4 d 4 +a 5 N+u при этом всегда верно тождество d 1 +d 2 +d 3 +d 4 =1 Это означает, что матрица Х коэффициентов системы уравнений наблюдений будет коллинеарной т.к в ней присутствует столбец из 1, и как следствие отсутствует возможность применения МНК для оценки параметров модели. Предлагается в спецификацию ввести (к-1) фиктивную переменную (к- кол-во градаций), сделав одну из градаций базовой, относительно которой изучать влияние остальных градаций. Проблемы мультиколинеарности в этом случае не возникает

Фиктивная переменная сдвига (общий случай) В рассматриваемом примере в качестве базового уровня можно принять градацию «Общеобразовательная» Этой градации будет соответствовать состояние d 2 =d 3 =d 4 =0 Спецификация модели примет вид: Y=a 0 +a 1 N+a 2 d 2 +a 3 d 3 +a 4 d 4 +u(13.1) Экономический смысл коэффициентов a2, a3, a4 – превышение стоимости образования в соответствующей школе по отношению к общеобразовательной Из уравнения (13.1) легко получить соответствующее уравнение для каждого типа школ

Фиктивная переменная сдвига (общий случай) Y = a 0 +a 1 N +U 1 - Уравнение для общеобразовательных школ Y =(a 0 +a 2 ) +a 1 N + U 2 - уравнение для «технических» школ Y=(a 0 +a 3 ) + a 1 N + U 3 - уравнение для ПТУ Y=(a 0 +a 4 ) + a 1 N + U 4 - уравнение для «специализированных» школ Здесь также предполагается, что зависимость затрат на обучение от количества учащихся остается неизменной

Фиктивная переменная сдвига (общий случай 53,229143,362154,1100,342-54,9 3,1127,8526,760,04026,7 0,688,58#N/A 29,669,0#N/A 9,3E+08 5,4E+0 8#N/A Результаты моделирования затрат на обучения в различных школах Шанхая Модель: Y= N (d 2 +d 3 )+53.2d4+U (26.7) (0.04) (27.9) (3.11) (88.6) Результаты программы «ЛИНЕЙН» Гипотеза H 0 :(a 2 =a 3 ) принимается Общеоб. Техн. ПТУ

Фиктивные переменные сдвига в моделях временных рядов Пример. Модель зависимости расходов на электроэнергию и газ в США за период г.г. Год_кв. Время t d2d2 d3d3 d4d4 Расходы Y Год_кв. Время t d2d2 d3d3 d4d4 Расходы Y 1977_110007,331980_ , _221004,701980_ , _330105,101980_ , _440015,461980_ , _150007,651981_ , _261004,921981_ , _370105,151981_ , _480015,561981_ , _190007,961982_ , _ ,011982_ , _ ,051982_ , _ ,591982_ ,83

Фиктивные переменные сдвига в моделях временных рядов В качестве базовой градации принят кв.1 Спецификация модели принимает вид Y = a 0 + a 1 t + a 2 d 2 + a 3 d 3 + a 4 d 4 + U(13.2) -2,19-2,58-2,780,037,48 0,08 0,000,08 0,990,14#N/A 350,8519,0#N/A 29,470,40#N/A Результаты ф-ции «ЛИНЕЙН» Расходы в кв.2 и кв.3 статистически не отличаются

Фиктивные переменные наклона Во всех рассмотренных примерах априори предполагается, что различные градации качественного фактора приводят к параллельному сдвигу «базовой» модели Это допущение не бесспорно! В примере с различными типами школ в Шанхае предполагалось, что зависимость расходов на обучение от кол-ва учеников во всех школах одинаково Вопрос. Как учесть эффект влияния типа школы на зависимость затрат от кол-ва учащихся?

Фиктивные переменные наклона Для учета возможного изменения наклона графика модели при изменении градации качественного фактора предлагается ввести в спецификацию модели еще одно слагаемое вида «d умноженное на x» Вернемся к примеру изучения зависимости расходов на образование в различных школах. Для простоты ограничимся лишь двумя градациями фактора «тип школы»: d=0 – обычная школа; d=1 – профессиональная школа. Спецификацию модели следует записать в виде: Y = a 0 + a 1 N + a 2 *d + a 3 dN +U(13.3)

Фиктивные переменные наклона С помощью модели (13.3) появляется возможность оценить изменения наклона «базовой модели» при переходе изменении градации фактора (переменной d) Пусть d=0, тогда модель (13.3) принимает вид: Y= a 0 + a 1 N +U 1 (13.4) При d=1 получим: Y= a 0 +a 1 N +a 2 +a 3 N +U 2 илиY= (a 0 +a 2 ) + (a 1 +a 3 )N +U 2 (13.5) Модель (3.5), соответствующая d=1 отличается коэффициентами регрессии от модели (13.4) В ней учитывается как «параллельный» сдвиг, так и изменение угла наклона (изменение коэффициента a 1 )

Фиктивные переменные наклона Модель: Y= N-3501d+284dN; R 2 =0.68 Y= N Y= N