5. Моделирование одномерных временных рядов и прогнозирование.

Презентация:



Advertisements
Похожие презентации
Лекция 8 Временные ряды в эконометрических исследованиях.
Advertisements

Лекция 10 Временные ряды в эконометрических исследованиях.
Временные ряды в эконометрических исследованиях..
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Изучение рядов динамики Классификация Правила построения Показатели динамики.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Теория прогнозирования включает: анализ объекта прогнозирования методы прогнозирования: 1. мaтематические(формализованные) -симплексные(простые) -статистические.
Анализ индекса Доу-Джонса Выполнила Мартынова И.В. Санкт-Петербургский Государственный Университет Факультет Прикладной Математики – Процессов Управления.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Общая теория статистики Регрессионно- корреляционный анализ.
Кандидат технических наук, доцент Грекул Владимир Иванович Учебный курс Теория информационных систем Лекция 5.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
ЛЕКЦИЯ РЯДЫ ДИНАМИКИ § 1. ДИНАМИЧЕСКИЕ (ВРЕМЕННЫЕ) РЯДЫ, основные понятия и классификации РЯДЫ ИЗМЕНЯЮЩИХСЯ ВО ВРЕМЕНИ ЗНАЧЕНИЙ СТАТИСТИЧЕСКОГО ПОКАЗАТЕЛЯ,
Свойства коэффициентов регрессии и проверка гипотез.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
ЭКОНОМЕТРИКА. Методы и модели анализа временных рядов. Прогнозирование экономических процессов с использованием временных рядов.
Средняя школа год разработка Агрба Л. М. Далее Информатика и ИКТ ПОНЯТИЕ ТРЕНДА.
Транксрипт:

5. Моделирование одномерных временных рядов и прогнозирование

5.1. Составляющие временного ряда Временным рядом (рядом динамики, динамическим рядом) называется упорядоченная во времени последовательность численных показателей{(y i,t i ), i=1,2,...,n}, характеризующих уровни развития изучаемого явления в последовательные моменты или периоды времени

Величины y i называются уровнями ряда, а t i – временными метками ( моменты или интервалы наблюдения ). Цель : Выявление закономерностей в изменении уровней ряда и построении его модели в целях прогнозирования и исследования взаимосвязей между явлениями.

В исследовании экономический временной ряд представляют в виде совокупности трех составляющих: – долговременной тенденции (Т); – периодических колебаний (S); – случайных колебаний (E).

Объединяя компоненты, можно получить различные модели временного ряда (Y): – аддитивную Y t = T t + S t + E t ; – мультипликативную Y t = T t ·S t · E t ; – смешанную Y t = T t · S t + E t. Периодические колебания принято подразделять : - сезонные, у которых период колебаний не превышает одного года, вызванные климатическими или социально - экономическими причинами ; - циклические с периодом колебаний несколько лет, связанные с циклами деловой активности.

5.2. Автокорреляция уровней временного ряда Корреляционная зависимость между последовательными уровнями временного ряда называется автокорреляцией уровней временного ряда. коэффициент автокорреляции где τ – величина сдвига, называемая лагом, определяет порядок коэффициента автокорреляции

5.3. Моделирование тенденции временного ряда Методы определения наличия тенденции Метод сравнения средних. Метод сравнения средних применим для выявления монотонной тенденции.

Временной ряд разбивается на две примерно равные части y 1, y 2,..., y n1 и y n1+1, y n1+2,..., y n=n1+n2 с количеством уровней n 1 и n 2 и для каждой части вычисляются средние ( ) и выборочные дисперсии ( ) соответственно. Далее рассчитывается значение критерия Стьюдента по формуле

Нулевая гипотеза о равенстве средних ( об отсутствии тенденции ) отвергается, если выполняется условие τ > t 1-α, m, где t 1- α,m – табличное значение t- критерия Стьюдента при уровне значимости α и числе степеней свободы m = n 1 + n 2 – 2.

Метод Фостера-Стюарта. Каждому уровню ряда y i, начиная со второго, ставится в соответствие два значения p i q i по следующим правилам: p i = 1, если уровень y i меньше всех предыдущих уровней, т. е. y i < y 1, y 2,...,y i-1, и p i = 0 в противном случае; q i = 1, если уровень y i больше всех предыдущих уровней, т. е. y i > y 1, y 2,..., y i-1, и q i = 0 в противном случае. Вычисляется статистика

Гипотеза об отсутствии тенденции отвергается, если выполняется условие t p > t 1-α, n-1, где t 1-α,n-1 – табличное значение t-критерия Стьюдента при уровне значимости α и числе степеней свободы n –1.

Сглаживание временного ряда по методу скользящей средней Сглаживание временного ряда по методу скользящей средней заключается в замене исходных уровней ряда y t сглаженными значениями y t, которые получаются как среднее значение определенного числа уровней исходного ряда, симметрично окружающих значение y t. В результате получается временной ряд y t, меньше подверженный колебаниям.

Для вычисления сглаженных значений y t по методу простой скользящей средней используются следующие формулы: 1) Нечетный интервал сглаживания g = 2p+1 (интервал сглаживания – количество исходных уровней ряда (y t ), используемых для сглаживания): где у t – фактическое значение уровня исходного ряда в момент t; y t – значение скользящей средней в момент t; 2 р+1- длина интервала сглаживания.

2) Четный интервал сглаживания g = 2p: Для восстановления потерянных значений временного ряда можно использовать следующий прием: а) Вычисляется средний прирост Δ у на последнем активном участке ( y n-g,..., y n ) где g – длина активного участка.

б ) Определяются значения последних р = (g–1)/2 уровней сглаженного временного ряда с помощью последовательного прибавления среднего абсолютного прироста Δ у к последнему сглаженному значению y n–p Важным свойством процедуры сглаживания является полное устранение периодических колебаний из временного ряда, если длина интервала сглаживания берется равной или кратной периоду колебаний. Это обстоятельство используется при выделении периодической составляющей временного ряда

Рассчитать значение автокорреляции ряда динамики: Число студентов в учреждениях ВПО : уч. год 2000/012005/062006/072007/082008/092009/102010/112011/122012/13 число студентов, тыс. человек 4741,47064,67309,87461,37513,17418,87049, ,9

Рассчитать значение автокорреляции ряда динамики: уч. год, t число студентов, тыс. человек, y t y t /014741,4 7064,6 2005/067064,6 7309,8 2006/077309,8 7461,3 2007/087461,3 7513,1 2008/097513,1 7418,8 2009/107418,8 7049,8 2010/117049,8 6490,0 2011/126490,0 6073,9 2012/136073,9- среднее значе-ние 6881,17047, ,7 183,5 428,7 580,2 632,0 537,7 168,7 -391,1 16,9 262,1 413,6 465,4 371,1 2,1 -557,7 -973, , , , , , , , ,2 Σ= ,1 286, , , , ,0 4, , ,4 Σ= , , , , , ,9 1149, , ,5138 Σ=981703,4

Рассчитать значение автокорреляции ряда динамики:

Проверим ряд на монотонность: уч. год 2000/012005/062006/072007/082008/092009/102010/112011/122012/13 число студентов, тыс. человек 4741,47064,67309,87461,37513,17418,87049, ,9 τ =0,33

Проверим ряд наличие тенденции: уч. год, t число студентов, тыс. человек, y t 2000/014741,4 2005/067064,6 2006/077309,8 2007/087461,3 2008/097513,1 2009/107418,8 2010/117049,8 2011/126490,0 2012/136073,9 Итого 61122,7 pipi ,0 qiqi ,0 1/i 0,50 0,33 0,25 0,20 0,17 0,14 0,13 0,11 1,8 p i -q i ,0

Проверим ряд наличие тенденции:

Выравнить ряд : уч. год, t число студентов, тыс. человек, y t 2000/014741,4 2005/067064,6 2006/077309,8 2007/087461,3 2008/097513,1 2009/107418,8 2010/117049,8 2011/126490,0 2012/136073,9 Итого 61122,7 трех шаговая сумма 19115, , , , , , ,7 ср. значение 6371, , , , , , ,90 выбрав. значения 5087,7 6371, , , , , , , ,85

Метод аналитического выбравнивания Аналитическим выбравниванием временного ряда называют нахождение аналитической функции y*= f(t), характеризующей основную тенденцию изменения уровней ряда с течением времени. где ε t – случайная компонента с нулевой средней и постоянной дисперсией выражает ошибку модели из-за действия случайных факторов. y(t) = f(t) + ε t,

В качестве кривой роста применяются следующие функции: - линейная y t =a 0 +a 1 t; - парабола второго и более высоких порядков y t =a 0 +a 1 t+a 2 t 2 +…+a k t k ; - гиперболическая y t =a 0 +a 1 /t; - экспонента y t =e a 0 +a 1 t ; - потенциальная y t =a 0 a 1 t ; - модифицированная экспонента y t =K+a 0 ×a 1 t ; - степенная y t =a 0 +t a 1 ; - логистическая кривая ; - кривая Гомперца.

Для определения вида тенденции (аналитической зависимости) применяются такие методы, как – качественный анализ изучаемого процесса; – построение и визуальный анализ графика зависимости уровней ряда от времени; – расчет и анализ показателей динамики временного ряда (абсолютные приросты, темпы роста и др.); – анализ автокорреляционной функции исходного и преобразованного временного ряда; – метод перебора, при котором строятся кривые роста различного вида с последующим выбором наилучшей на основании значения скорректированного коэффициента детерминации R 2.

Выбор вида тенденции Выбор вида тенденции на основе качественного анализа. Социально - экономические процессы : I) Процессы с монотонным характером развития и отсутствием пределов роста

II) Процессы, которые имеют предел роста (падения) в исследуемом периоде, так называемые процессы с «насыщением»

III) Так называемые S-образные процессы, представляющие как бы два последовательных лавинообразных процесса: один с ускорением развития, а другой – с замедлением.

Выбор вида тенденции на основе анализа показателей динамики временного ряда. Δy t = y t – y t-1 – последовательные разности первого порядка, Δ 2 y t = Δy t – Δy t-1 – последовательные разности второго порядка и т. д., можно сделать вывод о наличии тенденции, описываемой полиномиальной функцией от времени t. Если исходный временной ряд содержит тенденцию, а временной ряд последовательных разностей первого порядка не содержит тенденцию, то можно сделать вывод, что тенденция линейно зависит от времени y t =a 0 +a 1 t.

Если исходный временной ряд и временной ряд последовательных разностей первого порядка содержат тенденцию, а временной ряд последовательных разностей второго порядка не содержит тенденцию, то можно сделать вывод, что тенденция задается полиномом второго порядка от времени y t =a 0 +a 1 t+a 2 t 2 ; Исследуя отношения последовательных уровней ряда (цепные коэффициенты роста) k t = y t /y t-1, можно сделать вывод о наличии тенденции, задаваемой экспоненциальной функцией от времени t. Если исходный временной ряд содержит тенденцию, а временной ряд коэффициентов роста не содержит тенденцию, то можно сделать вывод, что тенденция экспоненциально зависит от времени. (y t =a 0 ×a 1 t ).

Под независимостью ряда остатков понимается отсутствие в нем автокорреляции. критерий Дарбина-Уотсона Т.о. если в остатках r e 1 = 1, то d = 0, r e 1 = -1, d = 4. Если автокорреляция остатков отсутствует, то r e 1 = 0 и d =2. Величина d изменяется в диапазоне 0 d 4.

Применение критерия Дарбина-Уотсона а) Выдвигается нулевая гипотеза Н 0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н 1 и Н 1 * состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. б) По таблицам критерия Дарбина-Уотсона определяются критические значения критерия dL и dU для заданного числа наблюдений n, числа факторов модели k и уровня значимости α. Этими значениям числовой промежуток [0;4] разбивается на пять отрезков (0, dL), (dL, dU), (dU, 4-dU), (4-dU,4-dL), (4-dL, 4). в) Выдвинутые гипотезы принимаются или отклоняются с вероятностью (1–α) в зависимости от того, в какой отрезок попадет значение критерия d: -(0, dL) – принимается H 1, остатки имеют положительную корреляцию; -(dL, dU) – зона неопределенности -(dU, 4–dU) – принимается H 0, автокорреляция остатков отсутствует; -(4–dU, 4–dL) – зона неопределенности; -(4–dL,4) – принимается H* 1, остатки имеют отрицательную корреляцию.

Оценка точности модели тенденции заключается в оценке близости модельных значений тенденции к фактическим уровням ряда и осуществляется с помощью вычисления таких показателей, как : - дисперсия остатков σ 2 ост ; - коэффициент детерминации R 2 - средняя ошибка аппроксимации

5.4. Моделирование периодических колебаний Выделение периодической компоненты по методу скользящей средней Моделирование сезонных колебаний с помощью фиктивных переменных Метод моделирования основан на включении в модель фиктивных переменных. Количество фиктивных переменных принимается равным числу наблюдений в пределах одного цикла колебаний без единицы.

5.4.3 Моделирование сезонных колебаний с помощью гармонического анализа

5.5. Прогнозирование уровней временного ряда на основе кривых роста Метод аналитического выбравнивания Этапы разработки прогноза с использованием кривых роста: 1) на основе качественного анализа выбор одной или нескольких кривых, форма которых соответствует характеру изменения временного ряда; 2) оценка параметров выбранных кривых; 3) оценка точности и проверка адекватности выбранных кривых прогнозируемому процессу и окончательный выбор кривой роста; 4) расчет точечного (по формуле (*)) и интервального прогнозов.

Метод отклонений от тренда. Два временных ряда х t и у t, каждый из которых содержит трендовую компоненту Т и случайную компоненту ε. Уравнения тенденций x* t = f 1 (t) и y* t = f 2 (t). Дальнейший анализ взаимосвязи рядов проводят с использованием отклонений от тренда (x t –x* t ) и (y t -y* t ),т. е. уравнение регрессии строится в виде y t -y* t =a+b(x t –x* t ).

Метод последовательных разностей. Последовательными разностями первого порядка называются величины: y t = у t – у t–1. Последовательными разностями второго порядка называются величины: 2 y t = у t – у t–1, и т. д. С использованием первых разностей y t, x t уравнение регрессии находится в виде: y t = a+bx t или у t – у t–1 = a+b·( x t – x t–1 ).

Включение в модель регрессии фактора времени. y t = a + b 1 ·x t + b 2 ·t + ε t. Параметры уравнения регрессии могут быть проинтерпретированы следующим образом: – параметр b 1 показывает, насколько в среднем изменится значение результативного признака у t при увеличении фактора x t на единицу при неизменной величине других факторов; – параметр b 2 показывает, насколько в среднем за период наблюдения изменится значение результативного признака у t за счет воздействия всех факторов, кроме фактора x t.