Корреляционный и регрессионный анализ. Временные ряды. МНК.

Презентация:



Advertisements
Похожие презентации
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Advertisements

Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Лекция 10 Временные ряды в эконометрических исследованиях.
Элементы теории корреляции. План: I. Понятие корреляционной зависимости: 1) Коэффициент корелляции 2) Проверка гипотезы о значимости выборочного коэффициента.
Временные ряды в эконометрических исследованиях..
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
Общая теория статистики Регрессионно- корреляционный анализ.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Лекция по МОП ТЕМА: Измерение связи двух признаков.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Метод наименьших квадратов В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей функции получили.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. СТАТИСТИЧЕСКАЯ ОЦЕНКА.
С ТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО - ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ Л ЕКЦИЯ 9 Клобертанц Е.П. Красноярск, 2013 г. ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ.
Эконометрика. Литература Доугерти К. Введение в эконометрику. - 3-е изд. - М.: ИНФРА- М, XIV, 465 с. Доугерти К. Введение в эконометрику. - 3-е.
Лекция 8 Временные ряды в эконометрических исследованиях.
Основы статистики Краткий конспект.. 1. Статистика (лат.status – государство, его состояние, определяемое по результатам наблюдения) – наука, изучающая.
ДИНАМИЧЕСКИЕ ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ. Опр. Эконометрическая модель является динамической, если в данный момент времени она учитывает значения входящих.
Транксрипт:

Корреляционный и регрессионный анализ. Временные ряды. МНК

1. Метод наименьших квадратов

Как же правильно построить график зависимости Y=Y(X)? Как найти функцию Y=Y(X), которая наилучшим образом соответствовала экспериментальным точкам?

Метод поиска оптимального вида сглаживающей функции был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК).

Для отыскания минимума функции S приравняем нулю соответствующие частные производные:

Построенная линия тренда позволяет с некоторой вероятностью не только предсказать в интервале от х=1,5 до х=12,5 любые значения функции у при отсутствующих в таблице значениях фактора х, но и за пределами данного интервала.

МНК и поиск по картинкам, лицам и картам Поиск по лицам, заснятым на камеру наблюдения

Статистический анализ временных рядов. Временно́й ряд (или ряд динамики) это собранные в разные моменты времени значения случайной величины, характеризующие исследуемый процесс. Временные ряды состоят из двух элементов: периода времени, за который или по состоянию на который приводятся числовые значения; числовых значений той или иной случайной величины.

Временные ряды по своему представлению бывают дискретные и непрерывные.

Пример дискретного временного ряда: результаты измерений в ходе лечения утренней температуры тела пациента.

Непрерывный ряд представляет результаты непрерывных наблюдений за случайной величиной (результаты снятия ЭКГ).

Временные ряды бывают детерминированными и случайными: первые получают, если существует строгое соответствие (однозначная зависимость) между значениями времени регистрации и соответствующими значениями временного ряда (например, ряд последовательных данных о количестве дней в месяцах); вторые есть результат реализации некоторой случайной величины.детерминированными случайными случайной величины Различают стационарные и нестационарные временные ряды. Стационарным временным рядом называют ряд, функция распределения значений которого не зависит от времени. Нестационарным рядом называют ряд, функция распределения которого меняется со временем.

Пример графического изображения нестационарного временного ряда. Детерминированная компонента изображена синей линией.

Детерминированная компонента f(t) (тренд) – характеризует основную тенденцию изменения временного ряда с течением времени, на которую накладываются случайные отклонения, определяемые компонентой Ɛ(t) ( "шумы", случайные погрешности). То есть исходный временной ряд X(t) представляется в виде суммы: X(t) = f(t) + Ɛ(t)

На практике наибольший интерес представляет выявления основной тенденции изменения временного ряда. Одним из методов нахождения уравнения тренда является метод наименьших квадратов. Статистические модели на основе изучения нестационарных временных рядов служат для описания вероятные значения временного ряда в ближайшем будущем при известных последних значениях (прогноз). Прогноз будущих значений временного ряда используется для эффективного принятия решений.

. Движение цен на валютном рынке происходит в соответствии с определёнными тенденциями - трендами. Рост курса происходит, когда спрос на определенную валюту превышает предложение на рынке, и наоборот. При долгосрочном росте или падении курса валют, участники рынка говорят о том, что сложился "восходящий" (рост курса), либо "нисходящий" (падение курса) тренд по данной валюте. Также, выделяют иногда третий тип тренда - "боковой", хотя, по сути, это, как раз, отсутствие тренда - ярко выраженного роста или падения курса валюты в течение определённого периода времени. Неформально, восходящий тренд участники рынка называют "бычьим", а нисходящий "медвежьим". Боковой тренд называют просто - "флит" (от англ. flat - плоский). На основании анализа трендов ( или вопреки ему) принимается решение о покупке валюты.

Восходящий и нисходящие тренды.

Боковой тренд.

3. Корреляционный и регрессионный анализы.

3.1. Статистическая зависимость ее отличие от функциональной зависимости. Функциональная зависимость: XY Статистическая зависимость: X Y 1, Y 2, …,Y n

В медико-биологических исследованиях в большинстве случаев между переменными величинами существуют зависимости такого вида, когда каждому значению одной переменной (Х) соответствует не какое- то одно определенное, а множество значений другой переменной(Y), причем нельзя сказать заранее, какое именно значение примет зависимая величина Y. Такая зависимость получила название статистической (или стохастической, вероятностной).

3.2. Корреляционная зависимость: Линии регрессии.

Термин «регрессия» ввёл в математическую статистику Френсис Гальтон. Гальтон был двоюродным братом Чарльза Дарвина по их деду Эразмусу (Эразму) Дарвину. Чарльза Дарвина Сэр Фрэнсис Гальтон (англ. Francis Galton; 16 февраля января 1911) английский исследователь, географ, антрополог и психолог; основатель дифференциальной психологии и психометрики.англ.16 февраля января 1911 географантрополог психолог

Если f(х) – линейная функция, то корреляционную зависимость можно описать с помощью уравнения вида М(Y/х) =Bх+A, где А и В – некоторые параметры, а М(Y/х) – условное математическое ожидание наблюдавшихся значений Y, соответствующих Х=х.

Поскольку наиболее простой формой зависимости в математике является прямая, то в корреляционном и регрессионном анализе наиболее популярны линейные модели. Если функция f(х) линейная, то выборочное уравнение линейной регрессии Y на Х имеет вид: y x = xy x + a (по аналогии с уравнением (2)), где xy – выборочный коэффициент линейной регрессии Y на X,. y x – условное среднее значение y для соответствующих Х=х.

Диаграмма связи между численностью рабочих на фармацевтическом предприятии и доходом предприятия. y x = xy x + a

Смысл коэффициента регрессии xy : В общем случае коэффициент регрессии показывает, как в среднем изменится значение Y, если X увеличится на единицу. Численно он равен тангенсу угла между прямой линией регрессии Y на X и положительным направлением оси ОХ. По величине коэффициента регрессии судят о силе корреляционной связи между изучаемыми величинами: чем больше величина xy, тем сильнее изменится среднее значение Y при изменении Х, тем сильнее корреляционная связь. Знак указывает направление связи.

Y=3000x+2450

Пример. На каком из двух графиков связь между признаками выражена сильнее?

Оказывается форма связи (линия регрессии) сама по себе не дает ответа на вопрос о тесноте связи пары переменных. На этот вопрос отвечает коэффициент парной корреляции. Он показывает, насколько тесно две переменные связаны между собой.

Коэффициент парной корреляции r принимает значения в диапазоне от –1 до +1. Положительные значения коэффициента корреляции r свидетельствуют о прямой связи между признаками, отрицательные – об обратной связи.

Если r = 0, то рассматриваемые переменные линейно независимы, т.е. на диаграмме рассеяния облако точек "вытянуто по горизонтали".

Формула для вычисления парного коэффициента корреляции:

Сравнение коэффициентов корреляции и регрессии Коэффициент корреляции Принимает значения в диапазоне от -1 до +1 Безразмерная величина Показывает тесноту связи (связь как синхронность, согласованность) между признаками Знак коэффициента говорит о направлении связи Коэффициент регрессии Может принимать любые значения Привязан к единицам измерения обоих признаков Показывает структуру связи между признаками: характеризует связь как зависимость, влияние, устанавливает причинно-следственные связи. Знак коэффициента говорит о направлении связи

Чем выше по модулю (по абсолютной величине) значение коэффициента корреляции, тем теснее связь между признаками: Принято считать, что коэффициенты корреляции, которые по модулю больше 0,7, говорят о сильной связи. Коэффициенты корреляции, которые по модулю меньше 0,7, но больше 0,5, говорят о связи средней силы. Наконец, коэффициенты корреляции, которые по модулю меньше 0,5, говорят о слабой связи.

Усложнение модели Совокупное влияние всех независимых факторов на зависимую переменную не может быть представлено как простая сумма нескольких парных регрессий. Это совокупное влияние находится более сложным методом - методом множественной регрессии. Визуализация модели множественной регрессии

Этапы проведения корреляционного и регрессионного анализа: Выявление наличия взаимосвязи между признаками; Определение формы связи; Определение силы, тесноты и направления связи.