Б ИЗНЕС - ПРОГНОЗИРОВАНИЕ курс для магистрантов UIB Алматы, 2015.

Презентация:



Advertisements
Похожие презентации
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Advertisements

Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Понятие эконометрики и эконометрических моделейO Эконометрика это наука, которая на базе статистических данных дает количественную характеристику взаимозависимым.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
АНАЛИЗ ТРЕНДОВ И ВРЕМЕННЫХ РЯДОВ. Введение Временные ряды отличаются от обычных данных об одном временном срезе в том отношении, что в случае временных.
Лекция 10 Временные ряды в эконометрических исследованиях.
Общая теория статистики Регрессионно- корреляционный анализ.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Временные ряды в эконометрических исследованиях..
Лекция 8 Регрессионный анализ временных рядов. Временные ряды Проблема для составления выборки – автокорреляция данных Нарушено условие о независимости.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
1 Эконометрика Жукова Людмила Вячеславовна Каф. Математическая экономика(315 каб.)
Понятие эконометрики и эконометрических моделей. План: 1. Предмет и задачи эконометрики. 2. История и становление эконометрики ( СР ). 3. Основные виды.
ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ В ГЕОЭКОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Транксрипт:

Б ИЗНЕС - ПРОГНОЗИРОВАНИЕ курс для магистрантов UIB Алматы, 2015

Если прошлое мы знаем и не можем его изменить, то будущее нельзя знать, но можно изменить, если его исследовать, изучать тенденции развития и находить возможные решения проблем. Настоящее – это демаркационная линия между прошлым и будущем. Огюст Конт ( ) Знать, чтобы предвидеть, предвидеть, чтобы управлять. В.А. Базаров – Руднев ( )

Курс рассчитан на слушателей, не обладающих специализированными знаниями в области математики. Он подойдет как тем, кто только начинает познавать тонкости математической статистики, так и тем, кто уже обладает некоторым опытом обработки и анализа данных. В рамках курса рассматриваются методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Материал применим для решения задач связанных с прогнозированием, эконометрическим моделированием, выявлением причинно-следственных связей, проведением статистических тестов. Данные методы активно используются в финансовом моделировании, обработке социологических данных, маркетинговых исследованиях, научных работах различных отраслей. На кого рассчитан курс «Статистика совсем не похожа на математику. Она в большей степени связана с научным методом, т.е. формулировкой вопросов для исследования, разработкой исследований и экспериментов, сбором данных, организацией, обработкой и анализом данных, интерпретацией результатов и подведением итогов. Короче говоря, с помощью данных вы формулируете доказательство ответов на интересующие вас вопросы о мире. Математика нужна при этом только для вычисления основных статистических показателей и проведения некоторых видов анализа, но это всего лишь крошечная часть того, чем занимается статистика». Рамси, Дебора. «Статистика для "чайников"»

Все организации функционируют в условиях неопределенности Менеджеры должны принимать решения, оказывающие влияние на будущее организации Необходимость Обоснованные предположения о будущем более ценны, чем необоснованные Прогнозирование - инструмент для обоснования интуитивных решений менеджера Ханк Д.Э., Уичерн Д.У., Райте А.Дж. «Бизнес-прогнозирование» В Казахстане растет интерес к экономическому моделированию, благодаря конкуренции между компаниями на рынке за знаниями, благодаря тому, что учась на Западе, казахстанцы перенимают их стандарты аналитической работы. Кроме того, организаторы госзакупок требуют от участников владения специализированными программами. Ценность

Ценность бизнес-прогнозирования можно продемонстрировать на возможности предсказания курса доллара. В связи с тем, что недавно курс доллара к тенге был отправлен в свободное плавание, приобретает особенную актуальность овладение методами его прогнозирования. Свободное плавание подразумевает меньшее влияние на величину курса, директивных мер Национального банка и большее влияние на него разнообразных рыночных и случайных факторов. Реально ли предсказать курс валюты, когда он постоянно меняется, то увеличиваясь, то затем снижаясь? Стоит ли за этими колебаниями какая-то закономерность? Можно ли сказать, сколько будет стоить доллар завтра? Если отвлечься от ежедневных колебаний и посмотреть в целом на динамику курса, то в глаза бросается восходящий тренд, с наличием редких, но резких изменений. Эти резкие изменения, обусловленные не рыночными факторами предсказать практически невозможно. Понятно, что в Казахстане ожидалась девальвация, но назвать точный день и величину нового курса никто не мог. Но курс доллара не девальвируется каждый день, каждую неделю, месяц и даже год. В остальное время он достаточно стабилен и подчинен влиянию рыночных закономерностей и случайных факторов.

Забегая вперед, можно сказать, что предсказание возможно. Более того, курс доллара можно предсказать с определенной вероятностью и он подчинен определенной закономерности. Цены вообще подчинены определенным закономерностям. Вот, что об этом пишут авторы учебника по бизнес-прогнозированию: «В данных временных рядов условие независимости выполняется редко. Рассмотрим ежегодное значение базовой цены некоторой модели нового автомобиля. Можете ли вы вообразить себе неразбериху, которая будет твориться, если цена некоторой модели автомобиля в один год будет действительно совершенно независимой от ее цены в другой год? В таком мире цены будут определяться подобно значениям, взятым из таблицы случайных чисел. Информация о цене товара в один год ничего не даст вам для прогноза цены этого же товара в следующем году. В реальном мире цена в текущем году связана (коррелирует) с ценой в предыдущем году, а возможно и с ценой, имевшей место два года назад и т.д. Таким образом, цены на один и тот же товар в разные года авто коррелируют, они не являются независимыми». Довольно очевидно, что логика в этой мысли есть. Овладение методами прогнозирования временных рядов даст профессионалу возможность заработать на купле/продажи валюты. Ханк Д.Э., Уичерн Д.У., Райте А.Дж. «Бизнес-прогнозирование»

Для прогнозирования цен упорядоченных по времени, британскими ученными Джорджем Боксом и Гвилимом Дженкинсом был разработан метод ARIMA, освоив который можно весьма с высокой точностью прогнозировать изменение временных рядов. В данном курсе мы разберем этот метод, который реализован в большинстве программ по статистической обработке данных. Гвилим Дженкинс Джордж Бокс

В настоящее время, по оценкам ученых, насчитывается свыше 150 различных методов прогнозирования. Однако на практике ис­пользуется в качестве основных Методы и модели прогнозирования

Типы прогнозов Типы прогнозов зависят от типа шкал переменных, на которых строится прогноз: метрические, порядковые, номинальные. Метрические данные позволяют применять самые точные и самые сложные виды расчетов.

Инструменты прогнозирования Горизонт прогноза Три вида прогнозов Краткосрочный ARIMA – (Autoregressive integrated moving average); АРПСС – (Авторегрессия и проинтегрированное скользящее среднее) ARIMA – (Autoregressive integrated moving average); АРПСС – (Авторегрессия и проинтегрированное скользящее среднее) Экспоненциальное сглаживание Экспоненциальное сглаживание Множественная регрессия Множественная регрессия

Этапы прогнозирования Сбор данных Предварительная обработка данных Описательный и визуальный анализ Построение прогностических моделей Оценка точности и анализ адекватности моделей Формирован ие прогноза

Типы данных Данные для прогнозирования Кросс-секционные наблюдения, собранные в фиксированный момент времени Временной ряд Данные, зафиксированные через последовательные промежутки времени

Программа курса

Типы шкал: метрические, порядковые, номинальные. Меры вариации: дисперсия, стандартное отклонение. Асимметрия, эксцесс. Нормальное распределение. Распределение Стьюдента. Распределение Фишера. Статистические критерии значимости, основанные на этих распределениях. Правило 2-3 сигм. Построение гистограмм нормального распределения. Тест Колмогорова-Смирнова на проверку нормального распределения. Гетероскедастичность, гомоскедастичность. Отклонения, выбросы. Методы определения и устранения. Средние: среднеарифметическая, медиана, мода. Доверительный интервал. Z-оценка, стандартизация данных. Диаграммы рассеяния. Корреляция переменных. Шкала Чеддока. Аппроксимация, экстраполирование, сглаживание рядов линейными и нелинейными функциями, прогнозирование. Критерий качества сглаживания: R2. Преобразование, трансформирование, выпрямление ряда: логарифмирование, возведение в степень, извлечение корня. Продолжительность: 6 часов Тема 1. Основы статистической обработки данных

Используется для прогнозирования значений зависимой переменной на основе значений нескольких независимых переменных. Данный анализ в том числе определяет степень влияния факторных переменных на зависимую переменную. Результатом анализа является регрессионное уравнение, в которое отбираются только переменные, которые хорошо объясняют поведение зависимой переменной. Но проведение регрессии должно соответствовать нескольким предпосылкам: случайности остатков, отсутствию мультиколлинеарности, автокорреляции и т.д. Аналитику важно уметь проводить статистические тесты на определение адекватности регрессионной модели. Парная регрессия. Метод наименьших квадратов. Подготовка данных и их импорт в программу. Построение регрессионной прямой. Проведение многомерного регрессионного анализа – установка параметров. Методы отбора переменных: принудительное включение, исключение, пошаговый отбор. Фиктивные переменные (dummy). Интерпретация результатов, статистик. Коэффициент корреляции Пирсона R, R2, смещенный R2. F-критерий Фишера, t-критерий Стьюдента. Нестандартизованные уравнения регрессии и стандартизованные коэффициенты бета β. Стандартная ошибка коэффициентов, доверительный интервал. Тест Чоу на наличие структурной стабильности. Тестирование остатков на наличие автокорреляции Продолжительность: 6 часов Тема 2. Регрессионный анализ

Временные ряды. Параметры АРПСС, идентификация модели. Модели AR, MA, ARMA, ARIMA. Автокорреляция. Коррелограмма. Автокорреляционная функция и частная автокореляцмонная функция (АКФ, ЧАКФ). Проверка адекватности модели. Нахождение корней характеристического уравнения. Тестирование на импульсный ответ ARMA структуры уравнения. Тестирование остатков на стационарность временного ряда. Тест Дикки Фуллера. Тестирование остатков на наличие автокорреляции, LM-тест Бройша-Годфри. Тестирование остатков на нормальное распределение Жарка-Бера. Продолжительность: 8 часов Тема 3. ARIMA (АРПСС)

Факторный анализ это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям сводит к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой. Таким образом, целью факторного анализа является нахождение таких комплексных факторов, которые как можно более полно объясняют наблюдаемые связи между переменными, имеющимися в наличии. Вычисление корреляционной матрицы. Извлечение факторов. Собственные значения факторов. Методы вращения факторов. Ортогональные и не ортогональные методы. Факторные нагрузки. Интерпретация факторов. Продолжительность: 4 часа Тема 4. Факторный анализ

Часто применяется в банковском скоринге. Вычисляет вероятность банкротства для каждого объекта. Дискриминантный анализ позволяет предсказать принадлежность объектов к двум или более группам. Исходными данными для дискриминантного анализа является множество объектов, разделенных на группы так, что каждый объект может быть отнесен только к одной группе. Допускается при этом, что некоторые объекты не относятся ни к какой группе (являются «неизвестными»). Для каждого из объектов имеются данные по ряду количественных переменных. Такие переменные называются дискриминантными переменными, или предикторами. Ядром дискриминантного анализа является построение так называемой дискриминантной функции: d = b 1 х 1 +b 2 х b n х n +а, где x 1 и х n - значения переменных, соответствующих рассматриваемым случаям, константы b 1 -b n и a коэффициенты, которые и предстоит оценить с помощью дискриминантного анализа. Целью является определение таких коэффициентов, чтобы по значениям дискриминантной функции можно было с максимальной четкостью провести разделение по группам. Продолжительность: 5 часов Тема 5. Дискриминантный анализ

Вычисляет уравнение зависимости на одну зависимую дихотомическую переменную. Применяется в банковском и кредитном скоринге. Например, может применятся для вычисления вероятности банкротства для каждого объекта. Логистическая регрессия представляет собой расширение множественной регрессии и отличается от последней тем, что в качестве зависимой переменной используется не количественная, а дихотомическая переменная, имеющая лишь два возможных значения. Как правило, эти два значения символизируют принадлежность или не принадлежность объекта какой- либо группе, ответ типа «да» или «нет» и т. п. Главным отличием логистической регрессии от множественной является толкование уравнения регрессии. Если множественная регрессия позволяет прогнозировать количественное значение зависимой переменной (критерия) на основе известных значений независимых переменных (предикторов), то логистическая регрессия прогнозирует вероятность некоторого события, находящуюся в пределах от 0 до 1. Продолжительность: 5 часов Тема 6. Логистическая регрессия

В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений. Под наблюдениями здесь понимаются отдельные личности (респонденты) или любые другие объекты. Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными. Иерархический кластерный анализ. Объединяет небольшое количество наблюдений в однородные группы, деревья классификации. Кластерный анализ методом К-средних. Объединяет большое количество наблюдений в однородные группы. Сегментация клиентов. Продолжительность: 4 часа Тема 7. Кластерный анализ

Вычисляет статистическую значимость различия среднеарифметических двух и более категорий переменной. Сравнение средних значений относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии. Например, можно применять для анализа эффективности рекламы, маркетинговых акций: статистически ли значимо выросли продажи в период рекламы по сравнению с периодом, когда реклама не проводилась. Или статистически ли значимы отличаются показатели работы филиалов. Продолжительность: 4 часа Тема 8. Парное сравнение средних: t-критерий. Дисперсионный анализ (ANOVA)

Анализ соответствий является многомерным методом, позволяющим исследовать данные таблиц сопряженности путем графического представления строк и столбцов таблицы в качестве точек в пространстве низкой размерности. Применяется для визуализации и численного представления таблиц сопряжённости больших размерностей, построения карт восприятия брендов. Карты позиционирования брендов часто используют для иллюстрации представления клиентов о продуктах и их атрибутах вместе на одной карте. Это позволяет точно интерпретировать восприятие клиентами компании множества продуктов и атрибутов сервиса одновременно. Продолжительность: 3 часа Тема 9. Анализ соответствий (correspondence analysis)

Высшее образование, специальность Маркетинг и коммерция, год окончания Специализация в маркетинговой О преподавателе собственное агентство ТОО «ФК-консалтинг». Общий стаж работы в маркетинге более 15 лет в 15 компаниях. Репетитор по эконометрике и статистической обработке данных, эконометрическому моделированию. Обучаю студентов, частных и корпоративных клиентов статобработке данных, моделированию, эконометрике на базе программ: 1) SPSS; 2) Eviews; 3) Statistica; 4) GRETL. аналитике. Работал руководителем проектов в двух исследовательских агентствах, в 2013 создал

Мурат Жаксылыков Директор ТОО «ФК-консалтинг» Спасибо за внимание!