Выполнили: Горшкова Виринея Солодская Ольга Пискунова Марина Хайретдинов Эльдар Группы: 626, 627 НИУ ВШЭ, Москва, 2013 www.hse.ru Факультет менеджмента.

Презентация:



Advertisements
Похожие презентации
Logit & probit модели Чеботарь Полина Мартьянова Елизавета.
Advertisements

Logit и probit модели Петровская А. Славская Т. Шинов В. Высшая школа экономики, Москва,
ЛОГІТ ТА ПРОБІТ-МОДЕЛІ РЕГРЕСІЇ В ПРОГНОЗУВАННІ СЕП 1.Моделі дискретного вибору. 2.Логіт та пробіт-моделі регресії. 3.Особливості вирішення логіт та пробіт-моделей.
Количественные методы в менеджменте. Лекция 3, Модели дискретного выбора.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Лекция 9.1 Модели бинарного выбора. 2 Экономистов часто интересуют факторы, определяющие принятие решений индивидами или фирмами. Ниже приведены соответствующие.
1 МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ ПЛАТА ASVABC S 1 ПЛАТА = S + 3 ASVABC + u Геометрическая интерпретация множественной регрессионной модели с.
Оценка и прогнозирование спроса Доц. Касимовская Елена Николаевна 1.
ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Тема 1.8 Управление рисками в финансовом менеджменте Вопросы для рассмотрения: 1. Учет фактора риска в управлении финансами 2. Классификация рисков 3.
Занятие 2. Распределения и доверительные интервалы Теоретическая часть 1. Распределение случайной величины и функция плотности распределения 2. Нормальное.
АНАЛИЗ АУДИТОРИИ ИЗДАНИЯ «90 МИНУТ» Период исследования Май – Октябрь 2007 TNS Gallup Media Ноябрь 2007.
К.м.н., доцент Приходько Е.А. Красноярск, 2013 Кафедра Общественного здоровья и здравоохранения с курсом Социальной работы Кафедра экономики и менеджмента.
Лекция 4 множественная регрессия и корреляция. ( продолжение )
D:\IDLWorkspace\Default\LOGO\IKI2.tif
Презентация к уроку (алгебра, 9 класс) по теме: Область определения функции, заданной формулой
Транксрипт:

Выполнили: Горшкова Виринея Солодская Ольга Пискунова Марина Хайретдинов Эльдар Группы: 626, 627 НИУ ВШЭ, Москва, Факультет менеджмента Направление Управление проектами Модели бинарного выбора

НИУ ВШЭ, Москва, 2013 Модели бинарного выбора photo Модель зависимости бинарной переменной от совокупности факторов Зависимая переменная принимает всего два значения 0 и 1 (коды: 0 –нет; 1- да). Метод оценивания: ММП (метод максимального правдоподобия) Probit используется интегральная функция стандартного нормального распределения Logit используется CDF логистического распределения Gambit используется распределение экстремальных значений - распределение Гомперца 2 Модели бинарного выбора

НИУ ВШЭ, Москва, 2013 Алгоритм построения модели photo 3 1. Определение зависимой переменной и факторов 2. Построение переменной Z, как линейной комбинации независимых переменных 3. Построение уравнения для искомой вероятности события 4. Проведение вычислений с помощью 5. метода максимального правдоподобия 6. Интерпретация результатов и исследование качества оценки Алгоритм построения модели

НИУ ВШЭ, Москва, 2013 Алгоритм построения модели photo 4 1. Медицина (определение вероятности успешного лечения и т.п.) 2. Социология 3. Маркетинговые исследования (предсказание склонности к покупке) 4. Задачи классификации (скоринг в банках, маркетинг и пр.) Сферы применения Примеры: голосование; решение работать/не работать; решение покупать/не покупать товар длительного пользования (автомобиль, дом); форма собственности (государственная, смешанная, частная); выбор профессии (научный работник, преподаватель, консультант, менеджер); способ попадания из дома на работу (пешком, автобус, метро, метро и автобус, автомобиль)

НИУ ВШЭ, Москва, 2013 photo Показатели качества моделей 5 Псевдо- коэффициент детерминации Информационные критерии Статистика отношения правдоподобия Коэффициент детерминации Мак Фаддена Доля правильных прогнозов Показатели качества моделей

НИУ ВШЭ, Москва, 2013 photo Показатели качества моделей 6 Показатели качества моделей: Информационные критерии Акаике (AIC)Шварца (SC)Хэннана-Куинна (HQ)Акаике (AIC)Шварца (SC)Хэннана-Куинна (HQ)

НИУ ВШЭ, Москва, 2013 photo Преимущества и недостатки моделей: 7 Преимущества Недостатки 1. Исправление недостатка линейной модели, в которой вероятность могла получаться больше 1 (что логически неверно): вероятность от 0 до 1 2. Легко интерпретируется (можем идентифицировать увеличение/ снижения вероятности наступления того или иного события при процентом изменении значения фактора – отношение шансов). 3. При решении задач классификации объекты можно разделять на несколько групп: Например, в скоринге не только -(0 - плохой, 1 - хороший), но и несколько групп (1, 2, 3, 4 группы риска). 1. Систематическое завышение оценки коэффициентов регрессии при размере выборки – менее Проблемы мультиколлинеарности 3. Минимум 10 исходов на каждую независимую переменную (к 1 недостатку) Например, интересующий исход – смерть пациента. Если 50 пациентов из 100 умирают – максимальное число независимых переменных в модели = 50/10=5 Преимущества и недостатки моделей

Пример 1: соц. исследование Исследование факторов, влияющих на вероятность окончания средней школы Зависимая переменная: GRAD окончание средней школы Индивид окончил школу «1», нет – «0». Предикторы: ASVABC - результат тестирования познавательных способностей SM - число лет обучения матери респондента SF - число лет обучения отца респондента MALE - пол Nemes S, Jonasson JM, Genell A, Steineck G Bias in odds ratios by logistic regression modelling and sample size. BMC Medical Research Methodology

(Подставляется полученное выражение для Z) 3) 4)4) Таблица оцененных коэффициентов. Далее для оценки кумулятивного и предельного эффектов необходимо произвести дальнейшие расчеты, подставив полученные коэффициенты в формулы. Пример 1: верификация модели

Пример нахождения выражения предельного эффекта для одной из переменных Столбец предельных эффектов Пример 1: верификация модели

Интерпретация коэффициентов: отношения шансов Увеличение ASVABC на один балл увеличивает вероятность успешного окончания школы на 0,4 процентных пункта. Аналогично, влияет принадлежность к мужскому полу. Образование родителей влияет незначительно Кроме того, на 10% уровне значимости значим только коэффициент при переменной ASVABC Пример 1: отношение шансов

Пример 2: финансовый менеджмент 12 Зависимая переменная: вероятность участия российских компаний в межфирменных отношениях Предикторы: 1. факторы окружающей среды Уровень конкуренции в отрасли; Принадлежность к отрасли; Макро – показатели; Уровень развития законодательства в отрасли; Наличие поддержки со стороны предприятия. 2. характеристики компании Срок присутствия на рынке Количество собственников в совете директоров Численность сотрудников Наличие патентов

Пример критериев качества модели Для метода максимального правдоподобия нет коэффициента, аналогичного R-square, поэтому используются следующие способы: -Число правильно предсказанных исходов, если в наблюдении i, считать предсказанием 1 при p(i)>0,5, 0 – в противном случае -Площадь под рок-кривой p=1p=0Total Pr. Prob= Pr. Prob= Total Площадь под рок-кривой 0.73; качество модели высокое

Пример 3: A model for Happiness 14 Измерение уровня удовлетворенности населения жизнью Зависимая переменная: уровень удовлетворенности (индекс счастья) Предикторы: х 1 – обучение в колледже; х 2 – семейный статус; х 3 – удовлетворенность собственным материальным положением; х 4 – удовлетворенность работой; х 5 –уровень здоровья х 6 –часы работы х 7– принадлежность к социальному классу е i – отклонение уровень счастья= a*х 1+b*х 2+c*х 3+d*x4+e*x5+f*x6+g*x7+e i Carlos Gámez «A model for happiness» (2009)

15

НИУ ВШЭ, Москва, 2013 photo Области применения моделей: маркетинг 16 Изучение поведения покупателей Зависимая переменная: покупка Покупка - "1", клиент ушел без покупки - "0". Предикторы: T – время проведенное в магазине; Y – возраст клиента; K – внешняя респектабельность клиента по 5-бальной шкале; е i – ошибка Покупка i = a*T i +b*Y i +c*K i +e i Пример 4 (маркетинг)

НИУ ВШЭ, Москва, 2013 photo Пример 1 AICSCHQ Logit Probit Gompit Переменная КоэффициентСт. ошибкаz-StatisticProb. время проведенное в магазине Возраст клиента Внешняя привлекательность C McFadden R-squared0.11 Mean dependent var0.4 S.D. dependent var0.49 S.E. of regression0.45 Akaike info criterion1.23 Sum squared resid40.91 Schwarz criterion1.29 Log likelihood Hannan-Quinn criter.1.25 Deviance Restr. deviance Restr. log likelihood Пример 4 (маркетинг) Оценка модели: критерии

НИУ ВШЭ, Москва, 2013 photo Stefan Boes, Rainer Winkelmann (2004) «Income and Happiness» Carlos Gámez (2009) «A model for happiness» 2. Nemes S, Jonasson JM, Genell A, Steineck G Bias in odds ratios by logistic regression modelling and sample size. BMC Medical Research Methodology 3. Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR (1996). "A simulation study of the number of events per variable in logistic regression analysis". J Clin Epidemiol 49 (12): 1373–9. 4. Agresti A (2007). "Building and applying logistic regression models". An Introduction to Categorical Data Analysis. Hoboken, New Jersey: Wiley. p Hryckiewicz, Aneta and Kowalewski, Oskar, Predicting Foreign Bank Exits? A Logit and Probit Regression Approach (January 15, 2010) Список используемой литературы

НИУ ВШЭ, Москва, 2013 photo 19 Спасибо за внимание!