Метод главных компонент. Теория и практика на примере выявления политических предпочтений Филатов А.Ю. Институт систем энергетики им.Л.А.Мелентьева, Иркутский.

Презентация:



Advertisements
Похожие презентации
1. Определить последовательность проезда перекрестка
Advertisements

Изменения на политическом пространстве России Сравнительные результаты выборов в Государственную Думу в гг. Москва
Анализ результатов краевых диагностических работ по русскому языку в 11-х классах в учебном году.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.

Число зарегистрированных преступлений. Уровень преступности.
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Рейтинг территорий с преимущественно городским населением по уровню преступности в 2008 году 1ЗАТО «Звездный»33,10 2Гремячинский230,00 3г. Кунгур242,00.
Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
1 06/06 r Всего38,6 миллиона [33,4 – 46,0 миллиона] Взрослое население36,3 миллиона [31,4 – 43,4 миллиона] Женщины17,3 миллиона [14,8 – 20,6 миллиона]
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от
Москва, 2011 Российские СМИ сегодня и их аудитория.
Школьная форма Презентация для родительского собрания.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
ОТНОШЕНИЕ К РЕКЛАМЕ НАСЕЛЕНИЯ ГОРОДА ПЕРМЬ РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ октябрь 2007.
Типовые расчёты Растворы
ПРЕСС-КОНФЕРЕНЦИЯ ПО РЕЗУЛЬТАТАМ ИССЛЕДОВАНИЯ «МЕДИАФОКУС» ИНСТИТУТА «УРАЛИНСО» 16 АПРЕЛЯ 2010 ГОДА 1 16 апреля 2010 года УРОВЕНЬ ДОВЕРИЯ ЖИТЕЛЕЙ ГОРОДА.
ТУЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕДИЦИНСКИЙ ИНСТИТУТ Хромушин В.А., д.б.н., к.т.н., академик МАИ и АМТН 2010 г. ГРАФИЧЕСКОЕ ОТОБРАЖЕНИЕ РЕЗУЛЬТИРУЮЩИХ.
Курсы повышения квалификации (общие показатели в %)
Транксрипт:

Метод главных компонент. Теория и практика на примере выявления политических предпочтений Филатов А.Ю. Институт систем энергетики им.Л.А.Мелентьева, Иркутский государственный университет

Снижение размерности признакового пространства Причины: 1.Сжатие объемов хранимой информации. 2.Наглядное представление данных ( p = 1,2,3). 3.Лаконизм моделей, упрощение счета и интерпретации. 4.Увеличение точности выводов, зависящей от n / ( p+1). 5.Борьба с мультиколлинеарностью – взаимозависимостью регрессоров. Требования к новым показателям: 1.Максимальная информативность. 2.Взаимная некоррелированность. 3.Минимальное искажение геометрической структуры исходных данных. Ситуации, в которых снижение размерности осуществить легко: 1.Дублирование информации (исключение). 2.Наличие неинформативных переменных (исключение). 3.Наличие однотипных переменных (агрегирование)

1.3. Переход к новым переменным – новые переменные, «главные компоненты» 1.2. Решение характеристического уравнения 1) Нахождение собственных чисел 2) Нахождение собственного вектора для каждого корня Метод главных компонент 1.1. Подготовительный этап 1) Центрирование и нормирование переменных – переход к 2) Вычисление матрицы ковариаций – доля дисперсии, вносимая первыми главными компонентами

Геометрическая демонстрация метода главных компонент Рис.1. Умеренный разброс точек вдоль Рис.2. Вырожденный случай: отсутствие разброса вдоль

Проблема интерпретации главных компонент Матрица нагрузок главных компонент на исходные переменные: ## Наблюдения – помесячные данные – число торговых точек, где распространяется продукция, шт. – расходы на рекламу, руб. – доля новинок в ассортименте, % – средний месячный доход на душу населения, руб. – количество праздников, шт. тесно связана с,,. тесно связана с,.

Эмпирическое исследование: Опрос ВЦИОМ, осень 2007 Дополнительные вопросы: 1.Намерение голосовать за ту или иную партию на предстоящих выборах 2.Демографические характеристики (пол, возраст, образование, доход) 3.Заинтересованность политикой 4.Степень влияния на жизнь в стране 5.Регион и тип населенного пункта, где проживает респондент 6.Доверие к Президенту, другим органам власти Дано: 40 понятий Каждый из 1589 респондентов выбирает несколько (в пределах 15), вызывающих у него положительную или отрицательную реакцию Модификация данных: Каждому понятию присвоено значение –1, если оно вызывает у респондента отрицательные чувства, 1, если оно вызывает у респондента положительные чувства, 0, если оно не вызывает никаких чувств.

Исходные данные ПонятиеПоложОтриц 01. Нация0,210, Порядок0,570, Свобода0,370, Рынок0,100, Русские0,340, Запад0,020, Социализм0, Коммунизм0,070, Демократия0,150, Традиция0,290, Патриотизм0,340, Государство0,260, Конкурентоспособн.0,050, Суверенитет0,070, Элита0,020, Партия0,020, Власть0,090, Справедливость0,490, Оппозиция0,010, Бизнес0,070,13 ПонятиеПоложОтриц 21. СССР 0,120, Церковь 0,210, Революция 0,010, Собственность 0,140, Успех 0,310, Либерализм 0,010, Реформа 0,060, Стабильность 0,380, Труд 0,310, Индивидуализм 0,020, Нерусские 0,020, Равенство 0,180, Коллективизм 0,060, Мораль 0,220, Права человека 0,320, Богатство 0,120, Россия 0,280, Достаток 0,370, Прогресс 0,210, Капитализм 0,150,02 Табл.1. Доля респондентов, оценивших понятие как положительное или отрицательное

z (1) – «толерантность» Высокое значение соответствует отсутствию отрицательной реакции на слова «элита», «нерусские», «рынок», «запад», «власть» и «реформа», а также отсут- ствию положительной реакции на слова «справедливость» и «труд». z (2) – «экономическая свобода» Высокое значение соответствует положительной реакции на слова «свобода», «бизнес», «успех», «богатство», «достаток», «прогресс» и «капитализм» и от- рицательной реакции на «социализм», «коммунизм», «СССР», «революцию» и «коллективизм». Интерпретация главных компонент Рис.3. Собственные числа главных компонент

Матрица факторных нагрузок Понятие z(1)z(1) z(2)z(2) 01. Нация0,11-0, Порядок-0,180, Свобода-0,130, Рынок0,260, Русские-0,150, Запад0,210, Социализм-0,13-0, Коммунизм0,05-0, Демократия0,110, Традиция-0,06-0, Патриотизм-0,14-0, Государство-0,17-0, Конкурентоспособн.0,070, Суверенитет-0,080, Элита0,300, Партия0,04-0, Власть0,26-0, Справедливость-0,300, Оппозиция0,12-0, Бизнес0,170,27 Понятие z(1)z(1) z(2)z(2) 21. СССР-0,01-0, Церковь-0,13-0, Революция0,13-0, Собственность0,130, Успех-0,160, Либерализм0,15-0, Реформа0,23-0, Стабильность-0,160, Труд-0,26-0, Индивидуализм0,050, Нерусские0,25-0, Равенство-0,180, Коллективизм0,02-0, Мораль-0,05-0, Права человека-0,150, Богатство-0,150, Россия-0,030, Достаток0,110, Прогресс-0,030, Капитализм-0,090,22 Табл.2. Коэффициенты корреляции главных компонент и исходных переменных

Распределение предпочтений – все респонденты Рис.4. Распределение предпочтений – все респонденты

1. Партийные симпатии Предпочтения%z(1)z(1) z(2)z(2) 1. Аграрная0,63–0,16–0,92 2. ЕР45,720,050,30 3. КПРФ7,12–0,76–1,59 4. ЛДПР4,22–0,530,69 6. Патриоты России0,250,22–0,10 7. Справедливая Россия6,17–0,60–0,87 8. Свободная Россия0,69–0,430,31 9. СПС0,57–0,471, Яблоко0,76–0,560, Республиканская0,25–0,161, Демократическая0,19–0,250, Не голосовать17,880,23–0,06 Рис.5. Партийные симпатии Табл.3. Партийные симпатии

2. Доход ДоходЧел.z(1)z(1) z(2)z(2) 1. Высокий41–0,1–0,16 2. Выше среднего1260,820,28 3. Средний989–0,040,19 4. Ниже среднего3830,15–0,48 5. Низкий79–0,05–0,59 Рис.6. Доход Табл.4. Доход

3. Образование ОбразованиеЧел.z(1)z(1) z(2)z(2) 1. Начальное42–0,24–1, –0,03–0, –0,060, –0,170, ,340,40 6. Высшее2680,180,11 Рис.7. Образование Табл.5. Образование

4. Заинтересованность политикой Заинтерес. политикойЧел.z(1)z(1) z(2)z(2) 1. Высокая1120,37–0, ,02–0, –0,150,13 4. Совсем не интересна3090,020,21 5. Затрудн. ответить521,11–0,21 Рис.8. Заинтересованность политикой Табл.6. Заинтересованность политикой Если наложить данные графики на графики партийных предпочтений, обнаружим, что наиболее интересу- ются политикой сторонники КПРФ и СР (низкие значения обоих факто- ров), а наименее – сторонники пра- вых партий (высокое значение вто- рого фактора).

5. Федеральный округ Федеральный округЧел.z(1)z(1) z(2)z(2) 1. Центральный4180,320,02 2. Северо-Западный1540,06–0,08 3. Южный2530,21–0,18 4. Поволжский343–0,24–0,08 5. Уральский920,310,32 6. Сибирский210–0,570,21 7. Дальневосточный118–0,180,02 Рис.9. Федеральный округ Табл.7. Федеральный округ

6. Регионы Рис.10. Регионы 99 – Москва 04 – Алтай 58 – Пензенская обл. 61 – Ростовская обл. 54 – Новосибирская обл. 02 – Башкирия 42 – Кемеровская обл. 69 – Тверская обл. 53 – Новгородская обл. 25 – Приморский край 72 – Тюменская обл. 65 – Сахалинская обл. 30 – Астраханская обл.

7. Размер населенного пункта Размер насел. пунктаЧел.z(1)z(1) z(2)z(2) 1. Москва, СП1631,54–0, –0,44–0, ,010, –0,340, ,23–0, ,390, –0,180,10 8. Село426–0,28–0,17 Рис.11. Размер населенного пункта Табл.8. Размер населенного пункта

8. Москва Рис.12. Москва. 2 кластера: недовольные «экономически продвинутые» и довольные «непродвинутые» Рис.13. Москва. Партии 2 – ЕР, 3 – КПРФ, 4 – ЛДПР, 7 – СР, 10 – Яблоко, 14 – не голосов.

8. Москва Рис.14. Москва. Доход 2 – выше среднего, 5 – бедные Рис.15. Москва. Доверие к Путину 0 – не доверяют, 1 – доверяют

9. Доверие к Путину. Готовность к акциям протеста Доверие к ПутинуЧел.z(1)z(1) z(2)z(2) 1. Да1252–0,020,11 2. Нет2010,02–0,44 3. Затрудн. ответить1340,18–0,39 Табл.10. Готовность к акциям протеста Табл.9. Доверие к Путину Готовность к акциям протестаЧел.z(1)z(1) z(2)z(2) 1. Да347–0,23–0,36 2. Нет10740,080,15 3. Затрудн. ответить165–0,01–0,25 Модель множественного выбора Образование (01)Не влияет Доверие к власти (01)ЕР (+) Жизнь в деревне (0/1) Бедность (01)ЛДПР(+) Возраст (в годах)КПРФ (+), СР (+) ПолЛДПР (М) Степень влияния на жизнь в стране

Игра: моделирование избирателя Табл.12. Процент голосующих за партии (мужчины) ПутинВлиян.Бедн.СелоВозрастЕРКПРФЛДПРСР %1% 3% %2%16%4% %15%13%11% %10%62%5% %5%1%9% %8% 10% %38%4%20% %36%29%14% z(1)z(1) z(2)z(2) ЕРКПРФЛДПРСР 0073% / 86%7% / 4%11% / 2%9% / 8% 3,4083% / 92%4% / 2%7% / 1%6% / 4% –3,4056% / 76%13% / 8%15% / 3%14% / 13% 03,478% / 94%1% / 1%17% / 3%3% / 3% 0–3,445% / 61%31% / 20%4% / 1%19% / 18% Табл.11. Процент голосующих за партии (мужчины / женщины)

Игра: моделирование избирателя Табл.13. Процент голосующих за партии (факт / при наличии «против всех») ПутинЕРКПРФЛДПРСРПротив всех Ноябрь, % / 56%11% / 9%7% / 5%10% / 8%/ 22% 50%61% / 35%16% / 13%11% / 8%12% / 8%/ 36% 0%43% / 18%25% / 16%19% / 11%12% / 6%/ 49% Профили репрезентативных избирателей ключевых партий: ЕР (97%): женщина, z (1) =0, z (2) =0, 30 лет, город, обеспеченная, доверяет Путину, доверяет Думе, влияет на жизнь. ЛДПР (88%): мужчина, z (1) =–1,7, z (2) =1,7, 30 лет, город, бедный, не доверяет Путину, доверяет Думе, не влияет на жизнь. КПРФ (33%): мужчина, z (1) =–1,7, z (2) =–1,7, 60 лет, село, бедный, не доверяет Путину, не доверяет Думе, не влияет на жизнь. Не голосует: низкое образование, низкий доход, недоверие, молодежь, город. Идеи дальнейших исследований: 1.Позиции партий – сознательное поведение (равновесие Нэша). 2.Изменение экономического положения за последние годы (экон.голосование).

Спасибо за внимание!