26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г. Тема 2. Представление данных 2.1. Частоты 2.2. Относительные частоты 2.3.

Презентация:



Advertisements
Похожие презентации
4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г. Лекция 2. Представление данных 2-1. Частоты 2-2. Относительные частоты 2-3. Таблицы 2-4.
Advertisements

23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г. Лекция 9. Непрерывные распределения 9-1. Функция распределения 9-2. Плотность.
Математические основы описания результатов исследования.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Итоги ЕГЭ-2013 в Санкт-Петербурге ХИМИЯ. ГОД Зарегистриров ано на экзамен, чел. Явилось на экзамен Получил и 100 баллов, чел. Число экзаменуемых, не сдавших.
1. Определить последовательность проезда перекрестка
Авторы: Равичев Л.В., Ломакина И.А. Кафедра менеджмента и маркетинга РХТУ им. Д.И.Менделеева. Москва СТАТИСТИКА. Описательная статистика. Лекция.

Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
Работа учащегося 7Б класса Толгского Андрея. Каждое натуральное число, больше единицы, делится, по крайней мере, на два числа: на 1 и на само себя. Если.
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Фрагмент карты градостроительного зонирования территории города Новосибирска Масштаб 1 : 4500 к решению Совета депутатов города Новосибирска от
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от
РАСПРЕДЕЛЕНИЕ УЧАСТНИКОВ ККР-2011 ПО ТИПАМ ОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ Тип ОУДоля учащихся в общем количестве участников ККР-2011 СОШ115/72% ООШ35/22% НОШ9/6.
Набор игр Создание игровых ситуаций на уроках математики повышает интерес к математике, вносит разнообразие и эмоциональную окраску в учебную работу, снимает.
Условия осуществления образовательного процесса В школе обучалось 728 учащихся в 26 классах- комплектах. Средняя наполняемость классов составила 28 учеников.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Урок-обобщение (7 класс – алгебра) МОУ "СОШ 45 г. Чебоксары" Кабуркина М. Н.1.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Транксрипт:

26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г. Тема 2. Представление данных 2.1. Частоты 2.2. Относительные частоты 2.3. Таблицы 2.4. Графические представления

2 Иванов О.В., Соколихин А.А Частоты и распределения частот Частота – количество наблюдений, в которых признак принимает определенное значение или находится в определенном интервале. Распределение частот показывает частоты во взаимосвязи с результатами наблюдений.

3 Иванов О.В., Соколихин А.А Пример. Политические предпочтения Имеются исходные данные по респондентам: РеспондентПредпочтение 1 демократы 2демократы 3либералы 4демократы 5коммунисты 6либералы 7коммунисты… 105демократы всего 105 респондентов Требуется провести подсчет количества респондентов, отдающих политические предпочтения каждой из партий.

4 Иванов О.В., Соколихин А.А Ручная запись при подсчете данных Существует несколько часто используемых методов ручного подсчета данных: Запись единицами4 Запись пятерками13 Запись пятерками18 Запись десятками27

5 Иванов О.В., Соколихин А.А Категориальное и интервальное распределение Если признак измеряется номинальной или порядковой шкалой, получим категориальное распределение частот (дискретный признак). Если признак измеряется числовой шкалой, получим интервальное распределение частот (непрерывный признак). Интервальное распределение строится также и для дискретного признака, если его значения являются редкими.

6 Иванов О.В., Соколихин А.А Категориальные частоты КАТЕГОРИИf Демократы45 Коммунисты43 Либералы15 Всего105 КАТЕГОРИИ f Очень понравился 24 Понравился 12 Фильм средний 10 Не понравился 6 Очень плохой 8 Всего 60 Номинальная шкала Политические предпочтения Порядковая шкала Отношение к фильму

7 Иванов О.В., Соколихин А.А Объединение категорий в классы... Например: места, которые занимала команда XYZ в чемпионатах России с 1992 года 1,5,9,2,14,9,12,7,2,4,13,14... имеет смысл для повышения наглядности, если: 1.количество различных категорий слишком велико 2.частоты в соседних категориях сильно колеблются

8 Иванов О.В., Соколихин А.А Объединение категорий в классы Внимание: опасность манипуляции. Другое образование классов может создать совершенно иное впечатление!!! Вводим три класса: 1.призовые места (1-3) 2.середина таблицы (4-13) 3.аутсайдерские места (14-16) Другие три класса: 1.начало таблицы (1-4) 2.середина таблицы (5-11) 3.конец таблицы места (12-16)

9 Иванов О.В., Соколихин А.А Объединение категорий в классы Порядковая шкала: объединяются «соседние» категории ПРИМЕР: факультеты можно разделить на «гуманитарные», «естественные», «технические» Номинальная шкала: «соседних» категорий не существует, иногда возможна разбивка всех категорий на классы по некоторому сходству категорий. Объединение категорий в классы может быть продиктовано постановкой задачи, даже если общее количество категорий невелико. ПРИМЕР: категории «холост», «разведен», «вдовец» можно объединить в один класс «не женат», если нас интересует в первую очередь, женат ли мужчина или нет.

10 Иванов О.В., Соколихин А.А Интервальные частоты (n = 77) Интервальное распределение частот состоит из некоторого количества интервалов равной длины, на которые делится весь диапазон изменения признака, и соответствующих этим интервалам частот. ИНТЕРВАЛЫ f Итого77 Данные о весе 77 человек

11 Иванов О.В., Соколихин А.А Условия для выбора интервалов 1. Интервалы не должны пересекаться 2. Интервалы должны охватывать все значения признака 3. Интервалы должны иметь одинаковую длину, за исключением крайних 4. Интервалы не должны иметь пробелов

12 Иванов О.В., Соколихин А.А Относительные частоты Отношения частотПример.

13 Иванов О.В., Соколихин А.А Относительные частоты (2) Доли (пропорции)Пример.

14 Иванов О.В., Соколихин А.А Относительные частоты (3) ПроцентыПример.

15 Иванов О.В., Соколихин А.А Расчет относительных частот Результаты экзамена 115 студентов СУММА БАЛЛОВ fPCP%C%C% ,06 6,1100, ,08 0,14 7,893, ,10 0,24 10,486, ,13 0,37 13,075, ,16 0,53 15,762, ,15 0,68 14,847, ,10 0,78 10,432, ,09 0,87 8,721, ,05 0,92 5,213, ,03 0,95 2,67, ,05 1,00 5,25,3 ИТОГО ,0 Обозначения: f = частота P = относительная частота CP = накопленная относительная частота % = проценты С% = накопленные проценты

16 Иванов О.В., Соколихин А.А Пример. Политические предпочтения КАТЕГОРИИfP% Демократы % Коммунисты % Либералы % Всего % f – абсолютная частота (45) P – относительная частота (45/105 = 0,428) % – процент (45/105*100% = 42,8%)

17 Иванов О.В., Соколихин А.А Пример. Отметки по математике КАТЕГОРИИfСfСfPСPСP%С%С% Отлично % Хорошо %68.2% Удовл %91.8% Неуд %100% Всего % - накопленные значения (сумма с 1-ой строки по данную) - 58 учеников (или всех учеников, или 68.2% всех учеников) имеют оценку хорошо и выше

18 Иванов О.В., Соколихин А.А Таблицы Номер, Заголовок таблицы Название строк Название столбцов Заголовки столбцов Заголовки строкПоле (тело) таблицы Таблицы являются удобной и активно используемой формой представления данных.

19 Иванов О.В., Соколихин А.А Таблицы сопряженности признаков Таблицы для двух переменных называются таблицами сопряженности. Они показывают связи или отношения между переменными. Если изучается связь между независимой и зависимой переменной, то зависимая чаще размещается в строках, а независимая в столбцах. Если в таблице рассчитываются проценты, то они размещаются по направлению независимой переменной. Досуг в разных городах ФОРМА ДОСУГА МЕСТО ПРОЖИВАНИЯ ВСЕГО ПО СТРОКЕ МОСКВАКУРСКСАМАРАВОЛГОГРАД Спорт ,4%29,9%48,3%41,9%44,8% Автомобили ,4%59,2%23,6%50,0%41,4% Компьютер ,2%10,8%28,1%8,1%13,9% Всего по столбцу ,3%33,5%19,0%13,2%100,0%

20 Иванов О.В., Соколихин А.А Таблица сопряженности признаков Таблицы для двух переменных называются таблицами сопряженности. Они показывают связи или отношения между переменными. Если изучается связь между независимой и зависимой переменной, то зависимая чаще размещается в строках, а независимая в столбцах. Здесь: вид деятельности – независимая переменная. Категории номинальной шкалы располагаются в произвольном порядке, порядковой – в порядке возрастания значения признака. Удовлетворенност ь размером оплаты труда Вид деятельности ВСЕГО РАБОЧИЙСЛУЖАЩИЙ Низкая Высокая Всего по столбцу

21 Иванов О.В., Соколихин А.А Таблица сопряженности в процентах Проценты размещаются по направлению зависимой переменной (т.е. по столбцам). Под каждым столбцом необходимо указывать базу, использовавшуюся при расчёте процентов, чтобы можно было восстановить абсолютные частоты. удовлетворение от зарплаты вид деятельности РАБОЧИЙСЛУЖАЩИЙ низкое74.4%18.3% высокое25.6%81.7% Всего по столбцу100% База для пересчёта (47)(60)

22 Иванов О.В., Соколихин А.А Таблица для интервальных признаков Разбиение на интервалы с последующим построением таблицы сопряженности в абсолютных частотах или процентах. РОСТ ВЕС ВСЕГО ПО СТРОКЕ Всего по столбцу Кстати: в этом примере нельзя выделить зависимую и независимую переменные.

23 Иванов О.В., Соколихин А.А Сложные таблицы МОСКВАКУРСКСАМАРАВОЛГОГРАДВСЕГО ДОСУГМ Ж Спорт Автомобили Компьютер Всего Таблица предполагает большее количество информации. Такие таблицы могут быть важны, но когда мы делаем таблицы слишком сложными, мы нарушаем основное правило: описание данных должно быть простым и ясным.

24 Иванов О.В., Соколихин А.А Визуальные представления Графические изображения данных дают визуальное представление об основных свойствах имеющегося набора данных: 1. Размах значений. Минимальное и максимальное значения. 2. Типичные значения. Какие значения встречаются чаще всего? 3. Рассеяние. Какая типичная разница между данными? 4. Общая конфигурация данных. Где сосредоточены основные данные? Симметрично ли они расположены вокруг типичного значения? В какую сторону смещены? 5. Характерные особенности. Имеются ли выбросы? Есть ли значения, которые пропущены?

25 Иванов О.В., Соколихин А.А Гистограммы частот Гистограмма частот – графическое представление, которое показывает распределение переменной. Гистограмма относительных частот строится преобразованием частот на оси Y в доли или проценты.

26 Иванов О.В., Соколихин А.А Гистограммы. Примеры Политические предпочтения Проценты Абсолютная частота

27 Иванов О.В., Соколихин А.А Гистограммы. Примеры (2) Политические предпочтения ПроцентыАбсолютная частота

28 Иванов О.В., Соколихин А.А Гистограммы. Примеры (3) Отметки по математике (абсолютная частота)

29 Иванов О.В., Соколихин А.А Пример. Тест первокурсников Первокурсники социологического факультета написали тест по математике. В тесте приняли участие 331 человек. Оценивалось 11 заданий.

30 Иванов О.В., Соколихин А.А Нормальное распределение Анализ данных наиболее эффективен в случае, когда гистограмма близка к нормальному распределению. На гистограмме нарисована линия для нормального распределения с параметрами 4,3 и 2,71.

31 Иванов О.В., Соколихин А.А Бимодальное распределение Если в гистограмме видны две отдельные группы данных, говорят о бимодальном распределении данных. Возможно, следует изменить ход анализа: 1 вариант - отказаться от изучения одной из групп 2 вариант - изменить подход к сбору и анализу данных Пример. Продолжительность пребывания больных в стационаре

32 Иванов О.В., Соколихин А.А Выбросы Сильно отклоняющиеся значения называются выбросами. Следует решить, отказаться от выбросов в дальнейшем исследовании или нет. Можно провести два исследования параллельно – с выбросами и без. Если выбросы исключаются, это должно быть аргументировано и детально описано в отчете. Пример. Время обслуживания одного клиента

33 Иванов О.В., Соколихин А.А Полигоны частот Полигон, в отличие от гистограммы, строится в виде линии, проходящей по точкам, соответствующим серединам интервалов и частотам. Зрительное представление о распределении частот, полученное при помощи полигона, довольно сильно отличается от гистограммы даже при одних и тех же данных.

34 Иванов О.В., Соколихин А.А Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет 4 и менее решенных задач.

35 Иванов О.В., Соколихин А.А Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет вес до 70 кг. ИНТЕРВАЛЫ f Итого77

36 Иванов О.В., Соколихин А.А Круговая диаграмма Круговая диаграмма полезна для представления частот переменной, измеряемой по номинальной шкале. ОбъемнаяКольцевая

37 Иванов О.В., Соколихин А.А Понятия и термины 2.1. Частоты Частота Распределение частот Категориальное и Интервальное распределение частот 2.2. Относительные частоты Относительная частота Отношения и доли Проценты Накопленная частота Накопленная относительная частота Накопленные проценты 2.3. Таблицы 2.4. Визуальные представления Гистограмма Полигон Кумулята

38 Иванов О.В., Соколихин А.А Тема для размышления: парадокс Симпсона Группа 1 (контрольная,без вакцины) возрастчеловекзаболелов процентах до 65 лет ,6% после 65 лет ,5% от 0 до 100 лет ,3% Группа 2 (с вакциной) возрастчеловекзаболелов процентах до 65 лет ,5% после 65 лет ,5% от 0 до 100 лет ,7%

39 Иванов О.В., Соколихин А.А Задание на 5 минут Напишите своими словами, чем различаются пять типов шкал, обсуждавшихся на предыдущей лекции.

40 Иванов О.В., Соколихин А.А Задание. Гарри Потер и Винни Пух Соберите данные в вашей группе при помощи следующей анкеты: 1. ГруппаНомер группы 2. Пол0 / 1 (0- М,1- Ж) 3. ВозрастЛет 4. Ваше отношение к серии книг про Гарри Потера: 0 – Не читал 1 – Терпеть не могу 2 – Не нравится 3 – Нет впечатлений 4 – Нравится 5 – Просто супер 5. Отношение к фильмам про Гарри Потера 0 – Не смотрел 1 – Совершенно не понравился 2 – Не нравится 3 – Нет впечатлений 4 – Понравился 5 – Понравился очень 6. Отношение к мультфильму про Винни-Пуха (Мосфильм) 0 – Не смотрел 1 – Совершенно не понравился 2 – Не нравится 3 – Нет впечатлений 4 – Понравился 5 – Очень люблю

41 Иванов О.В., Соколихин А.А Задание. Гарри Потер и Винни Пух (2) 7. Ваше отношение к мультфильму про Винни- Пуха (World Disney): 0 – Не смотрел 1 – Совершенно не понравился 2 – Не нравится 3 – Нет впечатлений 4 – Понравился 5 – Очень люблю Постройте таблицы частот и гистограммы. Проанализируйте полученные результаты. Введите данные в компьютер. Проведите анализ при помощи компьютера и сравните с результатами, полученными ручным способом.

42 Иванов О.В., Соколихин А.А На семинарских занятиях… Строить таблицы для необработанных данных Анализировать тип данных, типы шкал Строить таблицы частот и относительных частот Строить гистограммы и другие графические представления Получать выводы из анализа представлений данных