4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г. Лекция 2. Представление данных 2-1. Частоты 2-2. Относительные частоты 2-3. Таблицы 2-4.

Презентация:



Advertisements
Похожие презентации
26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г.26 сентября 2012 г. Тема 2. Представление данных 2.1. Частоты 2.2. Относительные частоты 2.3.
Advertisements

23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г. Лекция 9. Непрерывные распределения 9-1. Функция распределения 9-2. Плотность.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.

Математические основы описания результатов исследования.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Авторы: Равичев Л.В., Ломакина И.А. Кафедра менеджмента и маркетинга РХТУ им. Д.И.Менделеева. Москва СТАТИСТИКА. Описательная статистика. Лекция.
Графический метод анализа рядов распределения.. Первоначальной стадией анализа рядов распределения является построение диаграммы казусов. На диаграмму.
Маршрутный лист «Числа до 100» ? ? ?
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Выполнила: Камалуттинова Елизавета Сергеевна Руководитель работы: учитель математики Качалова Ирина Викторовна.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Предмет и методы Лекция 2.
Типовые расчёты Растворы
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
Урок-обобщение (7 класс – алгебра) МОУ "СОШ 45 г. Чебоксары" Кабуркина М. Н.1.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Автор - составитель теста В. И. Регельман источник: regelman.com/high/Kinematics/1.php Автор презентации: Бахтина И.В. Тест по теме «КИНЕМАТИКА»
1. Определить последовательность проезда перекрестка
Транксрипт:

4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г. Лекция 2. Представление данных 2-1. Частоты 2-2. Относительные частоты 2-3. Таблицы 2-4. Визуальные представления

4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г Частоты Распределение частот Интервальные и категориальные частоты

3 Иванов О.В., Соколихин А.А Частоты и распределения частот Частота – количество наблюдений, в которых признак принимает определенное значение или находится в определенном интервале. Распределение частот показывает частоты во взаимосвязи с результатами наблюдений.

4 Иванов О.В., Соколихин А.А Пример. Политические предпочтения Имеются исходные данные по респондентам: РеспондентПредпочтение 1демократы 2демократы 3либералы 4демократы 5коммунисты 6либералы 7коммунисты… 105демократы Требуется провести подсчет количества респондентов, отдающих политические предпочтения каждой из партий.

5 Иванов О.В., Соколихин А.А Ручная запись при подсчете данных Существует несколько часто используемых методов ручного подсчета данных: Запись единицами4 Запись пятерками13 Запись пятерками18 Запись десятками27

6 Иванов О.В., Соколихин А.А Категориальное и интервальное распределение Если признак измеряется номинальной или порядковой шкалой, получим категориальное распределение частот (дискретный признак). Если признак измеряется числовой шкалой, получим интервальное распределение частот (непрерывный признак). Интервальное распределение строится также и для дискретного признака, если его значения являются редкими.

7 Иванов О.В., Соколихин А.А Категориальные частоты КАТЕГОРИИf Демократы45 Коммунисты43 Либералы15 Всего105 КАТЕГОРИИ f Очень понравился 24 Понравился 12 Фильм средний 10 Не понравился 6 Очень плохой 8 Всего 60 Номинальная шкала Политические предпочтения Порядковая шкала Отношение к фильму

8 Иванов О.В., Соколихин А.А Объединение категорий в классы... Например: места, которые занимала команда XYZ в чемпионатах России с 1992 года 1,5,9,2,14,9,12,7,2,4,13,14... имеет смысл для повышения наглядности, если: 1.количество различных категорий слишком велико 2.частоты в соседних категориях сильно колеблются

9 Иванов О.В., Соколихин А.А Объединение категорий в классы Внимание: опасность манипуляции. Другое образование классов может создать совершенно иное впечатление!!! Вводим три класса: 1.призовые места (1-3) 2.середина таблицы (4-13) 3.аутсайдерские места (14-16) Другие три класса: 1.начало таблицы (1-4) 2.середина таблицы (5-11) 3.конец таблицы места (12-16)

10 Иванов О.В., Соколихин А.А Объединение категорий в классы Порядковая шкала: объединяются «соседние» категории Номинальная шкала: «соседних» категорий не существует, иногда возможна разбивка всех категорий на классы по некоторому сходству категорий. Пример. Факультеты можно разделить на «гуманитарные», «естественные», «технические» Объединение категорий в классы может быть продиктовано постановкой задачи, даже если общее количество категорий невелико. Пример. Категории «холост», «разведен», «вдовец» можно объединить в один класс «не женат», если нас интересует в первую очередь, женат ли мужчина или нет.

11 Иванов О.В., Соколихин А.А Интервальные частоты (n = 77) Интервальное распределение частот состоит из некоторого количества интервалов равной длины, на которые делится весь диапазон изменения признака, и соответствующих этим интервалам частот. ИНТЕРВАЛЫ f Итого77 Данные о весе 77 человек

12 Иванов О.В., Соколихин А.А Условия для выбора интервалов 1. Интервалы не должны пересекаться 2. Интервалы должны охватывать все значения признака 3. Интервалы должны иметь одинаковую длину, за исключением крайних 4. Интервалы не должны иметь пробелов

4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г Относительные частоты Отношение частот ДолиПроценты Накопленные частоты

14 Иванов О.В., Соколихин А.А Относительные частоты Отношения частотПример.

15 Иванов О.В., Соколихин А.А Относительные частоты (2) Доли (пропорции)Пример.

16 Иванов О.В., Соколихин А.А Относительные частоты (3) ПроцентыПример.

17 Иванов О.В., Соколихин А.А Пример. Политические предпочтения КАТЕГОРИИfP% Демократы % Коммунисты % Либералы % Всего % f – абсолютная частота (45) P – относительная частота (45/105 = 0,428) % – процент (45/105*100% = 42,8%)

18 Иванов О.В., Соколихин А.А Пример. Оценки по статистике КАТЕГОРИИfСfСfPСPСP%С%С% Отлично % Хорошо %68.2% Удовл %91.8% Неуд %100% Всего % - накопленные значения (сумма с 1-ой строки по данную) - 58 учеников (или всех учеников, или 68.2% всех учеников) имеют оценку хорошо и выше

4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г Таблицы Общий вид Таблицы сопряженности Интервальные данные в таблице Сложные таблицы

20 Иванов О.В., Соколихин А.А Общий вид таблицы Номер, Заголовок таблицы Название строк Название столбцов Заголовки столбцов Заголовки строкПоле (тело) таблицы Таблицы являются удобной и часто используемой формой представления данных.

21 Иванов О.В., Соколихин А.А Таблица сопряженности признаков Таблицы для двух переменных называются таблицами сопряженности. Они показывают связи или отношения между переменными. Если изучается связь между независимой и зависимой переменной, то зависимая чаще размещается в строках, а независимая в столбцах. Здесь: вид деятельности – независимая переменная. Категории номинальной шкалы располагаются в произвольном порядке, порядковой – в порядке возрастания значения признака. Удовлетвореннос ть размером оплаты труда Вид деятельности ВСЕГО РАБОЧИЙСЛУЖАЩИЙ Низкая Высокая Всего по столбцу

22 Иванов О.В., Соколихин А.А Таблица сопряженности в процентах Проценты размещаются по направлению зависимой переменной (т.е. по столбцам). Под каждым столбцом необходимо указывать базу, использовавшуюся при рассчёте процентов, чтобы можно было восстановить абсолютные частоты. удовлетворение от зарплаты вид деятельности РАБОЧИЙСЛУЖАЩИЙ низкое74.4%18.3% высокое25.6%81.7% Всего по столбцу100% База для пересчёта(47)(60)

23 Иванов О.В., Соколихин А.А Таблица для интервальных признаков Разбиение на интервалы с последующим построением таблицы сопряженности в абсолютных частотах или процентах. РОСТ ВЕС ВСЕГО ПО СТРОКЕ Всего по столбцу Кстати: в этом примере нельзя выделить зависимую и независимую переменные.

24 Иванов О.В., Соколихин А.А Сложные таблицы МОСКВАКУРСКСАМАРАВОЛГОГРАДВСЕГО ДОСУГМ Ж Спорт Автомобили Компьютер Всего Таблица предполагает большее количество информации. Такие таблицы могут быть важны, но когда мы делаем таблицы слишком сложными, мы нарушаем основное правило: описание данных должно быть простым и ясным.

4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г.4 ноября 2012 г Визуальные представления ГистограммаПолигонКумулята

26 Иванов О.В., Соколихин А.А Визуальные представления Графические изображения данных дают визуальное представление об основных свойствах имеющегося набора данных: 1. Размах значений. Минимальное и максимальное значения. 2. Типичные значения. Какие значения встречаются чаще всего? 3. Рассеяние. Какая типичная разница между данными? 4. Общая конфигурация данных. Где сосредоточены основные данные? Симметрично ли они расположены вокруг типичного значения? В какую сторону смещены? 5. Характерные особенности. Имеются ли выбросы? Есть ли значения, которые пропущены?

27 Иванов О.В., Соколихин А.А Гистограммы частот Гистограмма частот – графическое представление, которое показывает распределение переменной. Гистограмма относительных частот строится преобразованием частот на оси Y в доли или проценты.

28 Иванов О.В., Соколихин А.А Гистограммы. Примеры Политические предпочтения Проценты Абсолютная частота

29 Иванов О.В., Соколихин А.А Гистограммы. Примеры (1) Политические предпочтения ПроцентыАбсолютная частота

30 Иванов О.В., Соколихин А.А Гистограммы. Примеры (2) Отметки по математике (абсолютная частота)

31 Иванов О.В., Соколихин А.А Пример. Тест первокурсников Первокурсники социологического факультета написали тест по математике. В тесте приняли участие 331 человек. Оценивалось 11 заданий.

32 Иванов О.В., Соколихин А.А Нормальное распределение Анализ данных наиболее эффективен в случае, когда гистограмма близка к нормальному распределению. На гистограмме нарисована линия для нормального распределения с параметрами 4,3 и 2,71.

33 Иванов О.В., Соколихин А.А Бимодальное распределение Если в гистограмме видны две отдельные группы данных, говорят о бимодальном распределении данных. Возможно, следует изменить ход анализа: 1 вариант - отказаться от изучения одной из групп 2 вариант - изменить подход к сбору и анализу данных Пример. Продолжительность пребывания больных в стационаре

34 Иванов О.В., Соколихин А.А Выбросы Сильно отклоняющиеся значения называются выбросами. Следует решить, отказаться от выбросов в дальнейшем исследовании или нет. Можно провести два исследования параллельно – с выбросами и без. Если выбросы исключаются, это должно быть аргументировано и детально описано в отчете. Пример. Время обслуживания одного клиента

35 Иванов О.В., Соколихин А.А Полигоны частот Полигон, в отличие от гистограммы, строится в виде линии, проходящей по точкам, соответствующим серединам интервалов и частотам. Зрительное представление о распределении частот, полученное при помощи полигона, довольно сильно отличается от гистограммы даже при одних и тех же данных.

36 Иванов О.В., Соколихин А.А Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет 4 и менее решенных задач.

37 Иванов О.В., Соколихин А.А Кумулята Кумулята позволяет при помощи графика ответить на вопрос, сколько человек имеет вес до 70 кг. ИНТЕРВАЛЫ f Итого77

38 Иванов О.В., Соколихин А.А Круговая диаграмма Круговая диаграмма полезна для представления частот переменной, измеряемой по номинальной шкале. ОбъемнаяКольцевая

39 Иванов О.В., Соколихин А.А Тема для размышления: парадокс Симпсона Группа 1 (контрольная,без вакцины) возрастчеловекзаболелов процентах до 65 лет ,6% после 65 лет ,5% от 0 до 100 лет ,3% Группа 2 (с вакциной) возрастчеловекзаболелов процентах до 65 лет ,5% после 65 лет ,5% от 0 до 100 лет ,7%

40 Иванов О.В., Соколихин А.А Задание на 5 минут Напишите своими словами, чем различаются пять известных вам типов шкал.