Статистические распределения и их основные характеристики.

Презентация:



Advertisements
Похожие презентации
Статистические распределения и их основные характеристики.
Advertisements

СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Показатели вариации Необходимость измерения вариации Средняя величина характеризует совокупность по изучаемому признаку, такой характеристики совокупности.
Показатели вариации Необходимость измерения вариации Средняя величина характеризует совокупность по изучаемому признаку, такой характеристики совокупности.
Показатели вариации признака 1. Абсолютные показатели вариации; 1.1 Размах вариации; 1.2 Среднее линейное отклонение; 1.3 Среднее квадратическое отклонение;
Статистические показатели План темы 1.Абсолютные и относительные величины 2.Средние величины 3.Структурные средние.
Авторы: Равичев Л.В., Ломакина И.А. Кафедра менеджмента и маркетинга РХТУ им. Д.И.Менделеева. Москва СТАТИСТИКА. Описательная статистика. Лекция.
Описательные характеристики распределения тестовых результатов 1.Меры среднего положения (меры центральной тенденции). Мода, медиана, среднее 2.Меры вариации.
Показатели вариации Вариацией называется колеблемость, многообразие, изменяемость величины признака у единиц совокупности.
Тема 5. Статистическое изучение вариации признака Вопрос 1. Понятие о рядах распределения признака Вопрос 2. Показатели вариации признака Вопрос 3. Вариация.
ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ГЕОЛОГИИ Лекция 3 по дисциплине «Математические методы моделирования в геологии» 1Грановская Н.В.
Т ЕМА 6. «С РЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ »
Показатели вариации АбсолютныеОтносительные Размах вариации среднее линейное отклоне- ние Средний квадрат отклоне- ний среднее квадра- тическое отклоне-
Тема 4 Средние статистические показатели Статистический показатель - это объективная, обобщающая количественная характеристика явления или процесса в.
Астафурова И.С. Кафедра «Бухгалтерский учет и аудит» Лекция 4.
Оценка вариативности Л.Е.Федорова. Признак Признак это свойство, проявлением которого один предмет отличается от другого. Характерным свойством признака.
Техника построения вариационных рядов. Пример:На основании многолетних клинических наблюдений, проводившихся в Сухумском питомнике обезьян, составлена.
Вариационные ряды распределения и их числовые определения Преподаватель математики МИПК им. И. Федорова Епихина Е.В.
Тема 4 Средние статистические показатели Статистический показатель - это объективная, обобщающая количественная характеристика явления или процесса в.
Транксрипт:

Статистические распределения и их основные характеристики

Различия индивидуальных значений признака у единиц совокупности называются вариацией признака. Она возникает в результате того, что индивидуальные значения складываются под совместным влиянием разнообразных условий (факторов), по разному сочетающихся в каждом отдельном случае.

Вариация, которая не зависит от факторов, положенных в основу выделения групп, называется случайной вариацией.

Приемы изучения вариации в пределах одной группы: простроение вариационного ряда (ряда распределения); графическое изображение; исчисление основных характеристик распределения: показателей центра распределения; показателей вариации.

Вариационный ряд - групповая таблица, построенная по количественному признаку, в сказуемом которой показывается число единиц в каждой группе. Форма построения вариационного ряда зависит от характера изменения изучаемого признака. Он может быть построен в форме дискретного ряда или в форме интервального ряда.

Распределение рабочих по тарифному разряду Тарифный разряд рабочего, x Число рабочих, имеющи х этот разряд, f Частость W Накопленная (кумулятивн ая) частота,S 210, ,255+1=6 480,46+8=14 540,214+4=18 620,118+2=20 итого201

Частость расчитывается по формуле Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

Средняя квалификация работников Т.е в среднем рабочие имеют 4 тарифный разряд

Для признака, имеющего непрерывное изменение строится интервальный вариационный ряд распределения. Определение величины интервала производится

Показатели центра распределения. Средняя арифметическая для дискретного ряда расчитывается по формуле средней арифметической взвешенной:

В интервальном ряду расчет производится по этой же формуле, но в качестве х берется середина интервала. Она определяется так

Распределение банков по размеру прибыли. Размер прибыли, млн. крон,x Середина интервала, x' Число банков, f Накопленна я частота, S 3,7 - 4,64,1533 4,6 - 5,55,0543+4=7 5,5 - 6,45,9557+5=12 6,4 - 7,36, =18 7,3 - 8,17,7218+2=20 итого-20

Средний размер прибыли

Структурные средние Медиана Мода Квартиль

Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером: где n - число единиц в совокупности.

Медиана в дискретном ряду По накопленным частотам определяют ее численное значение в дискретном вариационном ряду. Вставленная фукция в EXCEL MEDIAN()

Расчет медианы в дискретном ряду Медиана тарифного разряда рабочих будет найдена следующим образом: Следовательно, среднее значение 10-го и 11-го признаков будут соответствовать медиане. По накопленным частотам находим 10-й и 11-й признаки. Их значение соответствует 4-му тарифному разряду, следовательно медиана в данном ряду равна 4.

Медиана в интервальном ряду В интервальном ряду распределения по номеру медианы указывают интервал, в ктором находится медиана. Численное значение определяется по формуле:

Расчет медианы в интервальном ряду По накопленным частотам определяем, что медиана находится в интервале 5,5 - 6,4 так как номер медианы а это значение включает кумулятивная частота 12.

Расчет медианы в интервальном ряду Тогда медиана Таким образом, 50% банков имеют прибыль менее 6,13 млн. крон, а другие 50% - более 6,13.

Мода (Мо) наиболее часто встречающееся значение признака. В дискретном ряду - это варианта с наибольшей частотой. Вставленная фукция в EXCEL MODE()

Значение моды в интервальном ряду В интервальном ряду сначала определяется модальный интервал, т.е. тот, который имеет наибольшую частоту, а затем расчитывают моду по формуле:

Определение значения моды в приведенных выше дискретном и интервальном рядах В примере 1 наибольшую частоту - 8 имеет четвертый тарифный разряд, следовательно значение моды равно 4 тарифному разряду В примере 2 модальный интервал 6,4 -7,3 так как такой уровень прибыли имеют наибольшее число банков.

Квартиль - это значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин будет три: первая квартиль(Q1), вторая квартиль (Q2), третья квартиль (Q3). Вторая квартиль является медианой.

Сначала определяется положение или место квартили:

Квартиль в дискретном ряду В дискретном ряду численное значение квартили определяют по накопленным частотам. Вставленная фукция в EXCEL QUARTILE()

Квартиль в интервальном ряду В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле:

Показатели вариации (колеблемости) признака. К абсолютным показателям относят: Размах колебаний; Среднее линейное отклонение; Дисперсию; Среднее квадратическое отклонение; Квартильное отклонение.

Размах колебаний (размах вариации) представляет собой разность между максимальным и минимальным значениями признака изучаемой совокупности: Размах вариации зависит только от крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями.

Точнее характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака. К таким показателям относят: среднее линейное отклонение, дисперсию, среднее квадратическое отклонение.

Среднее линейное отклонение d для несгруппированных данных расчитывается по формуле Вставленная фукция в EXCEL AVEDEV( )

Для n вариационного ряда:

Расчет среднего линейного отклонения Произведено продукции одним рабочим за смену, шт, x Число рабочих f xf x x - x f = -2|8 - 10|*7 = = -1|9 -10|*10 = = 0|10-10|*15 = = 1|11-10|*12= = 2|12-10|*6 =

Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклоненй. В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной:

Дисперсия простая Вставленная фукция в EXCEL VARP ( )

Дисперсия взвешенная

Среднее квадратическое отклонение стандартное отклонение (Standard Deviation) представляет собой корень квадратный из дисперсии

Среднее квадратическое отклонение невзвешенное Вставленная фукция в EXCEL STDEVP ( )

Среднее квадратическое отклонение взвешенное

Данные о производительности труда рабочих Произведено продукции одним рабочим, шт. (х) Число рабо чих f xf x - x(x - x) 2 (x - x) 2 *f итого

Расчет показателей дисперсии и среднего квадратического отклонения 1. Исчислим среднюю арифметическую взвешенную:

Расчет показателей дисперсии и среднего квадратического отклонения 2. Определим дисперсию.

Расчет показателей дисперсии и среднего квадратического отклонения 3. среднее квадратическое отклонение будет равно Это означает, что отклонение от средней производительности составило 1,2 шт.

Другой метод расчета дисперсии Дисперсия равна разности средней из квадратов признака и квадрата средней.

Относительные показатели вариации Применяются для оценки интенсивности вариации и для сравнения ее в разных совокупностях. относительный размах вариации (коэффициент осцилляции)

Относительные показатели вариации Относительное линейное отклонение (отклонение по модулю) Коэффициент вариации

Относительные показатели вариации Относительный показатель квартильной вариации (относительное квартильное расстояние)

Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава. Предположим вариация производительности труда на предприятиях Эстонии v 25%. Однако, если рассматривается вариация роста взрослых людей, то при v=4% следует говорить об очень сильной интенсивности

Моменты распределения и показатели его формы. Центральные моменты распределения порядка – это средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Момент первого порядка равен нулю. Второй центральный момент представляет собой дисперсию. Третий момент используется для оценки асимметрии Четвертый – для оценки эксцесса.

Моменты распределения Порядок момента Формула по несгруппированным данным по сгруппированным данным Первый Второй

Моменты распределения Порядок момента Формула по несгруппированным данным по сгруппированным данным Третий Четвертый

Показатели асимметрии На основе момента третьего порядка можно построить коэффициент асимметрии или показатель Пирсона

Показатели асимметрии Если А > 0, то асимметрия правосторонняя, а если А < 0, то асимметрия левосторонняя, в симметричном распределении А=0. В EXCEL используется функция SKEW ( ).

Характеристика эксцесса распределения В нормальном распределении Е = 0, поэтому, если Е > 0, то эксцесс выше нормального (островершинная кривая), Е < 0, эксцесс ниже нормального (плосковершинная кривая). В EXCEL используется функция KURT ( ).

Характеристика эксцесса распределения По значению показателей асимметрии и эксцесса можно судить о близости распределения к нормальному. Если и то распределение можно считать нормальным

Оценка диапазона изменения статистической переменной По теореме Чебышева: в интервале ( - 2, +2 ) находится 75 % значений, в интервале ( - 3, +3 ) находится 89 % значений.

Оценка диапазона изменения статистической переменной «Правило трех сигм» справедливо для нормального распределения в интервале ( -, + ) находится 68% значений, в интервале ( - 2, +2 ) находится 95.4% значений, в интервале ( - 3, +3 ) находится 99.7% значений.

Закон (правило) сложения дисперсий. - величина общей дисперсии - межгрупповая дисперсия - средняя внутригрупповая дисперсия

Межгрупповая дисперсия

Средняя внутригрупповая дисперсия

Имеются следующие данные о времени простоя автомобиля под разгрузкой: пункта разгрузки Число грузчиков Время простоя мин

Вспомогательная таблица для расчета общей дисперсии. Время простоя под разгрузкой мин., х Число выполнен ных разгрузок, f x*f x - x 0 (x- x 0 ) 2 (x- x 0 ) 2 f итого

Среднее время простоя Общая дисперсия

Расчет внутригрупповой дисперсии по первой группе (число грузчиков, участвующих в разгрузке, 3 чел) Время простоя под разгрузкой, мин., х Число выполнен -ных разгрузок, f x*f x - x 1 (x - x 1 ) 2 f итого464-30

Дисперсия первой группы

Расчет внутригрупповой дисперсии по второй группе (число грузчиков, участвующих в разгрузке, - 4) Время простоя под разгрузкой, мин., х Число выполненных разгрузок, f x*f x - x 2 (x - x 2 ) 2 f ,335, ,670, ,677,13 итого656-13,37

Дисперсия второй группы

Средняя из внутригрупповых дисперсий

Межгрупповая дисперсия

Общая дисперсия