25.07.2015 Основы математической обработки информации 1 Роль измерений (обработки информации) в научных исследованиях «Измеряй измеримое и делай неизмеримое.

Презентация:



Advertisements
Похожие презентации
1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:
Advertisements

Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
Тема 4: «Средние величины» Вопросы темы: 1.Сущность и значение средних величин 2.Научные принципы и условия расчета средних величин 3.Средняя арифметическая.
Теория систем и системный анализ Тема5 «Оценка сложных систем. Основные типы шкал измерения »
Измерение – это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном и получает численное выражение в определенном масштабе.
Выравнивание статистических рядов. Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений.
Понятие шкалы измерения, основные типы шкал и их применение в системном анализе Дисциплина : « теория систем и системный анализ » Студент : Щеколдина Д.
Ковариация. Коэффициент корреляции. Корреляционный момент Работу выполнила: Студентка группы 2У00 Нагорнова Е.А.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Минаева Татьяна Александровна Демьяненко Ирина Николаевна.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Предмет и методы Лекция 2.
Математическая статистика Случайные величины. Случайной называется величина, которая в результате испытания может принять то или иное возможное значение,
Статистическая гипотеза. Нулевая гипотеза Кошкарова М.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Нормальное распределение Тема 1. Вопросы для обсуждения 1.Случайная величина и ее распределение 2.Математическое ожидание и его оценка 3.Дисперсия и ее.
Лекция по МОП ТЕМА: Измерение связи двух признаков.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
Статистические оценки параметров распределения Доверительные интервалы.
Транксрипт:

Основы математической обработки информации 1 Роль измерений (обработки информации) в научных исследованиях «Измеряй измеримое и делай неизмеримое измеримым» (Галилео Галилей) «Наука начинается с измерения» (Д.И. Менделеев) «Если что-то существует, то оно существует в каком-то количестве» (Э.Торндайк) «История науки – это история измерений» (Р. Кеттелл)

Основы математической обработки информации 2 Измерения в педагогике и психологии Существует множество определений «измерения», в зависимости от точки зрения исследователя. Общее во всех таких определениях заключается в следующем. Измерение – это приписывание чисел объектам в соответствии с определенными правилами. Например, измерить рост человека – это значит приписать число расстоянию между макушкой человека и подошвой его ног. Измерить коэффициент интеллектуальности ребенка – это приписать число множеству его ответов на набор тестовых задач.

Основы математической обработки информации 3 Шкалы измерения В педагогике и психологии выделяются следующие четыре вида измерительных шкал: - шкала наименований (номинальная шкала); - порядковая шкала (ранговая шкала); - интервальная шкала; - шкала отношений. Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, а измерения, осуществляемые с помощью двух последних шкал, - количественными. Принято также шкалы, приводящие к качественным измерениям, называть дискретными, а шкалы, приводящие к количественным измерениям, - непрерывными.

Основы математической обработки информации 4 Шкала наименований (определение) Это самая простая шкала. Объекты, принадлежащие к одному классу, идентичны в отношении измеряемого отклика. Измерение в такой шкале состоит фактически в отнесении объекта к тому или иному классу. Далее классам даются обозначения, причем вместо обозначений часто используются числа. Так, психологи часто кодируют «пол», обозначая «особей женского рода» нулем, а «особей мужского рода» - единицей. Отклик, который измеряется в шкале наименований, называется качественным. Примеры: пол, темперамент, решение задачи.

Основы математической обработки информации 5 Шкала наименований (свойства) Несмотря на кажущуюся примитивность шкалы наименований, она широко используется как в педагогике, так и в психологии. Здесь обработка данных проводится не с самими классами, а с числами, характеризующими количества объектов, попавших в каждый класс. Статистические методы, применяемые для обработки данных, измеренных по шкале наименований, называют методами обработки долей и частот или методами анализа качественных признаков.

Основы математической обработки информации 6 Шкала наименований (статистические процедуры) В шкала наименований можно использовать достаточно большой класс статистических процедур: - определение абсолютной и относительной частоты каждого класса; - вычисление моды, - класса с наибольшей абсолютной частотой, - которую можно использовать для решения задач прогноза; - нахождение показателей корреляции качественных признаков, например, есть ли взаимосвязь между успеваемостью учащихся и их полом; - определение близости распределения признаков, например эмпирического с теоретическим равномерным, при помощью критерия хи-квадрат; - проверка гипотез относительно долей признаков с помощью биномиального критерия.

Основы математической обработки информации 7 Порядковая шкала (определение) Порядковая шкала или шкала порядка - это шкала более сложная, чем шкала наименований, - она классифицирует не по принципу «эквивалентно – неэквивалентно», а по принципу "больше - меньше". Если в шкале наименований было безразлично, в каком порядке располагались классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки "самое малое значение" к ячейке "самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами (или категориями). Это обусловлено тем, что именно по отношению к ним используются определения "низкий", "средний" и "высокий" класс, или первая, вторая, третья категория, и т.д.

Основы математической обработки информации 8 Порядковая шкала (свойства) Важным аспектом является число классов в порядковой шкале. По определению в порядковой шкале должно быть не менее трех классов, например "положительная реакция - нейтральная реакция - отрицательная реакция". Однако все многообразие объектов не рационально помещать только в три класса, потому что в один и тот же класс могут попасть объекты, достаточно сильно отличающиеся друг от друга. Кроме того, чем больше классов в шкале, тем больше возможностей для проверки статистических гипотез (тем больше разрешающая способность статистических критериев). С другой стороны, если число классов равно числу объектов, как, например, в принудительном ранжировании, то есть опасность искусственного преувеличения различия между объектами.

Основы математической обработки информации 9 Порядковая шкала (расстояние между объектами) От классов легко перейти к числам, если, например, условиться, что низший класс получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. В порядковой шкале неизвестно истинное расстояние между классами, неизвестно также равны эти расстояния или нет. Известно лишь то, что они образуют последовательность. Значения величин можно заменять квадратами, логарифмами, нормализовать и т.д. При таких монотонных преобразованиях места объектов на порядковой шкале не меняются. Единица измерения в шкале порядка - расстояние в в 1 ранг, при этом, еще раз подчеркнем, расстояние между рангами может быть разным.

Основы математической обработки информации 10 Порядковая шкала (примеры) Шкалы порядка, наверное, чаще других шкал используются как в педагогике, так и в психологии. Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Например, рейтинг студентов в учебном процессе, рейтинг вузов, рейтинг регионов, рейтинг стран. Теория измерения латентных переменных позволяет интегрировать разнородные переменные в одну латентную переменную и проводить ее измерение на линейной шкале.

Основы математической обработки информации 11 Порядковая шкала (статистические процедуры) Для обработки данных можно использовать все статистические процедуры, которые применимы к данным, полученным в шкале наименований. Кроме того, можно использовать: - медиану – в качестве меры центральной тенденции выборки; - квантили - в качестве меры разброса объектов выборки по тому или иному показателю; - так называемые ранговые критерии, например коэффициент ранговой корреляции Спирмена для определения взаимосвязи между двумя выборками, критерий для сравнения двух зависимых выборок и др. Однако числовые значения порядковой шкалы нельзя складывать, вычитать, делить и умножать.

Основы математической обработки информации 12 Интервальная шкала (определение) Интервальная шкала классифицирует объекты по правилу "больше на определенное количество единиц - меньше на определенное количество единиц". Шкала интервалов в отличие от порядковой шкалы позволяет определить не только различие между объектами, но и величину различий между объектами в проявлении того или иного свойства. Возможны арифметические операции над измерениями. Например, можно утверждать, что 5 – 4 = 4 - 3, чего нельзя сделать, если измерения получены по шкале порядка. Интервальная шкала используется тогда, когда с помощью отклика можно установить количество некоторого свойства в объекте исследования, и зафиксировать равные различия. Для интервальной шкалы устанавливается единица измерения.

Основы математической обработки информации 13 Интервальная шкала (свойства) Единственное ограничение - нельзя определить, во сколько раз один объект больше другого по измеряемому свойства. Так, шкала для измерения температуры по Цельсию имеет масштабную единицу, но положение нуля на ней произвольно. Поэтому, например, если один объект имеет температуру 30° С, а другой - 10° С, то это не означает, что первый объект имеет втрое большую температуру, чем второй. Этот же недостаток имеет и шкала времени, которая не имеет начала отсчета и поэтому является интервальной шкалой. Такая ситуация характерна и для педагогики и для психологии. Так, нет смысла говорить об абсолютном нуле при измерении знаний или умственного развития. Здесь нуль верных ответов на вопросы задания не означает полного отсутствия знаний у учащегося, - это условный нулевой уровень.

Основы математической обработки информации 14 Интервальная шкала (статистические процедуры) Значения интервальной шкалы инвариантны относительно линейных преобразований: y = ax + b. Это означает, что можно изменять масштаб шкалы (?) и производить ее сдвиг (?). Интервальная шкала позволяет для анализа данных применять практически все статистические методы. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса - дисперсия. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и т.д. Исключение составляет вычисление коэффициента вариации, который определяется по формуле V = / x, где - среднеквадратическое отклонение х - среднее значение выборки (?).

Основы математической обработки информации 15 Шкала отношений (определение) Шкала отношений или шкала равных отношений - наиболее часто используемая в естественных науках и, прежде всего, в физике. Это еще более гибкая шкала, здесь кроме определения равенства, рангового порядка, равенства интервалов известно еще и равенство отношений. Шкала отношений позволяет определить не только, на сколько больше (меньше) один объект другого в отношении измеряемого свойства, но и во сколько раз больше (меньше). Например, для четырех объектов с откликами 3, 4, 6 и 8 выполняется отношение 3/4 = 6/8. Это обусловлено тем, что в шкала отношений в отличие от интервальной шкалы, нулевое значение отклика указывает на полное отсутствие измеряемого свойства.

Основы математической обработки информации 16 Шкала отношений (свойства) Измерения массы, длины, веса, температуры по Кельвину, времени реакции и выполнения тестового задания - примеры шкалы отношений. В интервальной же шкале выбор нулевой точки произволен, т.е. оцениваемое свойство объекта не равно нулю, когда результат измерения равен нулю. Так, вода при нуль градусов по Цельсию имеет все же некоторую температуру. Интервальную шкалу можно превратить в шкалу отношений, если возможно зафиксировать начало отсчета, как например при измерении температуры по Кельвину. Другой пример - измерение того или иного свойства числом верных ответов. В психологии шкалы отношений встречаются редко. Считается, что такими шкалами являются шкалы порогов абсолютной чувствительности.

Основы математической обработки информации 17 Шкала отношений (статистические процедуры) В шкале отношений к измерениям применимы все арифметические операции и, следовательно, все понятия и методы математической статистики. Для интервальной шкалы и шкалы отношений используются одни и те же методы планирования и анализа эксперимента, и поэтому в дальнейшем они не будут дифференцироваться. В дальнейшем будем пользоваться термином «количественная шкала».

Основы математической обработки информации 18 Шкала Бине Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по успешности выполнения тестовых заданий. Испытание начиналось с определения тестовых заданий, соответствующих хронологическому возрасту ребенка. Если он справился со всеми заданиями, то ему предлагались задания группы старшей по возрасту. Если он решал не все, а некоторые из них, то испытание прекращалось. Если же ребенок не справлялся со всеми заданиями своей возрастной группы, то ему давались задания, предназначенные для более младшего возраста. Испытания проводились до тех пор, пока не выявлялся возраст, все задания которого решаются испытуемым.

Основы математической обработки информации 19 Процедура вычисления в шкале Бине Максимальный возраст, все задания которого решаются испытуемым, называют базовым умственным возрастом. Если, кроме того, ребенок выполнил также некоторое количество заданий, предназначенных для более старших возрастных групп, то каждое задание оценивалось числом «умственных месяцев». Тогда к числу лет, определяемых базовым умственным возрастом, прибавлялось и некоторое число месяцев. Число месяцев определяется прямо пропорционально числу решенных заданий для детей старшей возрастной группы. Если умственный образ меньше хронологического, то это считается показателем умственной отсталости, если умственный образ выше хронологического – то одаренности.

Основы математической обработки информации 20 Коэффициент интеллектуальности IQ В Стэндфордском университете было введено само понятие коэффициента интеллектуальности (IQ- intelligence quotient). Он определялся как умноженное на 100 частное, получаемое при делении умственного возраста на хронологический. Ввод этого коэффициента позволял учитывать то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных групп имеет неодинаковое значение. Показатель умственного возраста этот важный аспект не учитывает. В результате коэффициент интеллектуальности позволил оценивать детей по степени умственного развития.

Основы математической обработки информации 21 Рекомендуемая литература 1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. – М.: Издательство «Прогресс», с. 2. Маслак А.А. Основы планирования и анализа сравнительного эксперимента в педагогике и психологии. – Курск: РОСИ, – 167 с. 3. Анисимова Т.С. Измерение латентных переменных в образовании. - М.: Исследовательский центр проблем качества подготовки специалистов, – 148 с. 4. Маслак А.А. Измерение латентных переменных в социально-экономических системах. – Славянск-на-Кубани: Изд-во СГПИ, – 333 с.

Основы математической обработки информации 22 Введение в понятие эксперимента. Экспериментальные данные. В древности было три источника информации: - религия; - мнение авторитетов; - эксперимент. «Статистическое мышление станет такой же необходимостью в жизни как умение читать и писать» Герберт Уэллс «Есть маленькая ложь, есть большая ложь, а есть еще и статистика»

Основы математической обработки информации 23 Ошибка в статистических исследованиях. Перед ошибками захлопываем дверь. В смятенье Истина: «Как я войду теперь?» Рабиндранат Тагор «Сотри случайные черты - и ты увидишь: мир прекрасен» А.Блок Жизнь – это школа вероятности. Наиболее важный принцип экспериментирования «рандомизация» состоит в том, что случайность намеренно вносится в эксперимент.

Основы математической обработки информации 24 Виды ошибок 1. Случайные 2. Систематические 3. Грубые (выбросы)

Основы математической обработки информации 25 Случайные ошибки Случайные ошибки – это ошибки, возникающие под воздействием очень большого числа факторов, эффекты действия которых столь незначительны, что их нельзя выделить и учесть в отдельности. Любой опыт содержит в себе некоторый элемент случайности, т.е. изменчивость получаемых данных обусловлена в какой-то степени неизвестными нам причинами – случайными ошибками.

Основы математической обработки информации 26 Свойства случайных ошибок Характерная особенность случайных ошибок – их тенденция взаимно погашаться в результате приблизительно одинаковой вероятности как положительных, так и отрицательных значений, причем малые значения встречаются чаще, чем большие. Благодаря такой тенденции к взаимному погашению разнонаправленных случайных ошибок при вычислении средних значений признаков погрешности уменьшаются по мере увеличения числа наблюдений.

Основы математической обработки информации 27 Что делать со случайными ошибками? Случайные ошибки являются неизбежными, однако математическая статистика дает методы количественного определения величины случайных ошибок (на основании некоторых известных законов распределения). В результате на фоне ошибок можно определить насколько существенны различия между теми или иными исследуемыми объектами.

Основы математической обработки информации 28 Систематические ошибки Систематические ошибки искажают измеряемую величину в сторону преувеличения или преуменьшения в результате действия вполне определенной постоянной причины. В полевом опыте такой причиной часто является закономерное варьирование не изучаемых факторов и элиминировать их действие на исследуемый признак можно путем выбора соответствующего плана эксперимента.

Основы математической обработки информации 29 Свойства систематических ошибок Основную особенность систематических ошибок составляет их однонаправленность, т.е. они завышают или занижают результаты опыта. Это приводит к тому, что такие ошибки в отличие от случайных не имеют свойства взаимопогашения и, следовательно, входят как в отдельные наблюдения, так и в среднее значение исследуемого показателя.

Основы математической обработки информации 30 Грубые ошибки Возникают чаше всего в результате нарушения основных требований к эксперименту, недосмотра или небрежного и неумелого выполнения работ. Например, исполнитель мог по небрежности неправильно записать результаты и т.д. Подобные ошибки ни при каких условиях не могут быть «погашены» или компенсированы Избежать грубых ошибок можно только продуманной, тщательной организацией и проведением эксперимента.

Основы математической обработки информации 31 Анализ и группировка первичных данных Обработка начинается с упорядочения собранных данных (соблюдая правило однородности состава выборки), систематизации выраженных числами фактов, с тем чтобы извлечь заключенную в них информацию. Процесс систематизации, или упорядочения, первичных биометрических данных в целях извлечения заключенной в них информации, обнаружения закономерности, которой следует изучаемое явление или процесс, называется группировкой.

Основы математической обработки информации 32 Группировка первичных данных Группировка исходных данных может быть разной в зависимости от того, с какой целью и по каким признакам она проводится. Наиболее приемлемой формой группировки являются статистические таблицы. Обычно в таблицах приводятся и общие итоги в виде сумм или усредненных показателей, а также в процентах от численности вариант в группах и во всей группировке в целом.

Основы математической обработки информации 33 Определение математической статистики Статистика это наука, которая позволяет увидеть закономерности в хаосе случайных данных, выделить устойчивые связи в них, определить наши действия с тем, чтобы увеличить долю правильно принятых решений среди всех принимаемых нами. Поэтому говорят еще так: закономерности – это язык бога. Другое определение: Есть маленькая ложь, есть большая ложь, а есть еще и статистика.

Основы математической обработки информации 34 Определение математической статистики Как все математические науки, статистика родилась из потребностей практики: подобно тому, как древние египтяне после разливов Нила вынуждены были заново измерять свои участки и для этого разработали начала геометрии, так и мы, окруженные хаотическими данными, вынуждены анализировать их. Конечно, мы стремимся интуитивно сузить пределы случайного, максимально сократить рамки неопределенности.

Основы математической обработки информации 35 Актуальность изучения основ введения в понятие эксперимента Основным недостатком нынешних образовательных стандартов является неумение выпускников решать прикладные задачи, прежде всего требующих применения статистических методов. В западных вузах гораздо больше курсов по математической статистике и им отводится больше часов. До появления мощных ЭВМ, практическое применение статистических методов было чрезвычайно сложным, требующим больших интеллектуальных усилий и временных затрат, делом.

Основы математической обработки информации 36 Происхождение математической статистики У математической статистики два родителя: Мать – это государственная статистика, необходимая для представления отчетов Отец – это честный карточный игрок, который полагался на математику при выборе игровых стратегий

Основы математической обработки информации 37 Происхождение математической статистики Классическим является пример Шевалье де Мере: стоит ли ему ставить на выпадение двух шестерок одновременно при бросании двух костей 24 раза или нет? Его собственные вычисления показали, что стоит, так как вероятность данного события при 24 бросаниях костей больше 1/2. Однако он постоянно оказывался в проигрыше! Паскаль правильно вычислил вероятность данного события (0,49). Современное взаимодействие статистики с практикой: применяя статистические методы, найти закономерности в случайных данных и воспользоваться найденными закономерностями.

Основы математической обработки информации 38 Что общее и в чем различие между теорией вероятностей и математической статистикой? Общее. И тот и другой раздел изучает случайные события. Различие. В теории вероятностей предполагается, что истинные вероятности событий известны, необходимо найти вероятности функций от этих событий. Например, вероятность выпадения «орла» равна 0,5. Определить вероятность выпадения 9 орлов в 10 бросаниях.

Основы математической обработки информации 39 Что общее и в чем различие между теорией вероятностей и математической статистикой? В математической статистике истинные значения неизвестны. Есть только данные наблюдений или эксперимента. По этим данным необходимо определить истинные значения. Например, есть данные наблюдений по двум методам обучения. Необходимо определить есть ли статистически значимое различие между этими методами обучения.

Основы математической обработки информации 40 Основные задачи математической статистики 1. Определение статистического значимого различия между массивами 2. Нахождение оптимальных условий функционирования объекта 3. Планирование эксперимента - выбор числа опытов и условий их проведения, необходимых и достаточных для решения задачи с требуемой точностью)

Основы математической обработки информации 41 Основные понятия математической статистики 1. Выборка 2. Совокупность 3. Ошибка первого рода 4. Ошибка второго рода 5. Нормальное распределение 6. Минимально значимое различие 7. Нулевая гипотеза 8. Альтернативная гипотеза 9. Точечная оценка 10. Доверительные интервалы

Основы математической обработки информации 42 Основные статистические критерии 1. Критерий Стьюдента (t-критерий) 2. Критерий Фишера (F-критерий) 3. Критерий Хи-квадрат 4. Непараметрические критерии (критерий Вилкоксона, ранговые критерии, рандомизированные критерии)

Основы математической обработки информации 43 Примеры некорректных статистических выводов 1. «Курение влияет на заболеваемость раком легкого» 2. «Бег трусцой укрепляет здоровье» 3. «Детей приносят аисты»

Основы математической обработки информации 44 Рекомендуемая литература 1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2004, 479 с. 2. Кимбл Г. Как правильно пользоваться статистикой. Пер. с англ. – М.: Финансы и статистика», с. 3. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. – М.: Издательство «Прогресс», с. 4. Маслак А.А. Основы планирования и анализа сравнительного эксперимента в педагогике и психологии. – Курск: РОСИ, – 167 с.