КАК ПРИМЕР КОЛИЧЕСТВЕННОГО ПОДХОДА К ИЗМЕРЕНИЮ ИНФОРМАЦИИ Метод корреляции.

Презентация:



Advertisements
Похожие презентации
Измерение информации Кононова О.В Информация - новые сведения, позволяющие улучшить процессы, связанные с преобразованием вещества,
Advertisements

Выполнил: ученик МБОУ СОШ 55 9 «Г» класса Тройнин Владислав. Руководитель: учитель математики Калинина Ирина Викторовна.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Лабораторная работа 6 Обработка результатов эксперимента в MathCad.
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Использование нейросимулятора при определении внешнего вида ребенка по параметрам родителей.
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. СТАТИСТИЧЕСКАЯ ОЦЕНКА.
ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
Оценка случайных погрешностей прямых многократных измерений. (Математическая часть).
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Метод Ньютона: 1- и 2-я интерполяционные формулы Ньютона.
Метод наименьших квадратов. Количественный анализ Проведение количественного анализа, как правило, включает в себя построение графика по данным, найденным.
Корреляционные зависимости. Регрессионная модель это функция, описывающая зависи- мость между количественными характеристиками сложных систем. это функция,
Что такое научное исследование?. Что такое исследование? Исследование – это научное познание предметов и явлений окружающего мира. Наука – это особая.
Регрессионные модели Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками сложных систем. График регрессионной.
Кафедра математики и моделирования Старший преподаватель Е.Г. Гусев Курс «Высшая математика» Лекция 15. Тема: Случайные величины и их числовые характеристики.
МОНИТОРИНГ СОСТОЯНИЯ ЭКОНОМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ АНАЛИЗА ДИНАМИКИ ЭНТРОПИИ А.Н. Тырсин 1, О.В. Ворфоломеева 2 1 – НИЦ «Надежность и ресурс больших систем.
Исследовательская работа Автор презентации - к.п.н., замдиректора по НМР ГБОУ лицей 82 Модестова Т.В.
Анализ данных Лекция 5 Методы построения математических функций.
Транксрипт:

КАК ПРИМЕР КОЛИЧЕСТВЕННОГО ПОДХОДА К ИЗМЕРЕНИЮ ИНФОРМАЦИИ Метод корреляции

Математико-статистический анализ числовых характеристик исторических текстов: общ. подход 1. формулируется статистическая гипотеза для моделирования какого-либо процесса - например, утери информации с течением времени. 2. вводятся числовые коэффициенты, позволяющие количественно измерять отклонения экспериментальных кривых от предсказанных теоретически 3. математико-статистическая модель проверяется на заведомо достоверном историческом материале 4. если она подтверждается, то методику можно использовать для датировки событий

ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ Пусть исторический период от года A до года B в истории региона P описан в летописи X, разбитой на куски (главы) X(T), каждый из которых посвящен событиям одного года T Подсчитаем объем всех кусков X(T), т. е. число страниц или строк в каждом X(T) Полученные числа изобразим в виде графика объемов, отложив по горизонтали годы T, а по вертикали - объемы глав функция объема данной летописи X vol X(T)

Для другой летописи Y, описывающей те же события, график объемов будет иметь иной вид (скажутся интересы и склонности летописцев X и Y - одно и то же событие может быть описано разным количеством слов и разными словами) Насколько существенны эти различия? Есть ли что-то общее в графиках объемов текстов, рассказывающих об одних и тех же событиях?

Существенная характеристика всякого графика - его ПИКИ, экстремальные точки Обозначим через C(T) объем всех текстов, написанных о годе T его современниками. Это – «первоначальный фонд» информации. Его график нам точно неизвестен, поскольку тексты постепенно утрачиваются, гибнут

Сформулируем модель потери информации ОТ ТЕХ ЛЕТ, КОТОРЫМ ПЕРВОНАЧАЛЬНО БЫЛО ПОСВЯЩЕНО БОЛЬШЕ ТЕКСТОВ, БОЛЬШЕ ТЕКСТОВ И ОСТАНЕТСЯ

Фиксируя какой-то момент времени M (справа от точки B) можем выстроить график C M (T), показывающий объем текстов, которые "дожили" до момента времени M и описывают события года T C M (T) - это остаточный (сохранившийся) фонд информации, который дошел от эпохи (A,B) до года M Модель может быть переформулирована: график C M (T) должен иметь всплески примерно в те же годы (на интервале (A,B)), что и исходный график C(T) Разумеется, проверить модель в таком ее виде трудно, поскольку график C(T) первоначального фонда информации нам сегодня не известен, но одно из следствий проверить можно

Более поздние хронисты X и Y, описывая один и тот же период (A,B) (и не будучи его современниками), вынуждены опираться на сохранившийся до их времени фонд информации (текстов) от эпохи (A,B) Если хронист X живет в эпоху M, то он будет опираться на фонд C M (T) Если хронист Y живет в эпоху N (отличную от M), то он опирается на сохранившийся фонд C N (T)

Ожидается что "в среднем" хронисты работают более или менее добросовестно, а потому они должны более подробно описать те годы (из эпохи (A,B)), от которых до них дошло больше информации (текстов) График объемов vol X(T) будет иметь всплески примерно в те годы, где имеет всплески график C M (T) График vol Y(T) будет иметь всплески примерно в те годы, где делает всплески график C(T) Точки всплесков графиков C M (T), C N (T) близки к точкам всплесков исходного графика C(T) Следовательно, графики vol X(T) и vol Y(T) должны делать всплески примерно одновременно, т.е. точки их локальных максимумов должны коррелировать (при этом, конечно, амплитуды графиков могут быть существенно различными)

Окончательно наш принцип корреляции максимумов звучит следующим образом: Если тексты (хроники) X и Y зависимы (т.е. описывают примерно одни и те же события на одном и том же интервале времени (A,B) в истории одного и того же региона), то точки локальных максимумов их функций объемов должны коррелировать (рис. а) Если тексты (хроники) X и Y независимы (т.е. описывают существенно разные исторические периоды или разные регионы), то точки локальных максимумов их функций объемов не коррелируют (рис. б)

графики объемов глав для зависимых текстов должны делать всплески одновременно (т.е. годы, подробно описанные в X и подробно описанные в Y, должны совпадать или быть близкими) если тексты независимы, то графики объемов достигают локальных максимумов в разных точках (после совмещения двух описываемых в них периодов времени)

Выводы: Например, если при сравнении двух династий царей будет обнаружена зависимость времен их правлений (т.е. соответствующие графики периодов правлений чрезвычайно близки), то это можно интерпретировать: 1.намеренное подражание летописца некоему авторитетному образцу 2.дубликаты, которые в свое время не были распознаны (хронологами) как тождественные, об одном и том же говорящие тексты и были отнесены к разным историческим периодам Методика применима не только для датирования событий. Она позволяет обнаруживать в сравниваемых текстах разнообразные заимствования, повторы, литературные штампы, цитирования, параллели