Использование методов статистического анализа для определения авторства спорного произведения Номинация: Инновационные технологии 21 века Белорусский государственный.

Презентация:



Advertisements
Похожие презентации
РАСПРЕДЕЛЕНИЕ УЧАСТНИКОВ ККР-2011 ПО ТИПАМ ОБРАЗОВАТЕЛЬНЫХ УЧРЕЖДЕНИЙ Тип ОУДоля учащихся в общем количестве участников ККР-2011 СОШ115/72% ООШ35/22% НОШ9/6.
Advertisements

Анализ ЕГЭ-2012 общестознание.. В экзаменационной работе по обществознанию образца 2012 года, содержалось 37 заданий. Из них 20 заданий части 1 (часть.
Работа учащегося 7Б класса Толгского Андрея. Каждое натуральное число, больше единицы, делится, по крайней мере, на два числа: на 1 и на само себя. Если.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Предмет и методы Лекция 2.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Технология исследовательской деятельности в практике обучения слепых и слабовидящих детей по ФГОС второго поколения ГБС(К)ОУ школа-интернат 1 им. К.К.Грота.
Биостатистика: определение основной тенденции и дисперсии в условиях медицинской лабораторииииии.
Информатика ЕГЭ Уровень - А3.
* умения, лежащие в основе читательской компетенции (чтение и понимание письменных текстов); * умения по работе с информацией (понимание информации, представленной.
Анализ вербального поведения: применение и методы Москва, Россия Октябрь 2013 г. Адам Дрейфус Adam Dreyfus, BCBA, LBA
ОГЭ 2014 год - 9 класс.Часть 3 Сочинение на лингвистическую тему Подготовил преподаватель русского языка и литературы Мальчихина М.В.
Помазаная Е. В., учитель начальных классов МОУ СОШ 2 г. Ясный Оренбургской области Сложение двузначных чисел математика УМК «Гармония» 2 класс.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Лекция Маркетинговые методы изучения информационных потребностей.
Система работы начальной школы над повышением качества обучения по литературному чтению. Занятие школы-лаборатории. Ново-Харитоновская средняя общеобразовательная.
Статистические показатели Основная категория статистики – статистический показатель. Статистический показатель представляет собой результат обобщения информации.
ЕГЭ по русскому языку: как писать сочинение Задание С.
ПРЕСС-КОНФЕРЕНЦИЯ ПО РЕЗУЛЬТАТАМ ИССЛЕДОВАНИЯ «МЕДИАФОКУС» ИНСТИТУТА «УРАЛИНСО» 16 АПРЕЛЯ 2010 ГОДА 1 16 апреля 2010 года УРОВЕНЬ ДОВЕРИЯ ЖИТЕЛЕЙ ГОРОДА.
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Транксрипт:

Использование методов статистического анализа для определения авторства спорного произведения Номинация: Инновационные технологии 21 века Белорусский государственный технологический университет Подготовил: студент 5 курса 6 группы факультета издательского дела и полиграфии Добровольский Владимир Вячеславович

История спора двух поэтов Нил Гилевич Микола Аврамчик

В конце лета 2003 года в газете «Народная воля» выходит статья Нила Гилевича «Як быў напісаны Сказ пра Лысую гару», в которой он признается в том, что написал «Сказ…» под впечатлением от рассказов Миколы Аврамчика о житии коллег, осваивающих дачные наделы. Причем народный поэт Беларуси утверждает, что вся творческая работа от зарождения идеи до собственно сочинения, редактирования и правки принадлежит только ему.

Однако Микола Аврамчик от своего участия в создании поэмы отказываться не намерен: «Мы же все вместе рифмовали, есть только несколько моментов, которые писали раздельно». Таким образом наше исследование направлено на установление авторства данного произведения.

Контент-анализ Понятие «контент-анализ», согласно общепринятой точки зрения, предполагает анализ содержания текста. Но это не совсем точно, т.к. контент-анализ не занимается собственно смыслом, а исключительно частотным распределением смысловых единиц в тексте, или по другому анализом статистических закономерностей частотного распределения смысловых единиц в тексте.

Дискриминационный анализ Дискриминационный (дискриминантный) анализ используется в том случае, если имеются данные, классифицированные на несколько групп, и необходимо найти одну или более функций количественных измерений, которые помогут отнести наблюдения к одной из этих групп.

В работе для исследования была использована программа статистического анализа текста Super Counter. В качестве исходного материала (обучающие выборки) было использовано 71 стихотворение Нила Гилевича и 67 стихотворений Миколы Аврамчика.

В качестве выходных параметров были использованы: Средняя длина слов в слогах Средняя длина слов в буквах Средняя длина слов по Деверу Процент слов в 2 слога и более Соотношение процента слов в 5 слогов к проценту слов в 3 слога Процент односложных слов Средняя длина предложения в словах Средняя длина предложения в слогах Процент неповторяющихся слов в тексте Процент личных местоимений в тексте Процент не личных местоимений в тексте Процент предлогов в тексте

Полученные данные были обработаны при помощи программы StatGraphicPlus с целью получения линейной дискриминантной функции решающего правила.

Как следует из таблицы общая степень правильно классифицируемых объектов составило 85,3%, причем по первой группе (Аврамчик) доля правильно классифицируемых составляет 85,9%, а по второй (Гилевич) 84,5%. Classification Table Actual Group Predicted number number Size (85,92%) ( 14,08%) (15,52%) ( 84,48%) Percent of cases correctly classified: 85,27%

В результате применения классифицирующих функций к объекту исследования было установлено, что классифицирующая функция Y2 (Гилевич) 1825,456 больше чем функция Y1 (Аврамчик) 1823,721. Следовательно можно утверждать, что при использовании линейной дискриминантной функции данное произведение принадлежит Нилу Гилевичу.

В таблице приведены результаты классификации методом «Дерево решений». Очевидно, что общий процент правильно классифицируемых объектов составляет 91,3%, причем по первой группе (Аврамчик) доля правильно классифицируемых составляет 97,2%, а по второй (Гилевич) 85,1%. Classification Observed Predicted 1,002,00 Percent Correct 1, ,2% 2, ,1% Overall Percentage 57,2%42,8%91,3%

Дерево решений Используя полученное дерево решений, мы привели соответствующую классификацию поэмы «Сказ пра Лысую гару». В результате, с вероятностью 90% можно утверждать, что данное произведение принадлежит Нилу Гилевичу.

Таким образом, при исследовании спорного произведения «Сказ пра Лысую гару» по всем вышеперечисленным методикам, можно утверждать, что данная поэма принадлежит известному белорусскому поэту Нилу Гилевичу.