Тема работы: ИС лингвистического анализа заимствования в наборах текстовых файлов на примере пояснительных записок к дипломным работам. Сысоева Е. гип-102.

Презентация:



Advertisements
Похожие презентации
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Advertisements

1. Определить последовательность проезда перекрестка
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Маршрутный лист «Числа до 100» ? ? ?

Таблица умножения на 8. Разработан: Бычкуновой О.В. г.Красноярск год.
Разработал: Учитель химии, биологии высшей квалификационной категории Баженов Алексей Анатольевич.
(урок математики). Назовите числа, которые делятся на 3: (3, 6, 9, 12, 15, 18, 21, 24, 27, 30) Назовите числа, которые делятся на 4: (4, 8,12, 16, 20,
Школьная форма Презентация для родительского собрания.
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Курсы повышения квалификации (общие показатели в %)
1 Знаток математики Тренажер Таблица умножения 3 класс Школа России Масько Любовь Георгиевна Муниципальное общеобразовательное учреждение средняя общеобразовательная.
Златка Чардакова, 54 СОУ Св. Иван Рилски, София, /БАКУ, Азербайджан/
=8 3+5=8 8-3=5 8-5= И К У Л Т Н 4Л 4Л 40 У 45 Н 78 К 75 И 70 Т.
Информатика ЕГЭ Уровень А1.
Урок математики 2 класс. Решать примеры, задачи; Сравнивать числовые выражения; Смекать.
КЛАССКоличество учащихся Высокий уровень мотивации Средний уровень мотивации Средняя мотивация положительное отношение к школе Низкий уровень мотивации.
9, 12, 15,,, ; 8, 12, 16,,, ; На проводах сидело 25 ворон, а синиц на 8 больше. Сколько всего птиц сидело на проводах? 25+8=33(с.)
Типовые расчёты Растворы
Транксрипт:

Тема работы: ИС лингвистического анализа заимствования в наборах текстовых файлов на примере пояснительных записок к дипломным работам. Сысоева Е. гип-102

Создаём в word макрос, который обрабатывает тексты пояснительных записок и сравнивает их между собой. Данный макрос выдаёт общее кол-во предложений, содержащихся в заданных пояснительных записках, также выдаёт кол-во одинаковых предложений, встречающихся и в обоих документах и подсчитывает % схожести документов, те на сколько % один документ похож на другой.

Выберем для примера главы 3 «экономические показатели» из 2-ух пояснительных записок. Сравнивая эти главы в двух разных пояснительных записках мы получим: Результат работы макроса: doc1 256 предложений doc2 380 предложений 87 – общих предложений 33, % процент схожести, т. е. насколько один документ похож на другой.

Сравним последовательно все главы записки 1 со всеми главами других пояснительных записок.

Аналогично все главы записки 2 сравним со всеми главами других пояснительных записок. И все главы записки 3 со всеми главами других пояснительных записок.

Проанализируем полученные результаты. Сравним 3 дипломных работы. Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Гл1 Гл2 Гл3 Гл4 Записка1Гл ,9%14,1% Записка1Гл ,00%11,70% Записка1Гл ,90%74,40% Записка1Гл ,00%9,60% Записка2Гл ,50%-15,30% Записка2Гл ,40%-8,10% Записка2Гл ,30%-50,20% Записка2Гл ,80%-17,60% Записка3Гл1 5548%15%- Записка3Гл % - Записка3Гл %51%- Записка3Гл %11%-

Например, 14,1 % показывает, что гл. 1 записки 1 явл-ся наименее схожей с гл.1 записки 3. Это минимальный процент схожести по данной главе. 41,9 % показывает, что гл.1 записки 1 явл-ся максимально схожей с гл.1 записки 2. 28,0 % - это средняя схожесть гл. 1 док -та 1 с гл. 1 других документов. minсредmax 14,1%28,0%41,9% 11,7%21,4%31,0% 66,9%70,7%74,4% 9,0%9,3%9,6% 15,3% 22,5% 8,1%15,3%22,4% 42,3%46,3%50,2% 17,6%19,2%20,8% 8,0%15,0% 2,0% 48,0%49,5%51,0% 11,0%12,5%14,0% minсред Средне взвешен ноеmax Записка19,0%32,3%38,7%74,4% Записка28,1%24,9%30,0%50,2% Записка32,0%18,9%20,7%51,0% 9,0 % - из 4-ёх глав записки 1 минимально схожи гл. 4 записки 1 и записки 2. 74,4 % - из 4-ёх глав записки 1 максимально схожи гл.3 записки 1 и записки 3. 32,3 % - средний % схожести всех глав записки 1 со всеми главами других записок. 38,7 % - средневзвешенный % схожести при учёте того, что главы занимают неравные части в дипломе. Глава1: Системно-техническая часть. Глава2: Конструкторско-технологическая часть. Глава3: Экономические показатели. Глава4: Безопасность.