Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемkat-sysoeva.narod.ru
1 Тема работы: ИС лингвистического анализа заимствования в наборах текстовых файлов на примере пояснительных записок к дипломным работам. Сысоева Е. гип-102
2 Создаём в word макрос, который обрабатывает тексты пояснительных записок и сравнивает их между собой. Данный макрос выдаёт общее кол-во предложений, содержащихся в заданных пояснительных записках, также выдаёт кол-во одинаковых предложений, встречающихся и в обоих документах и подсчитывает % схожести документов, те на сколько % один документ похож на другой.
3 Выберем для примера главы 3 «экономические показатели» из 2-ух пояснительных записок. Сравнивая эти главы в двух разных пояснительных записках мы получим: Результат работы макроса: doc1 256 предложений doc2 380 предложений 87 – общих предложений 33, % процент схожести, т. е. насколько один документ похож на другой.
4 Сравним последовательно все главы записки 1 со всеми главами других пояснительных записок.
5 Аналогично все главы записки 2 сравним со всеми главами других пояснительных записок. И все главы записки 3 со всеми главами других пояснительных записок.
6 Проанализируем полученные результаты. Сравним 3 дипломных работы. Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Записка 1 Записка 2 Записка 3 Гл1 Гл2 Гл3 Гл4 Записка1Гл ,9%14,1% Записка1Гл ,00%11,70% Записка1Гл ,90%74,40% Записка1Гл ,00%9,60% Записка2Гл ,50%-15,30% Записка2Гл ,40%-8,10% Записка2Гл ,30%-50,20% Записка2Гл ,80%-17,60% Записка3Гл1 5548%15%- Записка3Гл % - Записка3Гл %51%- Записка3Гл %11%-
7 Например, 14,1 % показывает, что гл. 1 записки 1 явл-ся наименее схожей с гл.1 записки 3. Это минимальный процент схожести по данной главе. 41,9 % показывает, что гл.1 записки 1 явл-ся максимально схожей с гл.1 записки 2. 28,0 % - это средняя схожесть гл. 1 док -та 1 с гл. 1 других документов. minсредmax 14,1%28,0%41,9% 11,7%21,4%31,0% 66,9%70,7%74,4% 9,0%9,3%9,6% 15,3% 22,5% 8,1%15,3%22,4% 42,3%46,3%50,2% 17,6%19,2%20,8% 8,0%15,0% 2,0% 48,0%49,5%51,0% 11,0%12,5%14,0% minсред Средне взвешен ноеmax Записка19,0%32,3%38,7%74,4% Записка28,1%24,9%30,0%50,2% Записка32,0%18,9%20,7%51,0% 9,0 % - из 4-ёх глав записки 1 минимально схожи гл. 4 записки 1 и записки 2. 74,4 % - из 4-ёх глав записки 1 максимально схожи гл.3 записки 1 и записки 3. 32,3 % - средний % схожести всех глав записки 1 со всеми главами других записок. 38,7 % - средневзвешенный % схожести при учёте того, что главы занимают неравные части в дипломе. Глава1: Системно-техническая часть. Глава2: Конструкторско-технологическая часть. Глава3: Экономические показатели. Глава4: Безопасность.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.