И ЗВЛЕЧЕНИЕ ИНФОРМАЦИИ ИЗ СПОРТИВНЫХ НОВОСТЕЙ Жеребцова Ю. Ионов М. Перфилова Д. Тупикина Л. Фадеева М. Филимонов Е.
Э ТАПЫ Сбор лингвистических ресурсов Составление списка ключевых слов Проектирование БД Парсинг Википедии Предварительная работа с новостями Классификация новостей по видам спорта (футбол, хоккей, баскетбол, волейбол) Стемминг Индексация Работа с запросами
Л ИНГВИСТИЧЕСКИХ РЕСУРСЫ Создание и отладка списков ключевых слов Список общеспортивных слов *: шииты, Пентагон и китайцы Веса Парсинг Википедии Команды Стадионы Города
П РЕДВАРИТЕЛЬНАЯ РАБОТА Скрипт классификации Python Прогонка полученного текста через MyStem Извлечение фактов RegEx Заполнение БД SQLite
З АПРОСЫ Деление запроса на токены Поиск каждого токена в БД в списках команд, и стадионов Извлечение из БД событий с выделенными свойствами Генерация ответа
С ПАСИБО ЗА ВНИМАНИЕ