Оценка качества в задаче агрегирования новостных сообщений Михаил Маслов Версия 2005.01.23_01.

Презентация:



Advertisements
Похожие презентации
Ситуационная задача. Кейс-задача.. ШАНС НА УСПЕХ умение сотрудничать, способность к общению, жизни в обществе и участию в нем; способность решать проблемы,
Advertisements

РОМИП в 2004 году М.С. Агеев, НИВЦ МГУ Губин М.В., ИК «Кодекс» Добров Б.В., НИВЦ МГУ Кураленок И.Е., СПбГУ Некрестьянов И.С., СПбГУ Плешко В.В., Гарант-Парк-Интернет.
Инициативный проект Российского семинара по оценке методов информационного поиска (РОМИП)
1 Фактографическое аннотирование новостных сюжетов Лев Гершензон, Александр Головко
О СТРАТЕГИИ ПРОДВИЖЕНИЯ В УСЛОВИЯХ, КОГДА ПОИСКОВЫЕ СИСТЕМЫ МОГУТ УЧИТЫВАТЬ ТЫСЯЧИ ФАКТОРОВ ДЛЯ РАСЧЕТА РАНЖИРОВАНИЯ ПРОДВИЖЕНИЕ С ПОЛЬЗОЙ…
Курсовая работа «Восприятия веб-сайтов разработчиками и конечными пользователями: сходства и различия» Выполнил: Студент 4 курса д/о Зверев И. С. Научный.
Разработка пользовательских интерфейсов Выполнил: Бредихин Юрий Вячеславович студент 3 курса, 31-И группы Старый Оскол, 2015.
Говоря о двух последних «умениях» компьютера, необходимо помнить, что почти во всех существующих системах автоматического реферирования в качестве основных.
Кластеризация Кластеризация – это автоматическое разбиение элементов некоторого множества (объекты, данные) на группы (кластеры) по принципу схожести.
ПРОДВИЖЕНИЕ С ПОЛЬЗОЙ… для поисковых систем О стратегии продвижения в условиях, когда поисковые системы могут учитывать тысячи факторов для.
1 Термины и определения Муратова Елена Анатольевна.
1. Определение объекта исследования. 2. Установление предмета исследования. 3. Формирование цели. 4. Выдвижение научной гипотезы. 5. Формулировка задач.
ИССЛЕДОВАТЕЛЬСКИЙ ПРОЕКТ ШКОЛЬНИКА. Какими знаниями, умениями и навыками должен овладеть юный исследователь?
«Мониторинг качества дополнительного образования детей» «Мониторинг качества дополнительного образования детей» Разработано заместителем директора Ункуновой.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН Филиал Акционерного Общества «Национальный центр повышения квалификации «ӨРЛЕУ» «Институт повышения.
Семинар 2 Метод кейс-стади в образовании Разработка и использование кейсов в учебном процессе.
Учебная деятельность Учебная мотивация Учебная задача Учебные действия Контроль, переходящий в самоконтроль Оценка, переходящая в самооценку.
ДИДАКТИЧЕСКИЕ ПОДХОДЫ К СИСТЕМЕ ЗАДАНИЙ, СПОСОБСТВУЮЩИХ ФОРМИРОВАНИЮ ЕСТЕСТВЕННОНАУЧНОЙ ГРАМОТНОСТИ Богданова Н.Н., методист кафедры методики преподавания.
Савельева Елена Николаевна МАОУ гимназия 100, педагог - психолог.
+7 (495) Пользовательские сценарии – залог успешной работы Юрий Батиевский.
Транксрипт:

Оценка качества в задаче агрегирования новостных сообщений Михаил Маслов Версия _01

Задачи автоматических новостных агрегаторов (Google News, Яндекс.Hовости, Новотека) Основные задачи: Агрегирование: группирование новостных сообщений в сюжеты (topic detection) Выделение главных событий, т.е. ранжирование сюжетов Основные понятия: Событие (event) - нечто, происходящее в определенное время, в определённом месте, наряду со всеми необходимыми причинами и всеми неотвратимыми последствиями. Событийный сюжет (event-based topic) - отражение события в потоке новостных сообщений, т.е. набор новостных сообщений, посвященных соответствующему событию.

Методики и приложения Topic detection and Tracking научное сообщество, организовавшее новостные дорожки. Целевая аудитория -- профессиональные аналитики Есть ли измерение качества в виде дорожки -- есть Есть ли реально работающие приложения -- не похоже Новостные агрегаторы – Google News, Яндекс.Новости, Новотека) Целевая аудитория -- в основном массовая Есть ли "дорожка" -- нет Есть ли реально работающие приложения -- есть

Об асессорах в задаче агрегирования сюжетов Желательные качества асессоров Способность понять, относятся ли два новостных сообщения к одному событию – базовое умение асессора в этой задаче. Склонность к историческим исследованиям – корпуса текстов уже имеют возраст год-полтора Категории людей, имеющих дело с новостями Изготовители новостей –Писатели – репортеры и аналитики-комментаторы –Редакторы Аудитория –Нормальные люди, или обыватели –Интересующиеся, или пикейные жилеты Подходящие категории на роль асессоров – Либо Редакторы, либо Пикейные жилеты

Оценки в TDT Оценки в TDT для задачи агрегирования сюжета Основаны на сравнении с эталоном. Дополнительные определения Порождающее событие (seminal event) -- событие, инициирующее сюжет Правила интерпретации порождающих событий: –События классифицируется по типам: выборы, скандалы, происшествия, … : всего 11 типов –Для каждого типа событий описывается "типичный сценарий "

Этапы построения эталона в TDT 1. Составление случайной выборки сообщений (seed stories) –В TDT-2 выбрано 1600 сообщений из ~70 тыс., из них вручную выделено 60 порождающих сюжеты сообщений 2. Исследование и описание выбранных сюжетов –Выбор и описание порождающего события в форме "что произошло, где и когда; сопоставление ему правила интерпретации –Составление заголовка и аннотации сюжета 3. Отнесение новостных сообщений к к сюжетам: –в TDT-2: проход по сообщениям и отнесение каждого сообщения к одному из сюжетов ("метод грубой силы) –в TDT-3: проход по сюжетам; итеративный поиск с последовательными переформулированиями запросов

Проблемы TDT и его развитие Вложенность сюжетов – сюжет, порожденный одним событием, может оказаться частью другого – более общего сюжета. Решения – а) введение иерархии событий и сюжетов, б) организация поточной обработки событий (event threading) Перекрытие сюжетов – по опыту Яндекс.Новостей, это не очень заметная проблема Необходимость поддержки пользовательского исправления ошибок Необходимость не-причинно-следственных типов связей между сюжетами – типы связей: по персонам, организациям, времени, месту

Оценки новостной дорожки в РОМИПе – вариант 1 Попарный пулинг 1.Из ответов нескольких систем формируется выборка пар сообщений. 2.Пары даются асессорам для ответа на вопрос о принадлежности одному событию.

Оценки новостной дорожки в РОМИПе – вариант 2 Агломеративное построение многоверсионного эталона Автоматически строятся компактные группы близких сообщений, и асессоры оценивают сообщения каждой группы на принадлежность одному событию. Оценки на этом этапе не дублируются. Группы объединяются асессорами в сюжеты по принадлежности одному событию. Оценки на этом этапе дублируются, т.е. считается, что эталон не единственен. Проблемы 1.Проблема квалификации асессоров -- В TDT использовались специально обученные асессоры, которые работали долго, и все равно результаты плохие. У нас (в РОМИПе) асессоры набираются среди студентов. Поэтому качество сюжетов будет плохим, и согласованность оценок будет низкой. 2.Затратность построения инструментария для оценок

Оценки новостной дорожки в РОМИПе – вариант 3 Группирование вокруг лица сюжета Из ответов нескольких систем формируется выборка сюжетов, представленных лицами – сообщениями, описывающих конечное состояние сюжета. Версии сюжетов от систем объединяются по лицам. Асессоры должны оценить каждое сообщение сюжета на степень принадлежности к нему, основываясь на лице сюжета. Проблемы 1.Принцип сравнения с "лицом" сюжета может свести задачу агрегирования к поиску групп похожих документов. 2."Лица" сюжетов, по-видимому, будут порождать в оценках асессоров вложенные сюжеты. 3.При историческом исследовании удобнее отслеживать события с начала их развития, a не с конца. 4.Задача "озаглавливания" сюжетов для новостных агрегаторов имеет свою специфику. Соответствие заголовка содержанию сюжета – главный, но далеко не единственный фактор.

Заключение Есть дилемма между простотой методики оценок и качеством результата. По-видимому, надо найти какой-то разумный баланс.