Лингвистическая модель для компьютерного анализа тональности публикаций СМИ Ермаков А.Е., Киселев С.Л. ООО Гарант-Парк-Интернет и партнеры (

Презентация:



Advertisements
Похожие презентации
Метод определения эмоций в текстах на русском языке Анна Пазельская, Алексей Соловьёв
Advertisements

Онтологический инжиниринг в системах извлечения знаний из текста Александр Ермаков, ООО «ЭР СИ О» опыт.
ВВОДНЫЕ КОНСТРУКЦИИ В ХУДОЖЕСТВЕННОМ ТЕКСТЕ (НА ПРИМЕРЕ ПРОЗЫ А.С. ПУШКИНА ) Автор: Миронова Ольга, ученица 9 «А» класса ГБОУ СОШ 3 г. Новокуйбышевска.
Диссертация на соискание учебной степени кандидата педагогических наук Соискатель Аштиани мадждабади Наргес Научный руководитель: доктор педагогических.
Сказуемое Знать: способы выражения сказуемого. Знать: способы выражения сказуемого. Уметь: находить грамматическую основу предложения, где сказуемое выражено.
Что значит сформулировать авторскую позицию? Это значит самим понять, а потом изложить авторскую идею, авторскую позицию, то есть осознать и сформулировать:
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Г.С.Осипов,И.В.Смирнов,И.В.Соченков,А.О.Шелманов, А.В.Швец Институт системного.
Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН.
Подход к автоматическому извлечению информации о назначениях и отставках лиц ( на материале новостных сообщений ) © Н. А. Власова Институт Программных.
Как представлять опыт работы учителя. Обобщение педагогического опыта это всегда анализ и синтез информации, полученной в результате изучения; её отбор,
Особенности педагогической работы с застенчивыми детьми старшего дошкольного возраста.
СЕТЕВАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ЛЕКЦИЯ (С): Доц., к.т.н. Шкаберин В.А. Брянский государственный технический университет Кафедра «Компьютерные технологии.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Гибкость в управлении обучением Ядыкин Иван Юрьевич, Лицей 393, 11в класс , Санкт-Петербург, ул. Новостроек д.т ,
Особенности использования мониторинговых систем в современных условиях Артамонов Иван Олегович TitanInfo руководитель проекта.
Комплексная технология автоматической классификации текстов ИПИ РАН Васильев В.Г.
5. Синтаксические нормы. Порядок слов Прямой порядок слов в русском языке: тема (данное) + рема (новое) Рема + тема – обратный порядок слов / инверсия.
Методика оценки психологической атмосферы в коллективе по Фреду Фидлеру и адаптированная Ю. Ханиным Приготовил Кочин Лев Александрович, на примере анализа.
Транксрипт:

Лингвистическая модель для компьютерного анализа тональности публикаций СМИ Ермаков А.Е., Киселев С.Л. ООО Гарант-Парк-Интернет и партнеры (

Компьютерный анализ тональности публикаций СМИ Исходная постановка задачи: определить, позитивный или негативный образ объекта хочет сформировать у читателя автор публикации СМИ. Способы выражения тональности Тональные элементы текста (слова, синтагмы) - несут в себе оценочную семантику: превосходный, бессовестно, робкие действия, медлительность, олигарх, режим, бюрократизация, наглеть. Эмоционально-коннотативные элементы текста - при восприятии вызывают эмоциональную реакцию вида хорошо/плохо. Это синтагмы, содержащие в себе событийный предикат с его распространителем: борьба с преступностью, повышение цен, пенсионеры голодают. Конструктивная постановка задачи 1. Распознавание всех упоминаний о целевом объекте в тексте; 2. Отсев и синтаксический разбор тех конструкций, в которых отражаются все ситуации (события и признаки), связанные с целевым объектом; 3. Выделение тех пропозиций, в которых явно выражается тональность, и тех пропозиций, которые описывают эмоционально-коннотативные ситуации; 4. Для каждой пропозиции принятие решения о тональности позитив/негатив с учетом тех мест, которые занимают в ее составе эмоционально-коннотативные, тональные и нейтральные слова, средства выражения отрицания; 5. Утилизация результатов анализа отдельных пропозиций.

Компьютерный анализ тональности публикаций СМИ Классификация пропозиций, значимых для оценки тональности Отбор пропозиций – синтаксический анализ предложения, поиск в сети синтактико- семантических отношений всех подсетей, изоморфных заданным лингвистических схемам. Типовые пропозиции для выражения явной тональной характеристики 1. Логическая пропозиция полная или свернутая: Петров – плохой руководитель; власть становится защитницей преступности; циничность власти. Тональность выражается именной группой, образуемой существительным. 3. Логическая пропозиция свернутая с прилагательным: нерешительный президент; президент нерешителен. Тональность выражается прилагательным. 4. Свернутая логическая пропозиция в составе событийной, отражающая оценку события, в котором целевой объект выступает в роли протагониста: Петров бездумно согласился; президент принял авантюрное решение; власть обнаглела. Тональность может выражаться наречием при глаголе, прилагательным при событийном существительном, самим глаголом.

Компьютерный анализ тональности публикаций СМИ Типовые пропозиции для выражения эмоционально-коннотативной характеристики 1. Событийная пропозиция полная или свернутая, в которой роль Протагониста занимает целевой объект: власть борется с олигархами; президент ведет борьбу с коррупцией, борьба президента за права народа. Тональность складывается из семантики именной группы в роли Объекта и семантики Предиката по принципу положительное отношение к положительному - позитив и наоборот. Если эмоциональный коннотат Объекта или Предиката не определен, тональность нейтральна (президент встретился с олигархами, Иванов борется с сорняками на даче). 2. Событийная пропозиция полная или свернутая, в которой роль Объекта занимает целевой объект: олигархи испугались президента, страна выражает недоверие к власти, ненависть преступников к власти. Если семантика Протагониста имеет положительный эмоциональный коннотат, общая тональность складывается по тому же принципу, что и в (1). Если же семантика Субъекта имеет отрицательный коннотат, то общая тональность не определена: олигархи полюбили президента (да мало ли за что?). Классификация пропозиций, значимых для оценки тональности

Компьютерный анализ тональности публикаций СМИ Методика принятия решения о тональности Проблема: участник пропозиции, семантику которого необходимо оценить, может выражаться другой свернутой пропозицией или содержать показатели отрицания: президент якобы успешно борется не с плохими олигархами. Какова тональность? Принцип доминанты негатива: При наличии хотя бы одного слова с негативной тональностью общая тональность участника негативна; иначе общая тональность позитивна, если присутствует хотя бы одно слово с позитивной тональностью. Пример: плохой руководитель, гениальный авантюрист – негатив, хороший руководитель, гениальный человек – позитив. Учет отрицания Показатели отрицания – частицы, наречия, глаголы: власть слишком медленно пытается укрепиться, президент якобы не отказался повысить пенсии. Четное количество показателей отрицания на слове эквивалентно отсутствию такового (якобы мало борется = борется), а нечетное есть отрицание (якобы не безуспешно борется = безуспешно борется). При наличии показателя инверсии на целевом объекте – инверсия тональности всей пропозиции (не президент разоряет пенсионеров)

Компьютерный анализ тональности публикаций СМИ Выводы 1.Негатив выделяется достаточно достоверно. 2.Позитив выделяется плохо - часто оказывается скрытым негативом, иронией, особенно при анализе текстов из желтой прессы. В целом по тексту один негатив обычно перечеркивает весь позитив. 3.Предложенная лингвистическая модель в основном полна. Ошибки оценки тональности в большей степени определяются ошибками синтаксического разбора текста, нежели неучтенными в рамках модели факторами. 4.За рамками модели остались способы выражения тональности, не поддающиеся формализации: Между масками Ельцина и Путина выступает Смерть с косой - символ этих десяти лет. 5.Основной утилитарный результат - не подсчет соотношения хвалят/ругают, а формирование частотного портрета всех позитивных и негативных событий, связываемых в тексте (прямо или ассоциативно) с объектом. Не столь важно узнать, где и как хвалят или ругают, важнее узнать - за что?