Анализ эмоциональной окраски и тональности оценочных высказываний. Учет иерархий объектов и их свойств. Аспекты визуализации. www.semanticforce.net www.blueberryapi.com.

Презентация:



Advertisements
Похожие презентации
Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
Advertisements

Всеволод Гаврилюк CEO, SemanticForce 8 ноября 2013 Социальные сети: сплошной инфо-шум или эффективная экосистема для CRM процессов?
Анализ неявных предпочтений интернет-пользователей поисковой системы Агеев М.С. Лаборатория анализа информационных ресурсов НИВЦ МГУ им.М.В.Ломоносова.
Интегрум Монитор руководство пользователя. Интегрум Монитор отслеживания динамики упоминаний компаний по времени, регионам и типам изданий (теле/радио,
МОНИТОРИНГ СОЦИАЛЬНЫХ МЕДИА: Основные задачи и их решение Москва, 2011.
XXXIX Неделя науки СПбГПУ XXXIX Неделя науки СПбГПУ 2010 Визуальное редактирование запросов к поисковой системе с использованием онтологии WordNet А.Н.
29 ноября, 2011 SocialCRM: Зарубежный опыт. Локальные инструменты. Перспективы развития. Social Media Conference Moscow.
Автоматическое определение авторства Лидия Михайловна Пивоварова Системы понимания текста.
ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЕКТА ABBYY Оптическое распознавание и машинный перевод Давид Ян (ABBYY)
Количественные и качественные измерения в социальных-медиа Всеволод Гаврилюк, SemanticForce Алексей Карлов, Angel Relations Group.
Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках Новицкий А.В. Институт программных систем НАН Украины.
Информационно-поисковые системы. Сычев А.В. 1 Самоорганизация в сети Веб Воронежский государственный университет Факультет компьютерных наук Кафедра информационных.
Информационно-поисковые системы. Сычев А.В г. 1 Анализ гиперссылок при информационном поиске в Веб Воронежский государственный университет Факультет.
Современные направления интеллектуализации глобальной сети Интернет Сорокин Арсений Николаевич Вологда, 2008.
Инновационные проекты в области применения интеллектуальных моделей анализа данных Максим Щербаков к.т.н., доцент каф. САПР и ПК
Интеграция «Битрикс: Управление сайтом» и «1С: предприятие» Вопросы и проблемы.
" Creating clarity in a world awash in data... " Интеллектуальный анализ данных (Data mining)
Нужны ли (и возможны ли) "честные" оценки лингвистических подходов и прикладных систем.
Бакеев Александр Партизанский маркетинг как средство сбора обратной связи и развития бизнеса.
Бренд мониторинг и социальная аналитика
Транксрипт:

Анализ эмоциональной окраски и тональности оценочных высказываний. Учет иерархий объектов и их свойств. Аспекты визуализации. SemanticForce 25 октября 2014 AI UKRAINE'14 Мне нравится Apple. Я хочу купить себе новый IPad. Когда он выходит? Тональность Компания Вопрос Продукт Намерение

Анализ оценочных высказываний Примеры автоматического анализа Проблемы визуализации Масштабирование ©2014 SemanticForce Inc. | |

SemanticForce Online Media Monitoring, Analysis & Social CRM Ecosystem LISTEN BlueberryAPI SemanticDeskSemanticForce ANALYZE ENGAGE

Named entities recognition : detection of brands, persons and homonymy resolution Sentiment analysis: entity/feature level Emotions (18-grade) recognition Hierarchical categorization Semantic clustering Intent and questions recognition: what the author is planning or asking Recommendations: what the author is recommending, including polarity of advice Learn more: Blueberry Semantic PaaS

Уровни анализа сообщений Message Level Оценка проводится для всего сообщения целиком без детализации по объектам. Entity Level Оценка проводится для объектов, без учета их свойств. Entity/Feature Level Детектируются отношения к свойствам (компонентам) объектов, без учета степени важности. Entity/Feature Level + Weight Детектируется отношение к свойствам объектов с учетом их «веса». ©2014 SemanticForce Inc. | |

Message (Document) Level ©2014 SemanticForce Inc. | | Отображает только количество позитивных и негативных сообщений. Pros: простота реализации и визуализации. Cons & Questions: Какие компании или персоны упоминались в контексте позитива и негатива? Кто говорил плохо обо мне и хорошо о конкурентах? Кто говорит хорошо обо мне и хорошо о конкурентах? Были ли биполярные сообщения (когда обо мне говорили одновременно и позитивно, и негативно)? За что именно хвалили, а за что ругали?

Entity Level ©2014 SemanticForce Inc. | | Позволяет определять тональность не для всего сообщения, а по отношению к отдельным объектам (например, брендам или продуктам)

Entity Level ©2014 SemanticForce Inc. | | Не отвечает на вопрос «За что именно хвалили, а за что ругали?»

Entity/Feature Level ©2014 SemanticForce Inc. | | Помогает детально изучить мнения пользователей и понять причины их недовольства / удовлетворенности продуктом или услугой. Примеры упоминаний компонент (факторов) в сообщениях: «…имеет самый больший дорожный просвет, что является неоспоримым преимуществом» или «…движок работает как часы»… Не отвечает на вопрос «какой компонент (фактор) важнее?»

Entity/Feature Level & Weight ©2014 SemanticForce Inc. | | Представляет собой взвешенную структуру (иерархию) компонент (факторов) учитывая важность (вес) каждого элемента. Возможны несколько методологий взвешивания факторов: по количеству упоминаний по количеству вопросов по количеству сравнений и еще более 10-ти методологий Ваш вариант?

Проблематика взвешивания и ранжирования ©2014 SemanticForce Inc. | | При анализе данных в режиме real-time или приближенном к нему (да и исторических данных в том числе) возникает ряд вопросов: какой массив выбрать для расчета весов: источник период учитывать только свой бренд или же еще конкурентов? как часто пересчитывать веса При отображении результатов в конечного пользователя может возникнуть вопрос, почему компонент с большим числом упоминаний отображен (ранжирован) ниже, чем тот у которого упоминаний меньше? Вопрос: как отображать веса (важность)?

Customer Journey Mapping ©2014 SemanticForce Inc. | | Один из вариантов визуализации взвешенной карты факторов на различных этапах потребительского цикла.

Эмоциональная модель BlueberryAPI ©2014 SemanticForce Inc. | | Модель BlueberryAPI основана на модифицированной модели Келлермана - Плутчика. Позволяет детектировать 18-ть типов эмоций.

Hachi A Dogs Tale: Stream ©2014 SemanticForce Inc. | |

Анализ эмоциональной окраски ©2014 SemanticForce Inc. | | Анализ эмоциональной окраски, как и тональности применим ко всем уровням анализа сообщений.

Анализ оценочных высказываний Примеры автоматического анализа Проблемы визуализации Масштабирование ©2014 SemanticForce Inc. | |

Мне нравится Apple. Я хочу купить себе новый IPad. Когда он выходит? Тональность Компания Вопрос Продукт Намерение Пример анализа сообщения ©2014 SemanticForce Inc. | |

Результат анализа сообщения ©2014 SemanticForce Inc. | |

Результат анализа сообщения ©2014 SemanticForce Inc. | | Детектирование эмоций в BlueberryAPI работает на объектном уровне, с возможностью гибкой настройки онтологии и лингвистической модели. Название фильма Объект Тональность и эмоция

Примеры по автоиндустрии «Какой индекс двигателей К9К ставят на Дастера?» ©2014 SemanticForce Inc. | | «Дастер однозначно порадовал подвеской»

Примеры по электронике «Я был поражен светочувствительностью объективов для 650D!» ©2014 SemanticForce Inc. | | «Ненавижу меню в canon 650D.»

Примеры по электронике «В Lenovo P700i плохое расположение кнопок.» ©2014 SemanticForce Inc. | | «Продам шлейф для матрицы ноутбука Lenovo G550.»

Технологическая проблематика Основные технологические проблематики: опечатки; омонимия; определение анафорических связей; «понимание» сленга и жаргона; распознавание сарказма и иронии; транслитерация; распознавание смайлов и эмоджей; Статьи о проблемах анализа текстов: 10 проблем анализа тональности (часть 1) Проблемы анализа тональности (часть 2) ©2014 SemanticForce Inc. | |

Анализ оценочных высказываний Примеры автоматического анализа Проблемы визуализации Масштабирование ©2014 SemanticForce Inc. | |

Визуализация, как форма сжатия данных «У мастика спинка неудобная.» ©2014 SemanticForce Inc. | | Визуализация является одной из форм сжатия данных. David McCandless David McCandless

Статистика – iPhone и Samsung ©2014 SemanticForce Inc. | | 200K+ сообщений о iPhone в день 6M + сообщений о iPhone за месяц 30K+ сообщений о Samsung в день 1M сообщений о Samsung за месяц

Статистика - Renault ©2014 SemanticForce Inc. | | Статистика количества упоминаний об автомобилях Renault В среднем за месяц: 95K+ сообщений о Renault; 20K+ сообщений о Renault Sandero Stepway.

Статистика - Renault ©2014 SemanticForce Inc. | | Статистика количества упоминаний свойств автомобилей Renault В среднем за месяц: 5K+ сообщения о двигателе; 2K+ сообщений о кузове; 2K+ сообщений о комплектации.

Статистика - Lenovo ©2014 SemanticForce Inc. | | В среднем за месяц: 30K сообщений о Lenovo; отзывов на Yandex Market.

Иерархия компонент фотоаппарата ©2014 SemanticForce Inc. | | Более 100 компонент

Иерархия компонент автомобиля ©2014 SemanticForce Inc. | | Более 300 компонент

©2014 SemanticForce Inc. | | Каким образом отображать количественные характеристики тональности и эмоциональной окраски по каждому компоненту объекта, учитывая иерархичность и вес каждого фактора, с возможностью сравнения нескольких объектов одновременно, если анализ сообщений проводится в real-time режиме ? Проблематика визуализации

Семантическое окно ©2014 SemanticForce Inc. | |

Семантическое окно ©2014 SemanticForce Inc. | |

Семантическое окно ©2014 SemanticForce Inc. | |

Анализ оценочных высказываний Примеры автоматического анализа Проблемы визуализации Масштабирование ©2014 SemanticForce Inc. | |

Масштабирование ©2014 SemanticForce Inc. | | Гибридная архитектура: Private Cloud + Computational Clouds (MS AZURE, etc.) Важным аспектом по масштабировании автоматического анализа текстов является стек алгоритмов машинного обучения: автоматическая классификация на базе нейронных сетей или др. моделей авто-обучение онтологий предметных областей автоматическое выявление Named Entites

References ©2014 SemanticForce Inc. | | B. Liu, Sentiment analysis and subjectivity, Handbook of Natural Language Processing,, pp. 978– , B. Pang and L. Lee, Opinion mining and sentiment analysis, Foundations and Trends in Information Retrieval, vol. 2, no. 1-2, pp. 1–135, A. Esuli and F. Sebastiani, Sentiwordnet: A publicly available lexical resource for opinion mining, in Proceedings of LREC, 2006, vol. 6, pp. 417–422. V. Hatzivassiloglou and K. R. McKeown, Predicting the semantic orientation of adjectives, in Proceedings of the eighth conference on European chapter of the Association for Computational Linguistics, 1997, pp. 174–181. P. Turney, M. L. Littman, and others, Measuring praise and criticism: Inference of semantic orientation from association, in ACM Transactions on Information Systems (TOIS), A. M. Popescu and O. Etzioni, Extracting product features and opinions from reviews, in Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, 2005, pp. 339–346. M. Hu and B. Liu, Mining and summarizing customer reviews, in Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, 2004, pp. 168–177. X. Ding, B. Liu, and P. S. Yu, A holistic lexicon-based approach to opinion mining, in Proceedings of the international conference on Web search and web data mining, 2008, pp. 231–240. I. Titov and R. McDonald, Modeling online reviews with multi-grain topic models, in Proceeding of the 17th international conference on World Wide Web, 2008, pp. 111–120. T. Nakagawa, K. Inui, and S. Kurohashi, Dependency tree-based sentiment classification using CRFs with hidden variables, in Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, 2010, pp. 786–794. A. Andreevskaia and S. Bergler, When specialists and generalists work together: Overcoming domain dependence in sentiment tagging, ACL-08: HLT, D. Ikeda and H. Takamura, Learning to shift the polarity of words for sentiment classification, Comp.Intelligence, vol. 25, no. 1, pp. 296–303, 2008.

We're Hiring ©2014 SemanticForce Inc. | | Machine Learning Engineer Senior.NET Developer Front-end Developer

Web: Skype: SemanticForce Phone: +380 (44) (Украина)