Бренд Аналитик Команда проекта: Александра Михайлова Ирина Орлова Дмитрий Батькович Александр Сенов БРЕНД АНАЛИТИК - ИННОВАЦИЯ НАСТОЯЩЕГО, ПАРАДИГМА БУДУЩЕГО.

Презентация:



Advertisements
Похожие презентации
Москва Семантическая обработка данных в программно-аппаратном комплексе (ПАК), предназначенном для управления предприятиями и отраслями.
Advertisements

Услуга Аналитический мониторинг СМИ Докладчик: Силенина Светлана, редактор ИА INFOLine Санкт-Петербург 2013 год.
Education – Employer – Career (Образование – Работодатель – Карьера) Докладчики: Екатерина Байщерякова Максим Ларин Итоговые результаты работы Лидер тематики:
Развиваем Ваш Бизнес в интернете Веб-аналитика Как повысить эффективность сайта и рекламной кампании? Александр Кузьмин Коммерческий директор WebProfiters.
Использование Интернет- сервисов для проведения маркетинговых исследований Симонов Вадим Борисович, к.э.н., Руководитель проекта «Высшая школа 2.0» IV.
Николай Хиврин Генеральный директор ALTWeb Group Алгоритмы автоматизированного составления семантического ядра.
Макаров Петр, руководитель проектного отдела INTECCO Cеминар «Интернет-консалтинговой компании Интекко» «Интернет + деньги»
Семантические сети для прогнозирования компетенций специалистов ИБ Баяндин Н.И., МЭСИ.
Объектные СУБД Поисковые технологии Специализированные ИПС и Web-сервисы Лингвистический и семантический анализ текстов документов НПЦ «ИНТЕЛТЕК ПЛЮС»
Основы проектирования: бизнес- планирование. Бизнес-планирование - процесс разработки и осуществления системы мероприятий по реализации предпринимательского,
Нужно ли мониторить социальные медиа? Какую информацию можно получить из соцмедиа? Черкасова Ирина – SMM-менеджер ЗАО«Айкумен-ИБС»
1 Проект «Реформа системы образования» Разработка системы статистических индикаторов и показателей, вопросников, статистического и методологического инструментария.
Концепция создания нормативно-правовой базы, методических основ и систем информационного обеспечения органов исполнительной власти.
Дайджест новостей «Зарубежное судостроение» © ЗАО Почтовый адрес: Россия, , Санкт-Петербург, пл. Александра Невского д. 2, Бизнес центр,
Практика использования результатов исследования социального самочувствия населенияв городах Северо-Западного Альянса организаций, использующих модели развития.
Москва, 2011 Мониторинг социальных медиа. 2 Выявление и анализ упоминаний компании в социальных медиа Анализ тематических линий Оценка регионального распределения.
Описание проекта Bukabench это информация о книгах, авторах и издательствах. Личные рекомендации и литературное сообщество Bukabench это книжная кибер-лавка,
ИНТЕРНЕТ НА СЛУЖБЕ БИЗНЕСА: УПРАВЛЕНИЕ КОРПОРАТИВНОЙ ИНФОРМАЦИЕЙ И ИНТЕРНЕТ-МАРКЕТИНГ Интернет-маркетинг на 100% © 2010 Алексей Неверов.
«Практический маркетинг на предприятии» Презентация программы (502 акад.ч.)
Опыт представления результатов аналитических и рейтинговых исследований в средствах массовой информации: проект Социальный навигатор РИА Новости.
Транксрипт:

Бренд Аналитик Команда проекта: Александра Михайлова Ирина Орлова Дмитрий Батькович Александр Сенов БРЕНД АНАЛИТИК - ИННОВАЦИЯ НАСТОЯЩЕГО, ПАРАДИГМА БУДУЩЕГО. Куратор: Владимир Батыгин, ЯНДЕКС

2 О проекте Цель: создание аналитического сервиса экономического информационного пространства. Задачи: организация сбора, хранения, обработки и предоставления информации о компаниях. Мотивация: потребность со стороны финансового и маркетингового сообщества.

Конец 1-го семестра Сформирована и кристаллизована концепция проекта. 10 компаний, 10 источников информации. НЕ автоматизированный сбор информации : ) Исследованы CART, AdaBoost, RandomForest для распознавания тональности в Twitter. Конец 2-го семестра Сформирована база данных: 8 отраслей экономики, 52 компании, 134 источника информации. Создан сайт сервиса и организована его работа. Налажен постоянный сбор информации. Исследованы SVM и SentimentStrength для распознавания тональности в Twitter. 3

4 Технологическая реализация RSS Twitter w w w MongoDB RSS + Twitter MySQL Finam Lucene Кластеризация Делаем индексы Чистим от мусора Считаем упоминаемости Оцениваем тональность Backend Finam

5 Анализ данных: задача Исследовали распознавание тональности сообщений в Twitter. Data Set: сообщения, содержащие название бренда –или возможное обозначение бренда: google = gogle = гугл = … –выкинули мусор –назначили оценку тональности {-1, 0, 1} –получили 1064 наблюдения

6 Анализ данных: метод Составили словари: 1) Основа: разум, синонимы, статистика, :*) и =( 2) Применили Стемминг: хороший хорошие хорош хорошо В прошлом семестре оценили: CART, AdaBoost, RandomForest. В этом семестре исследовали: SVM (Weka), Sentiment Strength (Mike Thelwall,2011).

7 Оценка качества: метод

8 Алгоритм ЗадачаrecallprecisionF measure CART {1} vs {-1, 0}0 NaN {-1} vs {0, 1}0 NaN AdaBoost {1} vs {-1, 0}0 NaN {-1} vs {0, 1}0 NaN RandomForest {1} vs {-1, 0}0,1110,60,188 {-1} vs {1, 0}0 NaN SVM {1} vs {-1, 0}0,10,120,11 {-1} vs {1, 0}0,150,210,18 Sentiment Strength {1} vs {-1, 0}0,280,40,33 {-1} vs {1, 0}0,20,50,29 Оценка качества классификации

Структура целевых сообщений в Twitter 9

Еще сложности… Мало экономической контекста, хоть такого: «Ах ты ж мать моя женщина: Nokia завтра объявит об альянсе с Microsoft».. Скорее имеются в виду услуги компании и сложно-распознаваемая ирония «Яндекс.Карты, Яндекс.Деньги, Яндекс.Два Ствола» «Девушка в очереди сбербанка дождалась парня из армии» «Мою жизнь продукция Apple сделала хуже - очень утомительно завидовать владельцам айфонов и макбуков» 10

Идеи будущего развития Автоматическое распознавание тональности новостей. Исследование корреляции тональности с фондовыми индексами. Расширение алгоритмического инструментария. Изучение устойчивости подхода для разных источников и разных языков. Усовершенствование технологической составляющей проекта. 11

Спасибо за внимание. Александра Михайлова Ирина Орлова Дмитрий Батькович Александр Сенов БРЕНД АНАЛИТИК - ИННОВАЦИЯ НАСТОЯЩЕГО, ПАРАДИГМА БУДУЩЕГО.