Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемwww.cotes.ru
1 СИСТЕМА СИНТАКСИЧЕСКОГО ТЕМАТИЧЕСКОГО ПОИСКА В СЕТИ ИНТЕРНЕТ, СИСТЕМАТИЗАЦИИ И ПРЕДСТАВЛЕНИЯ КОНКУРСНЫХ ПРЕДЛОЖЕНИЙ И КОММЕРЧЕСКИХ НОВОСТЕЙ ПЕРВЫЙ ОТКРЫТЫЙ КОНКУРС МОЛОДЫХ СПЕЦИАЛИСТОВ ЗАО «СИБКОТЭС» Менеджмент, маркетинг и HR в энергетике Черноскутов Артем Сергеевич ЗАО "СибКОТЭС« Новосибирск 2008
2 1. Использование сети Интернет для поиска коммерческой информации Что такое "коммерчески ценная информация" "горячие" конкурсы Перспективные работы Перспективные Направления работ
3 3. Работа со списком конкурсов b2b- energo.ru B2B-Energo / Публикации о торгах / Копии публикаций B2B-Energo / Публикации о торгах / Анонсирования торгов B2B-Energo - Торговая площадка - Список объявлений о покупке B2B-Energo - Торговая площадка - Список действующих аукционов покупателя B2B-Energo - Торговая площадка - Список объявленных открытых конкурсов
4 Публикация данных Вечер понедельника – утро вторника Вечер четверга – утро пятницы
5 Сравнительный график общего числа опубликованных конкурсов (синий график) и числа конкурсов, включенных в отчет (оранжевый график).
6 Процентное соотношение между общим числом опубликованных конкурсов и числом конкурсов, взятых в отчет.
7 Цикл взятия данных
8 Возможные пути развития Одним из вариантов развития системы может быть оформление системы как web-сервиса и дополнение функциями контроля и управления. В частности, это может быть автоматическое взятие данных с b2b-enerdo по запросу, распределение конкурсов между пользователями, сопровождение конкурсов. Сопровождение конкурсов может включать добавление комментариев или другую форму контроля, передачу конкурсов от одного пользователя другому, сбор статистической и прочей информации, оперативное изменение параметров поиска. ИнтернетОМиПСпециалисты
9 4. Работа с Новостями Электроэнергетики Поиск и обработка этих источников является масштабной работой поисковой системы В международной практике подборка опубликованных материалов, касающихся деятельности компании называется пресс - клиппинг (press-clipping, press-cutting, alert).
10 Алгоритм Q-грам. Суть метода в том, чтобы сравниваемые строки режутся на подстроки длины Q (Q-грамы), далее осуществляется сравнение наборов подстрок и, исходя из количества совпавших подстрок, можно сделать выводы об их похожести или непохожести [23]. Судя по опытным данным, наиболее оптимальным является деление на подстроки длины Q = 2 (би-грамы). Количество K Q-грам в строке рассчитывается по следующей формуле: К = Длина строки - Q + 1 Приведем небольшой пример реализации. Возьмем две строки: "Строительство ТЭС" (эталон) и "ТЭС строится" сттррооииттееллььссттввоо__ттээс тээсс__ссттррооииттсся Совпадением считается одинаковый грам эталона и рабочей строки. Для примера они помечены цветом. Теперь определим критерий идентичности двумя способами: КИ1 = Количество совпадений/ К эталона = 7/16 = 0.43 КИ2 = Количество совпадений * 2 / (К эталона + К рабочей строки) = 7*2/(16+11)= 0.52
11 Методика контекстно – зависимого поиска c применением технологии нейронных сетей Рис. 3. Пример представления в трехуровневой нейронной сети слов "нейрон" и "корона" (рисунок взят из работы [21])
12 Спасибо!
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.