TEXTANALYST – ТЕХНОЛОГИЯ ДЛЯ ПРЕДСТАВЛЕНИЯ ТЕКСТА ПОЛЬЗОВАТЕЛЮ Харламов А.А. Крюкова О.П.

Презентация:



Advertisements
Похожие презентации
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Advertisements

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЭКОНОМИКЕ ТЕМА 3. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УПРАВЛЕНИЯ Подготовил Иванов А.Н.
г. Андреев Илья Александрович, преподаватель-методист Роль и значение технологических инноваций фирмы «1С» для развития научных школ.
«Мировые информационные ресурсы» Кафедра «Сетевой экономики и мировых информационных ресурсов» Селетков Сергей Николаевич.
ProQuest Dissertations & Theses A&I Совет развития Директор НТБ Колюпанова И.Ю. 15 декабря 2015.
Интеллектуальные системы для эффективного поиска электронных ресурсов.
Говоря о двух последних «умениях» компьютера, необходимо помнить, что почти во всех существующих системах автоматического реферирования в качестве основных.
Базы данных. Основные понятия База данных (БД) организованная совокупность данных, предназначенная для длительного хранения во внешней памяти компьютера.
Определение новизны информации в новостном кластере.
Базы данных Хранение, поиск и сортировка информации.
Фонд мобильной библиотеки Создаём – выдаём – продвигаем.
Автоматизация продаж Microsoft CRM. Объявления по компании и общая информация Календарь отображающий просроченные, текущие и планируемые действия действия.
- Книги - Образование - Наука - Экономика - Культура.
Использование систем RETRANS-MetaFraz в правительственных и государственных организациях, а также в центрах анализа информации Юрий Викторович Никитин.
План: 1. Понятие информационных технологий 2. Структура информационной технологии 3. Виды информационных технологий 4. Влияние информационных технологий.
Информационные ресурсы 1. Виды ресурсов 2 Материальные ресурсы 3 Материальные ресурсы совокупность предметов труда, предназначенных для использования.
Информационные технологии Тема урока: Информационные технологии. Цель и инструментарий. Авторы презентации: учитель информатики высшей категории Дунаева.
Предмет изучения информатики. ЦОР и ЭОР. Дистанционные курсы и олимпиады. Сертификация компьютерной грамотности.
Мировые информационные образовательные ресурсы. Работу выполняла: Кун Анна.
Основными сервисами компании «Google» является поиск «Google Search» и всемирно известный видеохостинг «YouTube» и также Gmail- бесплатная электронная.
Транксрипт:

TEXTANALYST – ТЕХНОЛОГИЯ ДЛЯ ПРЕДСТАВЛЕНИЯ ТЕКСТА ПОЛЬЗОВАТЕЛЮ Харламов А.А. Крюкова О.П.

Сведения о докладчиках Харламов Александр Александрович Харламов Александр Александрович Крюкова Ольга Павловна Крюкова Ольга Павловна ООО НПИЦ «Микросистемы», г. Москва Федеральный институт развития образования

Наши проекты и основные направления деятельности Цифровые библиотеки в образовании Цифровые библиотеки в образовании Развитие речевой, коммуникативной и интеллектуальной деятельности учащегося Развитие речевой, коммуникативной и интеллектуальной деятельности учащегося

Какова основная тема и проблема выступления? Инновационная технология работы с текстовой информацией на базе компьютерной технологии (далее «технология ТА») С помощью системы ТекстАналист ТекстАналист ( ( в автоматизации обмена данными в книжной отрасли в автоматизации обмена данными в книжной отрасли

Что это за технология? Нейросетевая технология обработки текстовой информации TextAnalyst Нейросетевая технология обработки текстовой информации TextAnalystпозволяет анализировать текст независимо от языка и предметной области анализировать текст независимо от языка и предметной области автоматически извлекать автоматически извлекать -ключевые понятия из текста (с их смысловыми весами в рамках данного текста), -ключевые понятия из текста (с их смысловыми весами в рамках данного текста), -устанавливать их взаимосвязи в данном тексте -устанавливать их взаимосвязи в данном тексте (также с их весовыми характеристиками).

Что это дает издателю/ редактору? 1. В результате автоматической обработки пользователь мгновенно получает смысловой портрет текста 1. В результате автоматической обработки пользователь мгновенно получает смысловой портрет текста – семантическую сеть- совокупность ключевых понятий в их взаимосвязях, как они даны в данном тексте; – семантическую сеть- совокупность ключевых понятий в их взаимосвязях, как они даны в данном тексте;

Что это дает издателю/ редактору? 2.Технология ТА оказывается удобным средством навигации по тексту. См. комм 2.Технология ТА оказывается удобным средством навигации по тексту. См. комм

Что это дает издателю/ редактору? 3. ТА может автоматически создавать реферат, который, в составе наиболее значимых предложений текста, позволяет осуществить первичное и быстрое знакомство с текстом. 3. ТА может автоматически создавать реферат, который, в составе наиболее значимых предложений текста, позволяет осуществить первичное и быстрое знакомство с текстом.

Что дает технология ТА? На основе семантической сети строится гипертекстовое представление, которое позволяет легко (методом «клика») навигировать по тексту с использованием ассоциативных связей и быстро просматривать контекст конкретных ключевых слов. На основе семантической сети строится гипертекстовое представление, которое позволяет легко (методом «клика») навигировать по тексту с использованием ассоциативных связей и быстро просматривать контекст конкретных ключевых слов.

Что дает технология ТА? (это особенно важно при работе с корпусами текстов ) Вычисление степени пересечения семантической сети запроса с семантическими сетями найденных по запросу текстов дает возможность отранжировать найденные тексты по степени близости к запросу. Вычисление степени пересечения семантической сети запроса с семантическими сетями найденных по запросу текстов дает возможность отранжировать найденные тексты по степени близости к запросу.

Что дает технология ТА? Вычисление степени пересечения семантической сети текста с семантическими сетями рубрик позволяет автоматически отнести входной текст к одной или нескольким рубрикам, то есть – отклассифицировать его. Вычисление степени пересечения семантической сети текста с семантическими сетями рубрик позволяет автоматически отнести входной текст к одной или нескольким рубрикам, то есть – отклассифицировать его.

Какой опыт использования технологии ТА? С 1996 года технология представлена на российском рынке в виде двух продуктов: персонального продукта для автоматического анализа текстов TextAnalyst и библиотеки COM-модулей для встраивания ее в продукты пользователя – TextAnalyst SDK. С 1996 года технология представлена на российском рынке в виде двух продуктов: персонального продукта для автоматического анализа текстов TextAnalyst и библиотеки COM-модулей для встраивания ее в продукты пользователя – TextAnalyst SDK.

Какой опыт использования технологии ТА? С 1998 года те же продукты представлены на рынке США под названием Megaputers TextAnalyst (Megaputer Intelligence, Inc., Bloomington – является дистрибутором продуктов ООО НПИЦ «Микросистемы» в США) С 1998 года те же продукты представлены на рынке США под названием Megaputers TextAnalyst (Megaputer Intelligence, Inc., Bloomington – является дистрибутором продуктов ООО НПИЦ «Микросистемы» в США)

Рейтинг популярности ТА какой? Which text-mining tools you have used [111 votes total]dt Which text-mining tools you have used [111 votes total]dt Search (6)5%I- Search (6)5%I- Miner for Text (19)17% Miner for Text (19)17% INTEXT (1)1% INTEXT (1)1% TextAnalyst (30)27% TextAnalyst (30)27% TextSmart (6)5% TextSmart (6)5% Text-o-Scope (2)2% Text-o-Scope (2)2% Wordstat (3)3% Wordstat (3)3% Other (10)9%None (34)31% Other (10)9%None (34)31% Copyright © 2002 KDnuggets. Subscribe to KDnuggets News! Subscribe

Еще о рейтинге популярности? В 2000 году вышла книга Дэна Салливэна [1], вторая часть которой посвящена сравнению технологии TextAnalyst с аналогичными технологиями фирм IBM и ORACLE. В 2000 году вышла книга Дэна Салливэна [1], вторая часть которой посвящена сравнению технологии TextAnalyst с аналогичными технологиями фирм IBM и ORACLE.

Что нового и полезного появляется в работе издателя/ редактора с помощью ТА ? Таким образом, гипертекстовое представление текстовой информации в составе исходного текста, семантической сети и множества предложений, содержащих понятия сети вполне может использоваться как новый и более точный стандарт в представлении текстовой информации пользователю. Таким образом, гипертекстовое представление текстовой информации в составе исходного текста, семантической сети и множества предложений, содержащих понятия сети вполне может использоваться как новый и более точный стандарт в представлении текстовой информации пользователю.

Предложения о дальнейшей совместной научно – исследовательской деятельности Становится возможной совместная разработка интеллектуальных инструментов анализа специальных текстовых и терминологических баз и самих текстовых баз данных для широких целей автоматизации в использовании цифрового издательского текстового фонда в образовании, самообразовании, интеллектуальном труде учащегося и, шире, пользователя. Становится возможной совместная разработка интеллектуальных инструментов анализа специальных текстовых и терминологических баз и самих текстовых баз данных для широких целей автоматизации в использовании цифрового издательского текстового фонда в образовании, самообразовании, интеллектуальном труде учащегося и, шире, пользователя.

Какие новые горизонты издательской деятельности открывает использование интеллектуальных технологий (технологии ТА) ? Расширение сферы коммерческой деятельности издателей при использовании цифровых библиотек собственных архивов Расширение сферы коммерческой деятельности издателей при использовании цифровых библиотек собственных архивов

Контактная информация