Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемwww.guildbook.ru
1 TEXTANALYST – ТЕХНОЛОГИЯ ДЛЯ ПРЕДСТАВЛЕНИЯ ТЕКСТА ПОЛЬЗОВАТЕЛЮ Харламов А.А. Крюкова О.П.
2 Сведения о докладчиках Харламов Александр Александрович Харламов Александр Александрович Крюкова Ольга Павловна Крюкова Ольга Павловна ООО НПИЦ «Микросистемы», г. Москва Федеральный институт развития образования
3 Наши проекты и основные направления деятельности Цифровые библиотеки в образовании Цифровые библиотеки в образовании Развитие речевой, коммуникативной и интеллектуальной деятельности учащегося Развитие речевой, коммуникативной и интеллектуальной деятельности учащегося
4 Какова основная тема и проблема выступления? Инновационная технология работы с текстовой информацией на базе компьютерной технологии (далее «технология ТА») С помощью системы ТекстАналист ТекстАналист ( ( в автоматизации обмена данными в книжной отрасли в автоматизации обмена данными в книжной отрасли
5 Что это за технология? Нейросетевая технология обработки текстовой информации TextAnalyst Нейросетевая технология обработки текстовой информации TextAnalystпозволяет анализировать текст независимо от языка и предметной области анализировать текст независимо от языка и предметной области автоматически извлекать автоматически извлекать -ключевые понятия из текста (с их смысловыми весами в рамках данного текста), -ключевые понятия из текста (с их смысловыми весами в рамках данного текста), -устанавливать их взаимосвязи в данном тексте -устанавливать их взаимосвязи в данном тексте (также с их весовыми характеристиками).
6 Что это дает издателю/ редактору? 1. В результате автоматической обработки пользователь мгновенно получает смысловой портрет текста 1. В результате автоматической обработки пользователь мгновенно получает смысловой портрет текста – семантическую сеть- совокупность ключевых понятий в их взаимосвязях, как они даны в данном тексте; – семантическую сеть- совокупность ключевых понятий в их взаимосвязях, как они даны в данном тексте;
7 Что это дает издателю/ редактору? 2.Технология ТА оказывается удобным средством навигации по тексту. См. комм 2.Технология ТА оказывается удобным средством навигации по тексту. См. комм
8 Что это дает издателю/ редактору? 3. ТА может автоматически создавать реферат, который, в составе наиболее значимых предложений текста, позволяет осуществить первичное и быстрое знакомство с текстом. 3. ТА может автоматически создавать реферат, который, в составе наиболее значимых предложений текста, позволяет осуществить первичное и быстрое знакомство с текстом.
9 Что дает технология ТА? На основе семантической сети строится гипертекстовое представление, которое позволяет легко (методом «клика») навигировать по тексту с использованием ассоциативных связей и быстро просматривать контекст конкретных ключевых слов. На основе семантической сети строится гипертекстовое представление, которое позволяет легко (методом «клика») навигировать по тексту с использованием ассоциативных связей и быстро просматривать контекст конкретных ключевых слов.
10 Что дает технология ТА? (это особенно важно при работе с корпусами текстов ) Вычисление степени пересечения семантической сети запроса с семантическими сетями найденных по запросу текстов дает возможность отранжировать найденные тексты по степени близости к запросу. Вычисление степени пересечения семантической сети запроса с семантическими сетями найденных по запросу текстов дает возможность отранжировать найденные тексты по степени близости к запросу.
11 Что дает технология ТА? Вычисление степени пересечения семантической сети текста с семантическими сетями рубрик позволяет автоматически отнести входной текст к одной или нескольким рубрикам, то есть – отклассифицировать его. Вычисление степени пересечения семантической сети текста с семантическими сетями рубрик позволяет автоматически отнести входной текст к одной или нескольким рубрикам, то есть – отклассифицировать его.
12 Какой опыт использования технологии ТА? С 1996 года технология представлена на российском рынке в виде двух продуктов: персонального продукта для автоматического анализа текстов TextAnalyst и библиотеки COM-модулей для встраивания ее в продукты пользователя – TextAnalyst SDK. С 1996 года технология представлена на российском рынке в виде двух продуктов: персонального продукта для автоматического анализа текстов TextAnalyst и библиотеки COM-модулей для встраивания ее в продукты пользователя – TextAnalyst SDK.
13 Какой опыт использования технологии ТА? С 1998 года те же продукты представлены на рынке США под названием Megaputers TextAnalyst (Megaputer Intelligence, Inc., Bloomington – является дистрибутором продуктов ООО НПИЦ «Микросистемы» в США) С 1998 года те же продукты представлены на рынке США под названием Megaputers TextAnalyst (Megaputer Intelligence, Inc., Bloomington – является дистрибутором продуктов ООО НПИЦ «Микросистемы» в США)
14 Рейтинг популярности ТА какой? Which text-mining tools you have used [111 votes total]dt Which text-mining tools you have used [111 votes total]dt Search (6)5%I- Search (6)5%I- Miner for Text (19)17% Miner for Text (19)17% INTEXT (1)1% INTEXT (1)1% TextAnalyst (30)27% TextAnalyst (30)27% TextSmart (6)5% TextSmart (6)5% Text-o-Scope (2)2% Text-o-Scope (2)2% Wordstat (3)3% Wordstat (3)3% Other (10)9%None (34)31% Other (10)9%None (34)31% Copyright © 2002 KDnuggets. Subscribe to KDnuggets News! Subscribe
15 Еще о рейтинге популярности? В 2000 году вышла книга Дэна Салливэна [1], вторая часть которой посвящена сравнению технологии TextAnalyst с аналогичными технологиями фирм IBM и ORACLE. В 2000 году вышла книга Дэна Салливэна [1], вторая часть которой посвящена сравнению технологии TextAnalyst с аналогичными технологиями фирм IBM и ORACLE.
16 Что нового и полезного появляется в работе издателя/ редактора с помощью ТА ? Таким образом, гипертекстовое представление текстовой информации в составе исходного текста, семантической сети и множества предложений, содержащих понятия сети вполне может использоваться как новый и более точный стандарт в представлении текстовой информации пользователю. Таким образом, гипертекстовое представление текстовой информации в составе исходного текста, семантической сети и множества предложений, содержащих понятия сети вполне может использоваться как новый и более точный стандарт в представлении текстовой информации пользователю.
17 Предложения о дальнейшей совместной научно – исследовательской деятельности Становится возможной совместная разработка интеллектуальных инструментов анализа специальных текстовых и терминологических баз и самих текстовых баз данных для широких целей автоматизации в использовании цифрового издательского текстового фонда в образовании, самообразовании, интеллектуальном труде учащегося и, шире, пользователя. Становится возможной совместная разработка интеллектуальных инструментов анализа специальных текстовых и терминологических баз и самих текстовых баз данных для широких целей автоматизации в использовании цифрового издательского текстового фонда в образовании, самообразовании, интеллектуальном труде учащегося и, шире, пользователя.
18 Какие новые горизонты издательской деятельности открывает использование интеллектуальных технологий (технологии ТА) ? Расширение сферы коммерческой деятельности издателей при использовании цифровых библиотек собственных архивов Расширение сферы коммерческой деятельности издателей при использовании цифровых библиотек собственных архивов
19 Контактная информация
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.