Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемwww.dialog-21.ru
1 Лукашевич Н.В Квазисинонимы в лингвистических онтологиях Near-synonyms in linguistic ontologies АНО Центр информационных исследований МГУ им. М.В.Ломоносова Научно-исследовательский вычислительный центр
2 Онтологии для автоматической обработки текстов Основные элементы онтологий –понятия онтологии, –отношения между понятиями Автоматическая обработка текстов –Необходимо установление отношений между понятиями онтологии и языковыми выражениями Лингвистические (лексические) онтологии – онтологии, которые учитывают систему значений естественного языка
3 Лингвистические онтологии и проблемы лексической семантики Каждое понятие лингвистической онтологии имеет совокупность текстовых выражений, которое может это понятие выражать Совокупность текстовых выражений одного понятия – онтологические синонимы Проблемы описания –Близкие значения слов нужно дискретно подразделить, –Квазисинонимы нужно разбить на совокупность дискретных синонимических рядов – выделить онтологические синонимы
4 План презентации Квазисинонимы и проблемы отражения квазисинонимов в лингвистических онтологиях Пример из WordNet: квазисинонимы со значением =сходство= Принципы рассмотрения квазисинонимов в тезаурусе РуТез Примеры анализа квазисинонимов
5 Представление квазисинонимов в лингвистических онтологиях Квазисинонимы (частичные синонимы) –Слова с близкими значениями –Могут быть взаимозаменяемыми в некоторых контекстах Квазисинонимы могут различаться по многим параметрам: –Денотативный статус, стилистическая окраска, –Оценка, Коллокации, Валентности и др. В разных контекстах могут употребляться в более широком или более узком смысле Близкий ряд квазисинонимов на другом языке характеризуется своей собственно системой различий
6 Примеры квазисинонимов ошибка, погрешность, недосмотр, просмотр, ляп, промах, оплошность, осечка, прокол, упущение, недочет, а также ослышка, описка, опечатка, оговорка. error, fault, omission, oversight, blunder, mistake, miss, screw-up, dereliction, defect Драться, подраться, передраться, свалка, потасовка, побоище, мордобой, поножовщина
7 Квазисинонимы в предметных областях кредитование, кредит, кредитная услуга, кредитное обслуживание,кредитная операция, выделение кредита, выдача кредита, выделение кредитных средств, предоставление кредита Каковы особенности отображения квазисинонимов в онтологии?
8 Рекомендации по созданию онтологий: различимость понятий Нужно различать понятия и его названия: не стоит заводить отдельные понятия для синонимов Понятие-потомок должно отчетливо отличаться от понятия-родителя Понятие должно быть отчетливо отличаться от понятий одного уровня Это важно: –для описания отношений; –для формального вывода; –для перевод на другой язык
9 Квазисинонимы in WordNet Основная единица – синсет –Совокупность синонимов 4 плохо отличимых синсета, описывающих сходство. Каждый синсет – гипоним предыдущего: sameness –(the quality of being alike) similarity – (the quality of being similar) likeness, alikeness, similitude – (similarity in appearance or character or nature between persons or things) resemblance – (similarity in appearance or external or superficial details)
10 Тезаурус РуТез – лингвистическая онтология Понятие: Имя понятия Набор текстовых выражений Отношения между понятиями понятий, текстовых выражений, отношений (более 2 млн. с иерархией) Переведен на английский язык: 130 тысяч слов и выражений Приложения информационного поиска: формулировка запросов, автоматическое расширение запросов, автоматическая рубрикация, кластеризация, аннотирование
11 Понятия в тезаурусе РуТез: основные принципы Различимые понятия –разный набор отношений с другими понятиями тезаурус, –разный набор онтологических синонимов Традиция информационно-поисковых тезаурусов - однозначное и понятное имя, Онтологические синонимы должны быть эквивалентны относительно системы отношений с другими понятиями тезауруса
12 Имя понятия: примеры - однозначное слово: – КАБЕЛЬ ; - однозначное словосочетание: –КАБИНЕТ РЕСТОРАНА, –КАБИНЕТ ВРАЧА - неоднозначное слово с пометой: – КАБАЧОК (ПЛОД); - пара синонимов – текстовых входов понятия через запятую : –ИРРАЦИОНАЛЬНЫЙ, ЛОГИЧЕСКИ НЕОБЪЯСНИМЫЙ
13 Словосочетания - синтаксические синонимы многозначных слов авангард3 = авангардное искусство авангард4 = произведения авангарда чай3 = настой чая бородка2 = бородка ключа болид1 = космический болид болид2 = гоночный болид блок1 = подъемный блок экспедиция2 = отдел экспедиции …
14 Основные принципы работы с квазисинонимами Искать различия между квазисинонимами, которые не исчезают в зависимости от контекста их употребления Искать различия между квазисинонимами, которые приводят к формированию разных рядов онтологических синонимов или к разным отношениям с другими понятиями Фиксировать найденные различия вводом понятий с однозначными именами
15 Процедура ввода понятий для квазисинонимов (similarity)-1 0 шаг: ввод обобщенного понятия для квазисинонимов –SIMILARITY 1 шаг: найти признаки, по которым могут отличаться понятия –Сходство по внешнему виду - similarity in appearance 2 шаг: сформулировать имя понятия –Должно быть однозначным, –Лучше реально употребляющееся словосочетание –SIMILARITY IN APPEARANCE страниц в GOOGLE
16 Процедура ввода понятий для квазисинонимов-2 Шаг 3. Найти разнообразные онтологические синонимы для этого понятия –resemblance in appearance, –similarity of appearance, –external resemblance Шаг 4. Многозначные слова, употребляемые в разных контекстах то в более общем смысле, то в более узком – поставить онтологическими синонимами к двум понятиям –resemblance –likeness
17 SIMILARITY resemblance, likeness SIMILARITY IN APPEARANCE resemblance in appearance, similarity of appearance, external resemblance, resemblance, likeness, alikeness MUTUAL RESEMBLANCE symmetrical resemblance SPLITTING IMAGE MIRROR IMAGE reflection, reflexion, mirror reflection, mirror symmetry, reflection symmetry
18 Памятник, монумент (НОСС) - в память о конкретном человеке обычно ставится памятник, о группе людей – и памятник, и монумент, о событии – монумент; идеи воплощаются в монументах; - у монументов есть способность увековечивать подвиг живых людей; - по форме сооружения памятник часто представляет собой изображение увековечиваемого объекта; - монумент обычно больше по размерам; - пропагандистская роль больше свойственна монументам. Онтологические синонимы или нужно заводить отдельные понятия?
19 Памятник, монумент-анализ примеров Указанные в словаре различия не являются обязательными –В память о конкретном человеке может быть установлен монумент; –В память события может быть установлен памятник; –Памятник может быть поставлен идее и т.п. Авторы словаря указывают, что различия «нейтрализуются при повторной, сокращенной номинации того же сооружения». Нет ни одного четко различающего свойства. Памятник и монумент – онтологические синонимы
20 Водитель, шофер (НОСС) НОСС: «шофер управляет только автомобилем или автобусом, водитель и другими транспортными средствами» Вагоновожатый, судоводитель являются водителями, но не шоферами Два понятия –ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА, –ВОДИТЕЛЬ АВТОМОБИЛЯ Почему водитель и шофер ощущаются как синонимы?
21 Сеть понятий: водитель, шофер ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА (водитель) ТРАНСПОРТНЫЙ РАБОТНИК СУДОВОДИТЕЛЬ ВАГОНОВОЖАТЫЙ (водитель трамвая) ВОДИТЕЛЬ АВТОМОБИЛЯ (водитель) ПРОФЕССИОНАЛЬНЫЙ ВОДИТЕЛЬ (шофер) ТАКСИСТ (шофер такси) ЛИЧНЫЙ ВОДИТЕЛЬ (личный шофер)
22 Заключение Важно стремиться создавать систему различимых понятий даже для лингвистических онтологий Различимое понятие может отличаться набором онтологических синонимов и отношений с другими понятиями Важно формулирование однозначного, понятного имени понятия В этом помогает существование однозначных словосочетаний, синонимичным отдельным многозначным словам Если понятия отличимы, то сеть понятий может быть достаточно подробной Отличимые понятия делают онтологию менее зависимой от конкретного естественного языка
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.