RussNet как компьютерный тезаурус нового типа И.В.Азарова Санкт-Петербургский государственный университет Филологический факультет Кафедра математической.

Презентация:



Advertisements
Похожие презентации
Семантическая структура пропозиции при извлечении фактов из текстов на русском языке СПбГУ: И. В. Азарова ООО «Идеограф»: В. Л. Иванов.
Advertisements

Азарова Ирина Владимировна Синопальникова Анна Алексеевна Кафедра математической лингвистики СПбГУ Смрж Павел Технологический университет Брно (Чехия)
Формальное представление лексических отношений русских глаголов Магистерская диссертация Галушко Надежды Леонидовны (филологический факультет, кафедра.
Взаимодействие эстетических, моральных и прагматических аспектов в семантической структуре оценочных прилагательных русского языка Фомченко А.В.
Обучение лексике. Что означает владеть лексикой? Особенности функционирования любой языковой единицы проявляются в 2х планах: семасиологический аспект.
Текстообразующие функции производных имен прилагательных в романе Б.Окуджавы «Путешествие дилетантов» Магистерская диссертация магистрантки филологического.
1.Название темы одним словом (существительное или местоимение). 2.Определение темы в двух прилагательных или причастиях. 3.Три глагола, показывающих действие.
Анализ тональности сообщений Лидия Михайловна Пивоварова Системы понимания текста.
ЛИНГВИСТИЧЕСКИЕ КОРПУСЫ: НОВОЕ НАПРАВЛЕНИЕ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ Львова Ольга Владимировна доцент кафедры информатизации образования МГПУ.
Лекция 1. Введение в корпусную лингвистику В.П. Захаров Санкт-Петербургский государственный университет.
ПРЕЗЕНТАЦИЯ МАГИСТРАНТКИ ФИЛОЛОГИЧЕСКОГО ФАКУЛЬТЕТА КАФЕДРЫ РОМАНО - ГЕРМАНСКОГО ЯЗЫКОЗНАНИЯ АСТАПКИНОЙ ЕКАТЕРИНЫ СЕРГЕЕВНЫ ПРЕЗЕНТАЦИЯ МАГИСТРАНТКИ ФИЛОЛОГИЧЕСКОГО.
Электронные корпуса Корпусная лингвистика. Корпусная лингвистика ? Корпусная лингвистика - наука, занимающаяся разработкой общих принципов построения.
Синквейн франц. – «пять» - стихотворение из пяти строк.
Поиск информации. Поиск информации – из чего он складывается? Как мы задаем документы? Как задаем запросы? Как вычисляем близость между запросом и документом?
Лекция 10. Лингвистические исследования. Использование корпусов В.П. Захаров Санкт-Петербургский государственный университет.
Семантические отношения как основа построения электронных тезаурусов Докладчик: аспирант КФУ Мансурова Гульнара Камилевна.
Объектно-ориентированное программирование. Объекты: свойства и методы Основной единицей в объектно- ориентированном программировании является программный.
Онтологическая семантика текста: форматирование лексики в семантическом словаре Г.В. Лезин Санкт-Петербургский экономико-математический институт РАН
ЛЕ КСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ ДЛЯ АВТОМАТИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Е. И. Большаков а, Н. Э. Васильева, С.С. Морозов МГУ им. М.В. Ломоносова.
Формирование грамматических понятий. Понятие - форма абстрактного мышления, отражающая существенные признаки предметов и явлений.
Транксрипт:

RussNet как компьютерный тезаурус нового типа И.В.Азарова Санкт-Петербургский государственный университет Филологический факультет Кафедра математической лингвистики

RussNet

WordNet (G.Miller, Ch.Fellbaum) – Психолексикология единица лексического пространства – «синсет» – синонимия «литералов» –критерии синонимии; –глоссы = родовидовые определения; –примеры употребления; родовидовые отношения организуют синсеты в деревья –между родовым и видовым синсетом есть хотя бы один различительный признак ; –доступны согипономы и видны их отличия ; –возможно двойное подчинение синсетов ; «наследование» свойств в родовидовых деревьях «лес» семантических деревьев существительных и глаголов

Структура WordNet

EuroWordNet – Многоязычная лексическая база /

Структура EuroWordNet

Семантические отношения в EuroWordNet n Relation type –NEAR_SYNONYMY –XPOS_NEAR_SYNONYM –HAS_HYPERONYM –HAS_HYPONYM –HAS_XPOS_HYPERONYM –HAS_HOLONYM –HAS_HOLO_PART –NEAR_ANTONYMY –XPOS_NEAR_ANTONYMY –CAUSESIS –HAS_SUBEVENT –IS_SUBEVENT_OF –… –EQ_SYNONYM –EQ_HAS_HYPERONYM –EQ_HAS_HYPONYM –… n Data types –WMWM –… –WMILIR –… n Parts of speech –NN, VV –N>N, V>V –N>N –NN, VV –V>V, N>V… –N>N, V>V… –… –NN, VV… –N>N, V>V … –…

RussNet (Кафедра математической лингвистики) Унаследованные свойства wordnet-словарей n Значения четырех основных ЧР n Опора на корпус современных текстов (21 млн. с/у) n Нетерминологический характер лексикона n Устойчивые словосочетания Объединение синсетов в «семантические деревья» отношением гипонимии или меронимии

Структура RussNet Дополнительные свойства RussNet n синонимы в синсетах упорядочены по частоте встречаемости; есть доминанта синсета n расширен набор собственно семантических отношений n введен набор семантико-деривационных и семантико-грамматических отношений n добавлено описание валентностной структуры, включающее как семантические, так и поверхностно-грамматические атрибуты n прилагательные организованы в иерархические структуры на основе их сочетаемости с существительными введены наборы «семантических деревьев»

Структура RussNet Причины изменения методики построения словаря n специфика русского языка (флективный язык, развитая деривационная система) n отсутствие некоторых источников лексической информации n недостатки и недочеты стандартных методик, ставшие очевидными при практическом использовании wordnet-тезаурусов

Рамки валентности в тезаурусе RussNet n обязательность/ факультативность валентности n активная / пассивная рамка валентностей n общая семантическая характеристика валентности n ролевая характеристика валентности n семантические ограничения на заполнение валентной позиции n грамматическая спецификация валентности