Формирование нечетких мер валентностей русскоязычных глаголов Павел В. Толпегин Вычислительный центр им. А.А. Дородницына Российской академии наук (ВЦ.

Презентация:



Advertisements
Похожие презентации
Чем имя существительное отличается от глагола и прилагательного? Шерстнева Елена Владимировна, учитель начальных классов МБОУ СОШ 16, г. Кропоткин.
Advertisements

1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Г.С.Осипов,И.В.Смирнов,И.В.Соченков,А.О.Шелманов, А.В.Швец Институт системного.
12 июля 2008 года Летняя лингвистическая школа. 1 Компьютерная лингвистика как источник лингвистических знаний Леонид Лейбович Иомдин Институт проблем.
Выборка записей из БД по составным условиям. Задание 1 Ответ: 6 записей.
Помощь ученикам в морфологическом разборе имени существительного, имени прилагательного, глагола (разбор слова как части речи) Автор Кочегура И.В., учитель.
НЕДАВНИЕ ИЗМЕНЕНИЯ В УЧЕТЕ ССЫЛОЧНОГО ВЕСА ПРИ РАНЖИРОВАНИИ В ПС «ЯНДЕКС»
Эффективность продвижения в Google в сравнении с Яндексом Дмитрий Яресько
ТЕСТ МАТЕМАТИКА 2 КЛАСС Тема: «Сложение и вычитание в пределах 100 »
Русский язык, 3 класс Имя прилагательное как часть речи урок 85 Автор: Поносова М.А. © ООО «Баласс», 2013.
ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН.
Уравнения.
Муниципальное казенное образовательное учреждение « Седельниковская СОШ 2» Презентация к уроку по теме : « Луч. Числовой луч » Автор : Ахметова Валентина.
Объектная модель многофункциональных словарей Докладчик: Носков А. А. Группа: 525 Научный руководитель: Большакова Е. И.
Единицы времени. Наш тест сейчас Науке посвящается, Что математикой у нас С любовью называется. Мы знаем: время растяжимо. Оно зависит от того, Какого.
Урок - путешествие. Карта города Имя существительное Кладбище неодушевленных и одушевленных Площадь падежей Бульвар числа Посёлок склонений Улица нарицательных.
Единицы времени. Наш тест сейчас Науке посвящается, Что математикой у нас С любовью называется. Мы знаем: время растяжимо. Оно зависит от того, Какого.
Подготовка к контрольной работе. Найди значение выражений 7+7= 14-6= 12-5= 9+9= 9+6= 13-7= 11-4= 6+6= 18-9= 7+8=
Слайды к урокам русского языка в 3 классе по программе Л.И. Тимченко учитель начальных классов МОУ «Гимназия 17» г. Электросталь Московской области Симоянова.
ВСТАВЬ ПРОПУЩЕННЫЕ БУКВЫ. догадался стоит продрог хирург аллея ГЛАГОЛ.
Тема урока: Решение уравнений 3 класс. Устный счёт а) Найдите значение выражений: 48 : 8 – = : (10 – 5) =
Транксрипт:

Формирование нечетких мер валентностей русскоязычных глаголов Павел В. Толпегин Вычислительный центр им. А.А. Дородницына Российской академии наук (ВЦ РАН) Проект выполнен при поддержке ООО « Яндекс » ( _____ г. Переславль-Залесский 2007 год

Задача разрешения местоименной анафоры Подзадача: выбор признаков –> выбор источника данных для формирования признаков Актуальна проблема признака одушевленности [R.Mitkov, 2002] и др. –> Маша i купила машину j. Она i её j любит. –> Hobbss naïve approach тестировался автором вручную. Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.

Значение и влияние мер Проект выполнен при поддержке ООО « Яндекс » ( Федор развел аспирин в стакане и (он) выпил его. [R. Mitkov. Anaphora Resolution. 2002] НЕОД (выпил, его, OBJ) = 0.96 Маша купила машину. Она её любит. [В.Ф. Хорошевский. В разговоре. 2005] НЕОД (любит, она, SUB) = 0.30 НЕОД (любит, её, CONTEN) = 0.61 Если человек думает, что все, что он видит вокруг себя, весь бесконечный мир, точно таков, каким он его видит, то он очень ошибается. [Л.Н. Толстой. Путь жизни. 1910] НЕОД (видит, он, SUB) = 0.33 НЕОД (видит, его, CONTEN) = 0.73 НЕОД (ошибается, он, SUB) = 0.13 RCDL-2007, Переславль-Залесский, октября 2007 г.

Коротко об алгоритме получения нечетких мер валентностей глаголов р.я. Анализатором Диалинг «начитывались» ЕЯ-тексты и декомпозировались в виде слово 1 – валентность – слово 2 он – SUB - видит Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.

Внутреннее содержимое Проект выполнен при поддержке ООО « Яндекс » ( Входные данныеОтвет программыЗапись в базе данных (РОДИТЬ, SUB, жр, ед)P(неод)=0.29РОДИТЬ,SUB,жр,ед,19,45 (РОДИТЬ, SUB, жр, мн)P(неод)=0.5РОДИТЬ,SUB,жр,мн,1,1 (РОДИТЬ, SUB, мр, ед)P(неод)=0.52РОДИТЬ,SUB,мр,ед,10,9 (РОДИТЬ, SUB, мр, мн)P(неод)=0.25РОДИТЬ,SUB,мр,мн,1,3 (РОДИТЬ, SUB, ср, ед)P(неод)=1РОДИТЬ,SUB,ср,ед,3,0 (РОДИТЬ, SUB, ср, мн)P(неод)=1РОДИТЬ,SUB,ср,мн,3,0 (РОДИТЬ, SUB, мн)NULL–– запись отсутствует –– (РОДИТЬ, SUB) P(неод)=0.42 РОДИТЬ,SUB,42,58 RCDL-2007, Переславль-Залесский, октября 2007 г. (1) (2)

Со-подчиненность и меры Проект выполнен при поддержке ООО « Яндекс » ( ГОРЫ Зная, что в со-подчиненной валентности находится неодушевленное существительное горы, мы можем провести выборку из начитанной БД с ограничением на подбор значений. В итоге, число найденный прецедентов (объектов выборки), соответствующих условию «с ограничением» будет меньше, но общий результат (P(неод)) будет «чище». RCDL-2007, Переславль-Залесский, октября 2007 г. (неод.) С 1 видит Машу x С 2 видит лес

теперь о главном… Одушевленность бывает … –грамматическая (определяется по словарю или по падежам); –семантическая (толпа, народ, партия, мэрия, тусовка, хартия, профсоюз, компания «Яндекс», дума, съезд и др. ) В словаре Ожегова есть пометы: –кто (что), что (кто), что, кто, кто-что… Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.

Эффективность мер Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г. Признаки Эффективность, % класс реферирующих пар анафор + антецедент класс нереферирующих пар анафор + антецедент Мера Мера Мера Числа являются показателем: 1.начального приближения метода машинного обучения; 2.число (%) случаев, в которых одушевленность играет решающую роль.

Благодарю за внимание! Вопросы? Ответы! Конакты Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.