Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемИлья Шкандыбин
1 Формирование нечетких мер валентностей русскоязычных глаголов Павел В. Толпегин Вычислительный центр им. А.А. Дородницына Российской академии наук (ВЦ РАН) Проект выполнен при поддержке ООО « Яндекс » ( _____ г. Переславль-Залесский 2007 год
2 Задача разрешения местоименной анафоры Подзадача: выбор признаков –> выбор источника данных для формирования признаков Актуальна проблема признака одушевленности [R.Mitkov, 2002] и др. –> Маша i купила машину j. Она i её j любит. –> Hobbss naïve approach тестировался автором вручную. Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.
3 Значение и влияние мер Проект выполнен при поддержке ООО « Яндекс » ( Федор развел аспирин в стакане и (он) выпил его. [R. Mitkov. Anaphora Resolution. 2002] НЕОД (выпил, его, OBJ) = 0.96 Маша купила машину. Она её любит. [В.Ф. Хорошевский. В разговоре. 2005] НЕОД (любит, она, SUB) = 0.30 НЕОД (любит, её, CONTEN) = 0.61 Если человек думает, что все, что он видит вокруг себя, весь бесконечный мир, точно таков, каким он его видит, то он очень ошибается. [Л.Н. Толстой. Путь жизни. 1910] НЕОД (видит, он, SUB) = 0.33 НЕОД (видит, его, CONTEN) = 0.73 НЕОД (ошибается, он, SUB) = 0.13 RCDL-2007, Переславль-Залесский, октября 2007 г.
4 Коротко об алгоритме получения нечетких мер валентностей глаголов р.я. Анализатором Диалинг «начитывались» ЕЯ-тексты и декомпозировались в виде слово 1 – валентность – слово 2 он – SUB - видит Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.
5 Внутреннее содержимое Проект выполнен при поддержке ООО « Яндекс » ( Входные данныеОтвет программыЗапись в базе данных (РОДИТЬ, SUB, жр, ед)P(неод)=0.29РОДИТЬ,SUB,жр,ед,19,45 (РОДИТЬ, SUB, жр, мн)P(неод)=0.5РОДИТЬ,SUB,жр,мн,1,1 (РОДИТЬ, SUB, мр, ед)P(неод)=0.52РОДИТЬ,SUB,мр,ед,10,9 (РОДИТЬ, SUB, мр, мн)P(неод)=0.25РОДИТЬ,SUB,мр,мн,1,3 (РОДИТЬ, SUB, ср, ед)P(неод)=1РОДИТЬ,SUB,ср,ед,3,0 (РОДИТЬ, SUB, ср, мн)P(неод)=1РОДИТЬ,SUB,ср,мн,3,0 (РОДИТЬ, SUB, мн)NULL–– запись отсутствует –– (РОДИТЬ, SUB) P(неод)=0.42 РОДИТЬ,SUB,42,58 RCDL-2007, Переславль-Залесский, октября 2007 г. (1) (2)
6 Со-подчиненность и меры Проект выполнен при поддержке ООО « Яндекс » ( ГОРЫ Зная, что в со-подчиненной валентности находится неодушевленное существительное горы, мы можем провести выборку из начитанной БД с ограничением на подбор значений. В итоге, число найденный прецедентов (объектов выборки), соответствующих условию «с ограничением» будет меньше, но общий результат (P(неод)) будет «чище». RCDL-2007, Переславль-Залесский, октября 2007 г. (неод.) С 1 видит Машу x С 2 видит лес
7 теперь о главном… Одушевленность бывает … –грамматическая (определяется по словарю или по падежам); –семантическая (толпа, народ, партия, мэрия, тусовка, хартия, профсоюз, компания «Яндекс», дума, съезд и др. ) В словаре Ожегова есть пометы: –кто (что), что (кто), что, кто, кто-что… Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.
8 Эффективность мер Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г. Признаки Эффективность, % класс реферирующих пар анафор + антецедент класс нереферирующих пар анафор + антецедент Мера Мера Мера Числа являются показателем: 1.начального приближения метода машинного обучения; 2.число (%) случаев, в которых одушевленность играет решающую роль.
9 Благодарю за внимание! Вопросы? Ответы! Конакты Проект выполнен при поддержке ООО « Яндекс » ( RCDL-2007, Переславль-Залесский, октября 2007 г.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.