Бранко Тошович Institut für Slawistik der Karl-Franzens Universität Graz branko.tosovic@uni-graz.at Грамматическая.

Презентация:



Advertisements
Похожие презентации
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Advertisements

Школьная форма Презентация для родительского собрания.
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Типовые расчёты Растворы
1. Определить последовательность проезда перекрестка
Разработал: Учитель химии, биологии высшей квалификационной категории Баженов Алексей Анатольевич.
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Michael Jackson
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от

1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Ф. Т. Алескеров, Л. Г. Егорова НИУ ВШЭ VI Московская международная конференция по исследованию операций (ORM2010) Москва, октября 2010 Так ли уж.
Двоичная система счисления АЛФАВИТ: 1, 10, 11, 100, 101, 110, 111, 1 000, 1 001, 1010, , 1 100, 1 101, 1 110, 1 111, ,
Напряжения и деформации в сварных швах ТЕМА УРОКА 1.
дней и ночей 27 миллионов жизней советских людей 3.
Азбука – математические термины XVIII Кубок памяти А.Н. Колмогорова, Саров,
Маршрутный лист «Числа до 100» ? ? ?


Транксрипт:

Бранко Тошович Institut für Slawistik der Karl-Franzens Universität Graz Грамматическая аннотация для Гралис-Копруса Казанская школа-семинар по компьютерной и когнитивной лингвистике: TEL2014 Языковая семантика: модели и технологии Казань: 6–9 февраля 2014 г. Научно-исследовательский институт «Прикладная семиотика» Академии наук Республики Татарстан

111 Содержание 1.Gralis-Korpus 2.Gralis-MorphoGenerator 3. Морфологическая разметка 4. Порождение парадигм 5. Правила порождения 6. Закономерности 7.Перспективы

2 Гралис-Корпус

Сопоставительное изучение славянских языков 3

Типы разметки метаязыковая морфологическая синтаксическая семантическая стилистическая 4

Морфологическая аннотация 5

Научно-исследовательский проект (2006–2010) Австрийского фонда для поддержки научных исследований (FWF: Fonds zur Förderung der wissenschaftlichen Forschung: FWF- Projekt, P19158-G03) 6

7

Разметка Multext-East кодировка (Multilingual Texts and Corpora for Eastern and Central European Languages – multilingual dataset for language engineering research and development) 8 Морфологическая разметка

9

CQP 10 Поиск

11

12

13

14

Позиции (28) 1. часть речи, 2. подтип части речи, 3. наклонение, 4. время, 5. лицо, 6. число, 7. род, 8. залог, 9. отрицание, 10. определенность, 11. возвратность, 12. падеж, 13. одушевленность, 14. клитика, 15. вид, 15 Грамматическая кодировка

16. вежливость, 17. переходность, 18. ударение, 19. способ глагольного действия, 20. лексико-семантическая группа, 21. сочетание (управление, согласование), 22. экспрессия, 23. функциональный стиль, 16

24. аналитическая форма, 25. деструкция, 26. словообразование, 27. номер порождения, 28. грамматический тип порождения 17

1. Часть речи n существительные, v глаголы, a прилагательные, p местоимения, r – наречия, s предлоги, c союзы, m числительные, i междометия, q частицы, y аббревиатуры 18

2. Подтип части речи Существительные: c – нариц., p – собств., m – вещестр., l – собират. Глаголы: m – полнозначн., a – вспомогат., o – модальн., c – связочн., b – базовый. Прилагательные: f – качеств., r – относит., m – веществ., s – притяж., o – порядк., m – количеств. 19

Местоимения: p – личн., d – указат., i – неопред., s – притяж., q – вопрос., r – относит., x – возвр., z – отриц., g – общ., y – вопрос.- относ., j – определ., t – указат.-относит. Наречия: g – общ., z – отриц., a – адъективн., v – глагольн., q – вопросит. 20

Предлоги: p – препозитивн., t – постпозитивн. Союзы: c – сочин., s – подчинит. Числительные: c – количеств., o – порядк., m – итеративн., l – видов., s – специальн. Частицы: z – отриц., q – вопрос., o – модальн., r – положит. Аббревиатуры: n – именн., r – наречн. 21

3. Тип формы Глаголы: i – изъявит., накл., m – повелит. накл., c – сосл. накл. 1, h – сосл. накл. 2, n – инфинитив, p – причастие, g – деепричастие 1 (несов. в. / нас. вр.), w – деепричастие 2 (сов. в. / прош. вр.), u – супин, t – переходн., q – циритов., s – гипотетич. 22

Прилагательные: степени сравнения – p: положит. ст., c – сравнит. ст., s – превосх. ст. Наречия: степени сравнения – p: положит. ст., c – сравнит. ст., s – превосх. ст., e – элятив 23

4. Время p – презенс, i – имперфект, f – будущ. 1 Ср (серб.), w – будущ. 1 Хр (хорв.), z – будущ. 1 Ср/Хр (серб./хорв.), q – будущ. 2, s – перфект, l – плюсквамперфект 1, t – плюсквамперфект 2, a – аорист 24

5. Лицо 1 – первое, 2 – второе, 3 – третье 6. Число s – ед. ч., p – мн. ч., d – двойств. ч., l – собират. ч. 7. Род m – м. р., f – ж. р., n – ср. р., l – общий р. 25

8. Залог a – действ. залог, p – страд. залог 9. Отрицание n – да, y нет 10. Определенность n – да, y нет 11. Возвратность n – да, y нет 26

12. Падеж n – им. п., g – род. п., d – дат. п., a – вин. п. v – зват. п., l – предл. п., i – творит. п. 27

13. Одушевленность n – да, y нет 14. Клитика n – да, y нет 15. Вид p – несов. в., e – сов. в., b – двойн. в. 16. Вежливость n – да, y нет 28

17. Переходность n – да, y нет 18. Деструкция n – да, y нет 19. Словообразование s – непроизв., c – сложн. 20. Тип 01, 02, 03… 29

Существительные (turist) Прилагательные (jasan) Глаголы (pisati) 30

Незаполненные позиции 11. возвратность, 16. вежливость, 18. деструкция, 19. словообразование 31

Пока отсутствует 18. ударение, 19. способ глагольного действия, 20. лексико-семантическая группа, 21. сочетание (управление, согласование), 22. экспрессия, 23. функциональный стиль, 24. аналитическая форма 32

MorphoGenerator 33

34

35

36

37

38

39

40

41

42

43

Закономерности 1. Два противоположных правила для порождения форм и парадигм 2. Общие и частичные правила 3.Структурные, категориальные и интеркатегориальные правила 4.Соотношение: число правил число окончаний 44

45 5.Соотношение: число и структура правил часть речи

6. Усложнение морфологической разметки наличие отдельных норм для трех очень близких языков – сербского, хорватского и бошняцкого 46

Перспективы 1. Корректура 2. Снятие грамматической омонимии 3. Морфологическая разметка других славянских языков 4.Синтаксическая, семантическая и стилистическая разметки 47

Литература Tošović 2008: Tošović, Branko (Hg). Das Gralis-Korpus. In: Branko Tošović (Hg.). Die Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen. Graz: Lit. 724–749. Tošović 2013: Tošović, Branko. Гралис-Корпус. In: Wiener slawischer Almanach. – München: Verlag Otto Sagner, c/o Kubon & Sagner. – Sonderband, 83. – S. 89–