Слово Лексемы и словоформы. Проблема слова «слово» Что называется словом в естественном языке? Самые разные вещи: «В этом стихотворении ровно сто слов»

Презентация:



Advertisements
Похожие презентации
1 Слово Лексемы, словоформы, леммы. 2 Проблема слова «слово» Что называется словом в естественном языке? Самые разные вещи: «В этом стихотворении ровно.
Advertisements

1 Слово Лексемы, словоформы, леммы. 2 Проблема слова «слово» Что называется словом в естественном языке? Самые разные вещи: «В этом стихотворении ровно.
Грамматические формы, грамматические значения и грамматические категории
Лингвистика или языкознание – наука о языке (от греч. «лингва» язык)
Лексика – Слово как лингвистическая единица в языках различных типов. – Понятие лексемы и парадигмы словоформ. – Системность и структурность в лексике.
Владивостокский государственный университет экономики и сервиса Институт иностранных языков Кафедра русского языка ТЕОРЕТИЧЕСКАЯ ГРАММАТИКА Тема 1. Морфология.
Лекция 6 Грамматическое значение и способы его выражения.
Явление многозначности в английском языке Авдеева Екатерина,10 А класс МБОУ СОШ 174 Научное общество учащихся.
12 июля 2008 года Летняя лингвистическая школа. 1 Компьютерная лингвистика как источник лингвистических знаний Леонид Лейбович Иомдин Институт проблем.
Коллокации и конструкции в исследовании структуры текста Лидия Пивоварова Елена Ягунова
Комплексный (парадигматический и экспериментальный) анализ процесса решения регулярных задач Спиридонов В.Ф. (РГГУ, Москва) Х Чтения Выготского-2009.
Тема урока: Синтаксис словосочетания и простого предложения Цель урока: повторить, что входит в понятия «Синтаксис и пунктуация», «пунтограммы», «словосочетание»,
Формальное представление лексических отношений русских глаголов Магистерская диссертация Галушко Надежды Леонидовны (филологический факультет, кафедра.
Русскому языку в школе по Научно-исследовательская работа.
Основные понятия морфологии. 1. Словоформа, лексема и парадигма. Словоформа - конкретно наблюдаемое слово в контексте. Словоформа - конкретно наблюдаемое.
Элементы теоретического программирования Что такое алгоритм?
Морфология Лекция 1 (after Haspelmath, Sims 2011).
Говоря о двух последних «умениях» компьютера, необходимо помнить, что почти во всех существующих системах автоматического реферирования в качестве основных.
1 Измерение информации: алфавитный подход Информация и информационные процессы.
Как измерить информацию. Содержательный подход (субъективный) Сообщение информативно (содержит ненулевую информацию), если оно пополняет знания человека.
Транксрипт:

Слово Лексемы и словоформы

Проблема слова «слово» Что называется словом в естественном языке? Самые разные вещи: «В этом стихотворении ровно сто слов» «До реформы орфографии это слово писалось с ером» или «Это слово мне незнакомо» «Лексический минимум первого года обучения – тысяча слов»

Словоупотребление – единица текста «В этом стихотворении ровно сто слов» Также (word) token, единица измерения корпусов Последовательности символов в тексте, отделенные друг от друга пробелами и знаками препинания

Словоупотребление Чем больше количество словоупотреблений, тем представительнее корпус Word per million, occurences per million – частотная характеристика исследуемого объекта в корпусе Также – например, измерение скорости речи

Словоформа – единица языковой компетенции «До реформы орфографии это слово писалось с ером» «Второго слова в пятой строчке стихотворения Катулла я не понял» Wordform, word form, форма слова В простом случае – последовательность букв Где? Не в тексте

Словоформа – единица языковой компетенции В более сложном случае - «звуков» или звукотипов (ментальных символов хранения словесных артикуляций по СВК) Также, например, единица измерения словника (пока) неизвестного языка (конкорданс)

Лексема – единица словаря «Лексический минимум первого года обучения – тысяча слов» Lexical item, словарный вход Хаспельмат: пользователь словаря не ожидает найти в словаре слово sleeps, но ожидает найти там слово sleep

Лексема – единица словаря Однако это определение для нелингвиста (дан словарь) Оно также зависит от структуры словаря – sleeplessly отдельная лексема, но в словаре в статье sleepless Что попадает в словаре в разные статьи, а что в одну? Впрочем, это не чисто типографский вопрос – хотя и связано с лексикографической традицией (ср. арабские словари), так как коррелирует с вопросом о ментальном лексиконе

Лексическое и грамматическое значение Топор, топора, топору... топоры, топоров, топорам... – что можно сказать про значение этих «слов» эти «слова» имеют одинаковое лексическое значение, различаясь лишь грамматическими значениями

Лексическое и грамматическое значение Топор, топорик, топорный – что можно сказать про значения этих «слов» - эти слова имеют разное лексическое значение - при этом два первых слова имеют одинаковое грамматическое значение

Лексическое значение Различие между грамматическим и лексическим значениями кажется интуитивно ясным Однако мы уже знаем, что набор грамматических значений изменяется от языка к языку

Лексическое значение Якобсон (о Боасе): грамматическое – это то, что говорящий на языке не может не выразить. В русском языке у существительных грамматическое значение – число, падеж лексическое значение – уменьшительность

Словоизменение и словообразование Словоизменение – остаемся в пределах одной лексемы; словообразование – связь между лексемами Традиционно – разные части речи не могут принадлежать одной лексеме, однако проблема абсолютно продуктивных дериваций (например, причастия)

Словоизменение и словообразование Основная проблема – грамматологический подход (обязательность) vs. многие другие подходы, в том числе экспериментальный (продуктивность) Все обязательное продуктивно, но не все продуктивное обязательно

Парадигма (oh no, not again!) Парадигма (в узком смысле) – определенным образом упорядоченный набор словоформ, объединенных общим лексическим значением (т.е. принадлежащих одной лексеме). Впрочем, иногда говорят и о слообразовательной парадигме определенной лексемы, например: - приставочная парадигма глагольной основы (с какими приставками она сочетается)

Лексема ~ словоформа Совокупность словоформ с одинаковым грамматическим значением В этом смысле утверждение Хаспельмата: словоформа эквивалентна паре лексема + набор грамматических значений «Простейшая» задача автоматического анализа текста) – по словоформе получить лексему и набор грамматических значений; по лексеме и набору грамматических значений построить лексему

Лексема Абстрактная сущность – «мешок» словоформ, объединенных общим лексическим значением NB: не совпадает с понятием словарной статьи, словарного входа или начальной формы Словарная статья – описывает лексему Начальная форма – называет ее

Лемма Также: начальная форма, исходная форма Чтобы назвать лексему, неудобно перечислять все входящие в нее словоформы Вместо этого чаще всего используется одна из словоформ. Какая? у существительных? у глаголов? Выбор в значительной степени произволен Теоретически может использоваться и не словоформа, а основа – но это менее удобно носителю языка

Лемма vs. Начальная форма Термин «лемма» в лингвистике имеет легкий компьютерный привкус Но под начальными или исходными формами можно также понимать опорные формы – набор форм, однозначно задающих словоизменительный тип (большинства) лексем данной категории В этом случае понятия исходной (начальной) формы и леммы оказываются различными

Ментальный лексикон В экспериментальной лингвистике лексема может соотноситься с единицей хранения языка (ментальный лексикон) Существуют, однако, модели, в которых такой единицей является морфема коррелирует с вопросом о минимально значимой единице языка – значимой для кого, для говорящего или для лингвиста

«Почему не говорят?» Сложная загадка: почему не говорят, что словоформа – последовательность символов, которые могут встретиться между пробелами? Очень сложная загадка (contra Хаспельмат): почему не говорят, что словоформа – это лексема плюс (полный) набор грамматических значений?