Так ли нам нужен флот? Проблема "язык или диалект" и попытка лексикостатистического подхода Коряков Ю.Б.

Презентация:



Advertisements
Похожие презентации
Основные рабочие понятия исследовательской деятельности учащихся: Исследовательская деятельность учащихся – деятельность, связанная с решением творческой,
Advertisements

ИССЛЕДОВАТЕЛЬСКИЙ ПРОЕКТ ШКОЛЬНИКА. Какими знаниями, умениями и навыками должен овладеть юный исследователь?
Большая часть классического численного анализа основывается на приближении многочленами, так как с ними легко работать. Однако для многих целей используются.
CENTER «Дорожная карта» Популярное ныне словосочетание, нашими усилиями, приняло новый облик Идея «раздута» до автоматизации Без изменения содержания.
Генеалогическая классификация языков. Генетическая классификация по признаку родства, т. е. общего происхождения основана на их общем происхождении от.
Выполнила: Студентка гр. ЗФ 409/ к Садыкова Е.Р.
Методика и определение SWOT-анализа
Вторичная языковая личность Вторичная языковая личность Составила: Э.Г.Нуриева.
Доверительный интервал и доверительная вероятность.
Слово «статистика» происходит от латинского слова "статус"(status) - "определенное положение вещей"
1 Вопросы 1. Как ты считаешь, ты, твоя жизнь значимы для Вселенной? 2. Что означает «сознательное проживание»? 3. «Если я живу, значит кому-то это надо!».
Объектно - ориентированное программирование. Профильные курсы информатики, ориентированные на программирование.
Содержание: Понятие и определение популяции у генетиков и экологов Распределение особей в популяциях Характеристики популяций (популяционные параметры)
Правовые системы современности. Система права это внутренняя структура права (строение, организация), которая складывается объективным образом как отражение.
Основы построения телекоммуникационных систем и сетей Лекция 16 «Методы оценки надежности» профессор Соколов Н.А.
Исследовательская работа на тему: «ПРИЗНАКИ ДЕЛИМОСТИ НАТУРАЛЬНЫХ ЧИСЕЛ».
Подготовил Андреев Алексей. Задача о назначениях Задача о рюкзаке Задача коммивояжера Задача теории распределений Задача маршрутизации транспорта Задача.
МЕЖДУНАРОДНЫЕ ДОГОВОРЫ В ПРАВОВОЙ СИСТЕМЕ РОССИЙСКОЙ ФЕДЕРАЦИИ.
Оценка метапредметных результатов обучения через освоенные учащимися универсальные учебные действия Скворцов Павел Михайлович.
ПОДХОДЫ К ОЦЕНКЕ УРОВНЯ СФОРМИРОВАННОСТИ КЛЮЧЕВЫХ КОМПЕТЕНЦИЙ УЧАЩИХСЯ.
Транксрипт:

Так ли нам нужен флот? Проблема "язык или диалект" и попытка лексико статистического подхода Коряков Ю.Б.

Язык или диалект? Один из вечных вопросов лингвистики. Причем последствия такого решения могут выходить и далеко за её пределы.

Для чего? Лингвисты сами постоянно оперируют, используют или ссылаются на понятие «язык», но всячески открещиваются от попыток определить, чем он отличается от диалекта Когда нас интересует «точка» – всё равно как называть: язык бесермян, говор/язык села такого-го, китайский язык Когда же рассматривается цельное множество, важны как относительная иерархия, так абсолютный вес идиомов в сравнении с другим множествами.

Для чего? В прикладной аспектах: –для подсчёта индексов типа LDI, ILD; –программы по сохранению языков; –выработка литературных норм; –создание стройной терминологии, чтоб не было «диалект Х диалекта Y диалектной группы Z» Инвентаризация объектов: –сколько языков в стране, регионе, семье/группе, в мире? сколько языков описано в какой-либо работе: –для составления баз данных (Ethnologue, Glottolog, Linguasphere); –присвоение ISO-кодов; –при рисовании карт.

Для чего? Часто это нужно не самим лингвистам, а другим областям: –Демографам/статистикам – для проведения переписей –Этнографам – для понимания/описания этнических процессов Да просто: как должна называться статья в «Языках мира» – язык, диалект или "язык/диалект" ?

Требования к критериям Каким требованиям должен отвечать критерий определения яз/д-т, чтобы можно было ответить на выше поставленные вопросы?

Требования к критериям Универсальность Постоянство во времени Непротиворечивость Генетическая последовательность

Требования: Универсальность Критерий должен быть применим к любой паре идиомов. Наиболее важное требование: про любой идиом мы должны уметь сказать является он самостоятельным или нет.

Требования: Постоянство во времени Отнесение идиома к тому или иному языку не должно быстро меняться. Т.е. понятно, что со временем языки развиваются, и, скажем, два диалекта через лет могут стать разными языками. Но если новые языки могу возникнуть в любой момент, то это неудобно.

Требования: Непротиворечивость Один идиом может относиться только к одному языку. Не должно быть так, что при использовании одного критерия один и тот же диалект входит и туда, и туда.

Требования: Генетическая последовательность Генетически родственные диалекты не должны резаться на разные языки. Не должно быть, скажем, так:

Критерии две основные группы критериев: внешние (социо-этно-политические) внутренние (структурные). Лучше не использовать термины «субъективные» и «объективные»: разное понимание.

Внешние критерии (социо-этно-политические) Наиболее популярны в отечественной лингвистике: Эдельман, Алпатов, Мечковская, и др. На западе в меньшей степени.

Внешние критерии (социо-этно-политические) Обычная логика: смотрим реальные различия – они плохо соотносятся с принятыми границами языков. Вывод: нужно использовать внешние критерии. Иной вариант: внешние критерии не работают – значит надо использовать языковые различия.

Внешние критерии (социо-этно-политические) Часто считаются как более важные по сравнению с чисто языковыми: Алпатов В.М.: «Таким образом, на основе лишь лингвистических данных различить диалект и язык невозможно»

Внешние критерии (социо-этно-политические) Общая наддиалектная норма Этническая ориентация Мнение носителей Политический фактор

Общая наддиалектная норма Два идиома считаются диалектами одного языка, если у них: общий письменный стандарт (литературная норма), независимый от других языков (нем. Dachsprache «язык-крыша»); или общее наддиалектное койне.

Не применим к бесписьменным регионам. Общая письменная традиция часто объединяет довольно далеко разошедшиеся идиомы: итальянские, немецкие, арабские, китайские «диалекты»; или даже слабо родственные языки: латынь в средние века. Общая наддиалектная норма

У разных частей одного идиома могут оказаться разные «крыши»: белорусский Смоленщины, западно полесские, торлакские (3 крыши), нижнесаксонские Нидерландов/Германии. Общая наддиалектная норма

Используя этот критерий, мы всё равно ориентируемся на степень близости между идиомами: норма ведь наддиалектная. Если баски, бретонцы или эльзасцы пользуются лит.французским – мы ведь не называем их языки диалектами французского. Σλαβικά διάλεκτος в Греции: греки-слово фоны. Т.е. всё равно нужно определить, где граница между языком и диалектом. Общая наддиалектная норма

Изменчивость. Как только возникает отд. лит. норма – получается отд. язык. Черногорский, славянские микроязыки, региональные языки в Европе, … Общая наддиалектная норма

Выполнимость критериев: Универсальность Постоянство во времени – Непротиворечивость – ~ Генет. последовательность Общая наддиалектная норма

Этническая ориентация Если носители обоих идиомов относятся к одному этносу, значит это один язык, если к разным разные: Один народ = один язык (то, на чём говорят русские – это русский язык; белорусы – белорусский).

Этническая ориентация Однако определение народа является ещё более сложным: скорее, одним из параметров для классификации народов является языковой, а не наоборот. Связь между этносом и языком довольно искусственна, она характерна либо для: родо-племенного строя: племя язык «социалистических» наций: нация язык

Этническая ориентация Во многих регионах: либо вообще нет чёткого этнического самосознания (часть Зап.Европы, арабские страны,..) либо соответствие между «народами» и языками отсутствует (Индия, Лат.Америка,..).

Этническая ориентация Но даже там где оно есть, постоянны общепризнанные нарушения: 1 народ несколько языков: Россия: мордва, аварцы, Европа: французы, ирландцы, грузины, греки 1 язык несколько народов: Россия: карачаево-балкарский, кабардино- черкесский Европа: немецкий, английский, сх

Этническая ориентация В пределах одного народа м.б. много самоназваний, и наоборот, одно самоназвание может использоваться для нескольких народов. ханты: χ ɑ nti / k ɑ ntə ɣ / хандэ адыгейцы / кабардинцы: ad ɨɣ ə курды: Kurd, Kurmancî и др. Чему тогда следовать?

Этническая ориентация Выполнимость критериев: Универсальность Постоянство во времени – Непротиворечивость – ~ Генет. последовательность

Мнение носителей Спрашиваем у носителя, на каком языке он говорит – так и считаем. Но…

Мнение носителей Знание о «собственно языке» и его границах с другими языками не является частью наивной картины мира. Спрашивать у носителя про «собственно язык» – это всё равно, что спрашивать сколько у него в языке падежей или какая используется морфосинтаксическая стратегия. Либо он не знает, либо повторит то, что выучил в школе, услышал по радио и т.д. Большинству "неразвитых" обществ это не важно и многие просто говорят "наш/обычный/простой язык". Поэтому мнение носителей в целом малозначимо.

Мнение носителей Примеры самоназваний = «наш/обычный язык» : тутэйши / по-просту – Полесье našinski – горане (торлакское наречие) naš jezik – молизские хорваты qatô:k ("наш язык") – язык моче (майяские языки) lishán didán ("наш язык") – еврейско-арамейские языки ombeayiiüts ("наш язык") – язык уаве (Мексика) nou ling ("наш язык") – индо-португальский креол ŋyeshaŋ ("наш язык") – язык мананг (Непал, ТБ языки) meänkieli ("наш язык") – финский диалект в Швеции и т.д.

Мнение носителей В пределах языка/народа м.б. много самоназваний, и наоборот, одно самоназвание может использоваться для нескольких языков. пушту: пашто, пахта, пухто, пушту,.. (см. также примеры выше про народы)

Мнение носителей Мнение о языках легко формируется государством и сми. Молдавский/румынский язык в Молдавии: в 2004 г. 17% назвало своим родным языком румынский, а 60% – молдавский. Черногорский язык: 22% в 2003, 37% в Боснийский/босняцкий/босанский язык.

Мнение носителей Как говорят многие носители: «Ты лингвист, ты и скажи нам, диалект это или язык».

Выполнимость критериев: Универсальность Постоянство во времени – ~ Непротиворечивость – Генет. последовательность ~ Мнение носителей

Политический фактор Законы могут влиять на … 1. названия гос.языков и тем самым самоидентификацию носителей (сх, молд, индонез.) 2. признание тех или иных идиомов (региональными) языками (Европейская хартия) 3. непризнание языков языками (Китай)

Политический фактор молдавский и румынский языки в советское время считались разными языками, сейчас в Молдавии используются то одно, то другое название; малайский язык в Индонезии официально именуется индонезийским, в Малайзии используются оба названия: «малайский» и «малайзийский»; 1. Названия языков часто определяются гос.актами, что может повлиять на самоидентификацию носителей:

Политический фактор 2. Признание тех или иных идиомов (региональными) языками (Европейская хартия) не все страны хотят её принимать (Франция) идиом м.б. признан в одном гос-ве языком, а в другом оставаться диалектом (лимбургский в Нидерландах и Бельгии)

Политический фактор 3. Непризнание языков языками. Однако в одних случаях лингвисты обращают внимание на мнение государства (Китай), в других считают его реактивным (Грузия – мегрелы, сваны).

«Язык это диалект с армией и флотом» Шутливая фраза, популяризованная Максом Вайнрайхом, имеет мало смысла. Есть много государств с армиями (США, Бразилия, арабские страны), диалекты которых ничуть не становятся языками, и наоборот. Единственный её возможный смысл: когда возникает новое государство, местный идиом может быть провозглашён отдельным языкам (иногда со сменой названия): Югославия, Индонезия. Обратный случай: Молдавия.

Сводная таблица требований критериев Критерии Требования Лит. норма Этн. общность Мнение носителей Полити ка Универсальность Постоянство во времени ~ Непротиворечивос ть ~~ ~ Генет. последовательность ~

Примеры сложных ситуаций На практике используется некоторое мозаичное переплетение разных критериев. В одних случаях мы ориентируемся на то, в других на это. Но нередко консенсус среди лингвистов признаёт наличие отд. языка, даже когда ни один из внешних критериев не работает.

Пример: славяне Юж.Косова группа этн. перепись самоназвание языка язык, перепись горанегоране, бошнякигорански, нашенскигоранский, бошняцкий, сербский средчане (жупляне) бошняки, сербынашенски, жупски / сретечки боснийский, сербский подгоране (прекокамцы) бошнякинашенскибоснийский рафчанеалбанцырафчански, нашенскисербский яневцыхрватскихорватский

Черногория В 2011 году: 45% считало себя черногорцами 37% назвало свой язык черногорским. Эти цифры меняются с каждым годом:

Примеры сложных ситуаций Критерии Язык Лит. норм а Этн. общно сть Мнени е носите лей Политика Мнени е лингви стов Мегрельский Андийские Цаконский Во всех этих случаях играют роль только лингвистические различия.

Внутренние критерии (структурные) Опираются на фактические различия между идиомами. Должны быть независимы от мнения людей. Требуется сначала определить признаки сравнения, а затем пороговый уровень отличий. Возможны несколько подходов.

Сравнительно-исторический метод Взаимопонятность Измерение структурных различий Внутренние критерии (структурные)

Сравнительно-исторический метод – хорош для определения степени близости диалектов и границ между ними. Позволяет определить относительные различия, но не даёт ответа на вопрос, где начинается уже отдельный язык. Можно использовать как дополнительный к другим способам. Сравнительно- исторический метод

Взаимопонятность Наиболее популярный лингвистический критерий: если носители разных идиомов достаточно хорошо понимают друг друга (говоря каждый на своем идиоме), значит они говорят на диалектах одного языка, если же нет на разных языках.

Взаимопонятность На практике осложняется многими другими факторами: предварительное знакомство с языком собеседника, тема общения, само желание или нежелание понимать собеседника и прочее. Поэтому этот структурный критерий становится социально обусловленным. Кроме того, нередки ситуации «полукоммуникации», когда каждый из собеседников говорит на родном языке, но при этом свободно воспринимает язык собеседника.

Взаимопонятность Сложен в применении: обычно определяется на глазок. Существует сложные методики, которые требуют значительных усилий и всё равно не убирают до конца субъективности.

Измерение структурных различий Можно предположить, что степени взаимопонятности соответствует степень структурных различий. Однако, как их измерить? Неизвестно универсального способа сравнить разницу в грамматике для всех языков в мире. Остаётся лексика.

Измерение структурных различий Но лексики тоже много и всю её сравнивать тоже будет не универсально. Остаётся базовая лексика. И здесь наиболее оптимально использовать 100-словный список Сводеша, по которому уже накоплен большой опыт сбора и большое количество собранных списков.

Лексикостатистика Гипотеза: Предположим, что есть такой порог, что если процент совпадений (ПС) по списку базовой лексики между двумя идиомами ниже его, то их можно считать двумя разными языками, если выше – диалектами одного языка.

Лексикостатистика Идея не новая: Сводеш / Вурм: 80% Кауфманн (индейские языки) Предлагаемая ниже система призвана привнести некоторый порядок в этот хаос, как некогда Линней – в систематику живых существ.

Лексикостатистика Для проверки нужны много качественно собранных и обработанных списков. Лучший источник: Глобальная лексикостатистическая база данных (GLD) созданная силами московских компаративистов под руководством Г.Старостина и А.Касьяна. На февраль 2016 включала списки по 412 языкам из 87 групп и продолжает развиваться. Использовались также другие источники, но они менее надёжны.

Лексикостатистика Попробуем определить этот порог. Возьмём ПС для 130 пар близкородственных идиомов (ПС > 80). Расположим их по двум осям: y – процент совпадений x – наше представление о том, между какими парами есть взаимопонимание. Для части пар мы заранее не знаем – серая зона.

серая зона – мы не знаем, языки это или диалекты.

Сравнение Итак, мы видим, что границу между диалектами и языками (если не брать во внимание пары в серой зоне) можно провести между 90 и 89 %. Возможно лучше считать 89-90% переходной зоной и учитывать в таких случаях дополнительные факторы.

Соотношение 2 типов «языка» и терминология Традиционный "язык" и лингвистический "язык " могут соотноситься тремя способами: язык трад > язык линг (макроязык) язык = язык язык трад < язык линг (язык. кластер)

язык трад > язык линг Один традиционный «язык» на самом деле состоит из нескольких языков. Может употребляться термин «макроязык», чтобы показать их социальное единство: арабские, китайские, даргинские, хантыйские, греческие, итальянский…

Итальянский Чётко разбиваются ретороманские, причём фриульский объединяется с венетским. Хорошо выделяются: сев.-итальянский ареал тосканский язык южно-итальянский язык

Итальянский Североитальянский (без «н») представляет собой типичный диалектный континуум. Приблизительно его можно разделить на 3 части: Запад: пьемонтско-лигурийский Север: ломбардский Юго-восток: эмильяно- романьольско- венетско-фриульский Эмильянская зона Романьольско- нижневенетская зона Верхневенетско- фриульская зона

Обско-угорские языки Выделяются три хантыйских языка: –северный –южный –восточный Мансийский: континуум из трёх компонентов

Китайские языки Критерии за разные языки Лит. Норма~ Этн. общность Мнение носителей~ Политика Взаимопонимание Лексикостатисика Мнение лингвистов~ Один из камней преткновения. Даже по традиционным методам неоднозначно. Взаимопонимание отсутствует. Лексикостатистика даёт огромные расхождения: больше чем для германских или романских. Однако данных по отдельным идиомам пока очень мало, поэтому сказать сколько именно языков пока нельзя.

Другие случаи Пары с ПС < 90 % (т.е. языки): греческие языки: отдельно цаконский, каппадокийский, фарасский; другие пока не посчитаны; арабские языки – ПС между меккским и ливанским «д-тами» = 83%, требуется дальнейшее изучение.

язык трад < язык линг Несколько традиционных языков на самом деле являются диалектами/наречиями одного языка. Этот случай более тяжело воспринимается как лингвистами, так и носителями. По сути он не так важен, как первый случай.

язык трад < язык линг Таксономически в таких случаях вводиться несколько иная терминология: ПС язык трад < язык линг пример < 90%язык языковой кластер коми 90-95%наречие«язык» коми- зырянский > 95%диалект ижемский

Скандинавские языки Состоят из двух языковых кластеров (=языков): островной кластер с двумя традиционными «языками» (=наречиями): исландским и фарерским континентальный кластер с тремя «языками»: норвежским, шведским, датским (вкл. букмол)

Восточнославянские языки Наиболее близки оказываются белорусский и украинский (ПС = 95), а у русского усреднённый ПС с ними = 88,7. Т.е. можно говорить о белорусско- украинском языковом кластере с двумя «языками».

Другие примеры Пары с ПС > 90 % (т.е. диалекты): 96: коми-зырянский / пермяцкий 96: ульчский / орокский 95: украинский / белорусский 95: кетский / югский 93: корякский / алюторский 91: чешский/словацкий

Сложные ситуации Диалектный континуум Пиджинизация и смешанные языки Сильное иноязычное или межъязычное влияние: количество заимстований извне или между сравниваемыми идиомами зашкаливает (балкано- романские)

Выводы Существует две сущности под названием «язык»: собственно язык – набор лингвистических характеристик, сидящий в голове у носителя социальный язык – это проекция собственно языка, на которую наложены другие факторы, типа этнического сознания, лит. языка, политики и т.д.

Выводы Не существует единых критериев для решения проблемы «язык или диалект». Поэтому, утверждая, что некий идиом является именно языком или именно диалектом, необходимо оговаривать, какой «язык» имеется в виду и на основании каких критериев делается этот вывод. Это значит, что на вопрос «язык или диалект?» нельзя ответить просто «да» или «нет», не оговаривая, что имеется в виду.

Выводы Для разных целей может быть востребовано то или иное понимание языка. Для целей, описанных в начале, важно скорее структурное понимание. Но «социальный язык» тоже очень интересен и должен изучаться. Присылайте вопросы и предложения: СПАСИБО!