Норма, кодификация и их верификация (демонстрация эффективности сегментно-статистического метода ) В. И. Беликов, ИРЯ РАН На диске (но не в Сборнике материалов)

Презентация:



Advertisements
Похожие презентации
Поиск информации в сети Интернет Презентация 8-11.
Advertisements

БИЦ (библиотечно- информационный центр) МОУ гимназия 28 г. Костромы Поиск информации в Интернете. Поисковая система Яндекс.
Сочинение-рассуждение на лингвистическую тему (Часть С)
ОГЭ 2014 год - 9 класс.Часть 3 Сочинение на лингвистическую тему Подготовил преподаватель русского языка и литературы Мальчихина М.В.
ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ Д.В. Ландэ 1,2, д.т.н., В.В. Жигало 2 1 Институт проблем регистрации информации НАН.
Регулирующие положения по радиационной безопасности Часть I: Значение и структура регулирующих положений.
ГОСУДАРСТВЕННАЯ ИТОГОВАЯ АТТЕСТАЦИЯ 9 КЛАСС. ГИА-9.
Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета. Существуют три основных способа.
Языковая норма Выполнили: Нифантова Алина Цырульникова Юлия.
Авдей Алексей Руководитель сервиса Яндекс.Маркет Кто такие интернет- покупатели?
© Kocherga S.A.. 2 Социально-экономические изменения информационного общества Глобализация в экономике Присоединение России к Болонскому процессу
Результаты пробного ЕГЭ по русскому языку, проведённого Таганрогским государственным педагогическим институтом г.
Жаргон в устной речи современных школьников Работу выполнили : Румак Алена и Бородина Анастасия. Ученицы 6 « Г » класса Школы 25 г. Перми. Руководитель.
Технология проектов или метод проектов. Этапы работы над учебным проектом Предварительный выбор учеником темы с учётом рекомендаций учителя; Составление.
Поиск в русскоязычном Интернете. Поисковая система Я ндекс.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Учителя начальных классов Ботиной Галины Николаевны.
Коллокации и конструкции в исследовании структуры текста Лидия Пивоварова Елена Ягунова
ЛИНГВИСТИЧЕСКИЕ КОРПУСЫ: НОВОЕ НАПРАВЛЕНИЕ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ Львова Ольга Владимировна доцент кафедры информатизации образования МГПУ.
© 2010 Promodowww.promodo.ru Москва +7(495) Разработка и техническая поддержка веб-сайта в контексте поисковой оптимизации.
Транксрипт:

Норма, кодификация и их верификация (демонстрация эффективности сегментно-статистического метода ) В. И. Беликов, ИРЯ РАН На диске (но не в Сборнике материалов) есть большой материал из четырех частей: 1.Методические соображения о лексикографически ориентированном поиске в Интернете (0,2 а. л.); 2.«Непобедимая нога»: спортивная лексика в нормативном словаре [Комплексный нормативный словарь, СПб, дек. 2009] (0,9 а. л.); 3.О частоте встречаемости слов «в Интернете» (0,2 а. л.); 4.О словарях, «содержащих нормы современного русского литературного языка при его использовании в качестве го- сударственного языка Российской Федерации» (4,3 а. л.).

В. А. Ицкович (Очерки синтаксической нормы, 1982): Норма это «комплекс закрепленных речевой практикой языко- вых средств и закономерностей их реализации», объективно существующих «в данное время в данном языковом коллек- тиве». «Имплицитно норма выступает в виде образца или, точнее, текстов, считаемых образцовыми … Эксплицитно, в явном виде, сформулированной, норма предстает перед носи- телями языка в кодификации … Кодификация это фикса- ция объективно существующей языковой нормы, сформулиро- ванная в виде правил (предписаний) в авторитетном лингвистическом издании». Литературной (в т. ч. разговорной) нормой удобно считать то, что служит образцом для большинства носителей литературного языка «в данное время в данном языковом коллективе». Синхронно норма имеет возрастное и территориальное измерение. Кодификация лексики не только (субъективное) мнение лекси- кографа об объективной норме. Значительная часть словаря всегда получала разного уровня официальное утверждение.

«Российская газета» пишет о входных дверях московского метро: Их так мотает от ветра, что и глазом не моргнешь, как получишь по лбу ( ). Писать так можно в частных письмах и романах, а в газетах нельзя. (К счастью, для нарушителей закона пока не введены санкции)

Способы верификации любых языковых фактов: интроспекция, обработка текстов наблюдение, «традиционных» работа с информантом. оцифрованных Общепринятые процедуры верификации фактов, касающихся лексики, на материале оцифрованных текстов: «Гугление», в том числе Яндексом, «в Интернете вообще»: дает идеальные результаты для исключительно редких словоупотреблений при аккуратной (!) работе. Поиск в НКРЯ: дает хорошие результаты для частотных словоупотреблений.

«Интернет вообще», содержательная сторона: Один коллега провел небольшое исследование «Чьи стихи нынче любят?». Искались текстовые фрагменты типа "люблю стихи X-а". В выдачу попали тексты: –Я люблю стихи Коржавина, ценю его публицистику. (Довлатов, «Синтаксис», 1982). почти нынче. –…так нежно я люблю стихи Грибоедова и его самого… (К. С. Станиславский) – Вы любите стихи, Антон Павлович? Да, я очень люблю стихи Пушкина (Л. А. Авилова. А. П. Чехов в моей жизни). Кроме героя незавершенного романа Станиславского, стихи Грибоедова любил только один блоггер 2 февраля 2009 г. Для осмысленности результатов поиска Интернет нужно фрагментировать на относительно однородные сегменты. «Соборное уложение» Алексея Михайловича и блог 12-летней поклонницы японских аниме написаны на разных языках.

Типичное утверждение любителя гугления: Например, написание Таллинн встречается в Интернете 6 млн раз, а Таллин 4 млн раз, употребление предложно-падежной словоформы в Украине использовано на 62 млн страниц Интернета, а словоформа на Украине употреблена на 60 млн страниц. Написание Кыргызстан использовано 6 млн, а Киргизия 10 млн раз. С. А. Кузнецов, Языковая норма и правила речевой деятельности // Комментарий к Федеральному закону «О государственном языке Российской Федерации». Часть 1. Доктринальный и нормативно-правовой комментарий, стр. 32.

При запросе "Украину" должны находиться тексты типа Люблю Украину, инвестировать в Украину, волнуюсь за Украину, еду на Украину, подкоп под Украину через Тузлу и прочее. Всего "Украину" «нашлось на 136 млн страниц»:

Любители высказывания «… встречается в Интернете … млн раз» легко решат уравнение: x = 136. (я не решал жалко времени на интерпретацию)

Поиск словоформы: "Яндексами" vs. !Яндексами. Результаты различаются в два раза и более:

«Ну, подумаешь, Яндекс… Вот Google…» Таллинн погугленный в деталях таков: Таллинн без кавычек: 2 млн 40 тыс. страниц. Поиск по отдельным словоформам: Таллинн Таллинны 785 Таллинна Таллиннов 71 Таллинну Таллиннам 36 Таллинном 98700Таллиннах 39 Таллинне Таллиннами 34 всего ед. ч.: всего мн. ч.965 ед.+мн.: Итого: совокупно на другие словоформы ед. и мн. числа, а также на словоформы двойственного и других чисел, не омонимичные просмотренным: – = (скриншоты для поклонников Googleа на компьютере)

НКРЯ vs. разные сегменты Интернета как выразить по-русски Oper ([кассовый] чек)? 1. субъект кассир/продавец или кассовый аппарат, 2. субъект покупатель. Словари противоречат друг другу В узусе: выби(ва)ть / проби(ва)ть с неясным распределением а также отби(ва)ть чек, которому многие изумляются. НКРЯ: выбить/пробить/отбить на расстоянии от 1 до 10 от чек: По этому запросу ничего не найдено. выбивать/пробивать/отбивать: 19 (13/5/1) (11 с глаголами сов. вида) «Журнальный зал» (magazines.russ.ru ) : 41 (19/15/7) Примеров достаточно для вполне обоснованных гипотез, которые полностью подтверждаются на других сегментах. (Все детали демонстрируются на компьютере)

Спасибо за внимание! Дополнительное Большое Спасибо тем, кто проявит любопытство и подойдет ко мне во время основной части стендовой сессии