КОРПУС ТЕКСТОВ КАК ОСНОВА МЕТОДОВ МНОГОФАКТОРНОГО АНАЛИЗА (ГЛАГОЛ «РАЗЛИЧИТЬ – РАЗЛИЧАТЬ») (ГЛАГОЛ «РАЗЛИЧИТЬ – РАЗЛИЧАТЬ») Соколова Е.Г. РГГУ, Москва,

Презентация:



Advertisements
Похожие презентации
Лекция 6 Грамматическое значение и способы его выражения.
Advertisements

1. Сущность и алгоритм работы с терминами и понятиями. 2. Сущность и алгоритм работы с понятиями «теория», «закономерность», «закон». 3. Сущность понятий.
Николай Иванович Субботин, д.Заборье, 2008 г. Учись учиться.
Грамматическая основа предложения Разбор заданий.
Компьютерное математическое моделирование в среде Excel.
Учитель информатики высшей категории МОУ СОШ 28 Мартынова Нина Михайловна На тему : Объекты и модель окружающего мира Учебный модуль Системно - информационная.
1 Человек и информация. 2 Информация для человека – это знания, которые он получает из различных источников. Сообщение, полученное человеком, может пополнить.
Теория систем и системный анализ Тема1 «Системные исследования. Теория систем»
1. Провести углубленный анализ познавательной деятельности человека 2. Определить все составляющие познавательной деятельности 3.Рассмотреть ступени и.
В. Дихтяр ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ (для бакалавров) Российский университет дружбы народов Институт гостиничного бизнеса и туризма Раздел 1.Разработка.
ФОРМЫ ОРГАНИЗАЦИИ НАУЧНОГО ЗНАНИЯ идеи концепции теории законы понятия положения факты Концепция - система взглядов, то или иное понимание процессов,
Восприятие – это отражение в сознании человека непосредственно воздействующих на органы чувств предметов и явлений в целом, а не отдельных их свойств,
Методы работы с источниками информации Неграмотным человеком завтрашнего дня будет не тот, кто не умеет читать, а тот, кто не научился при этом учиться.
Формы познания: чувственное и рациональное, истинное и ложное.
ПОНЯТИЕ КАК ФОРМА МЫШЛЕНИЯ. КАК ОБРАЗУЮТСЯ ПОНЯТИЯ.
В. И. Дихтяр ИНФОРМАТИКА Российский университет дружбы народов Институт гостиничного бизнеса и туризма Раздел 3Моделирование объектов и процессов и его.
ПОНЯТИЕ КАК ФОРМА МЫШЛЕНИЯ. КАК ОБРАЗУЮТСЯ ПОНЯТИЯ.
LOGO Алгебра логики. Логика изучает внутреннюю структуру процесса мышления, который реализуется в таких естественно сложившихся формах как: понятие суждение.
Развитие мышления на логопедических занятиях учащихся начальных классов коррекционной школы 8 вида. Учитель-логопед Климченко С.Р.
Теория экономических информационных систем Семантические модели данных.
Транксрипт:

КОРПУС ТЕКСТОВ КАК ОСНОВА МЕТОДОВ МНОГОФАКТОРНОГО АНАЛИЗА (ГЛАГОЛ «РАЗЛИЧИТЬ – РАЗЛИЧАТЬ») (ГЛАГОЛ «РАЗЛИЧИТЬ – РАЗЛИЧАТЬ») Соколова Е.Г. РГГУ, Москва, Россия Кононенко И.С. ИСИ СО РАН, Новосибирск, Россия

Глаголы и «generation gap» Традиционные лексические описания глаголов – это описания их значений, т.е. «образов» процессов и отношений сопоставлен- ных некоторым «ситуациям действительности». Значения глаголов формализуются в КЛ на основе традиционных описаний в виде Моделей управления или Фреймов. В этом качестве значения используются при анализе текста, в частности, корпусными технологиями, которые находят подобные образы-контексты в разных текстах. Но эти значения неэффективны в ГТЕЯ, где вход представлен в терминах МПО. В 1991 г. М. Метье формулирует понятие generation gap, обозначив «пропасть» между понятиями МПО и лексическими ресурсами системы.

Задача исследования Придумать метод, который позволил бы объяснить «значимость» конкретного глагола (слова) в целом и различать отдельные значения этого глагола (лексемы) на основе дискурсного многофакторного контекста (ДК), возложив ведущую роль в различении значений на сущностные элементы ДК. [лексема – слово, взятое в одном его значении (Мельчук 1998), (Падучева 2004)] ;

Материал исследования Рассматривались две видовые пары русского языка – «отличить(ать)» и «различить(ать)». В данной статье обсуждается одна пара - «различить(ать)». Материалом послужил НКРЯ, рассматривалось приблизительно 200 контекстов для глагола каждого вида.

Различить 1. Распознать, обнаружить зрением или с помощью других внешних чувств. 2. Распознать какой-л. предмет, явление среди других; отличить. 1.Привыкнув к полусвету, Арбузов явственно различил обоих атлетов.(Куприн) 2..прикидывался то страстным охотником до лошадей, то отчаянным игроком, то самым тонким гастрономом, хотя никак не мог различить горской породы от арабской, никогда не помнил козырей. (Пушкин), «А я скажу, продолжал Паклин, что у вас, господа, чутья нет; что вы не умеете различить, кто ваши настоящие друзья! (Тургенев) 3. «различать породы собак, сорта вин, болезни» (иллюстрация из Дмитриева) Различать 1. Распознать, обнаружить зрением или с помощью других внешних чувств. 2. Распознать какой-л. предмет, явление среди других; отличить. 3. Служить отличительным признаком, являться отличительной, характерной особенностью кого-, чего-л. (словарь Дмитриева)

Метод дискурсивных контекстов (ДК) Постулируемый в данной статье метод ДК призван приблизить знания в МПО к понятиям, формирующим значения в лингвистических ресурсах. Для этого, вводятся имманентные элементы как основа для их взаимодействия. Рассматриваются: ИС, задающая структуру понятий в ДК, СС, задающая «значимость», т.е. описывающая сущностные составляющие для ИС у конкретного глагола, а также ГС.

Имманентные составляющие и грамматическая составляющая Имманентная Ситуация (ИС) Сущностная Составляющая (СС) Общие особенности элементов ИС, присущие одному конкретному глаголу в целом Грамматическая Составляющая ГС Грамматическая реализация сущностных элементов (синтаксические позиции), передача коммуникативных, устоявшихся в культуре элементов значения. Абстрактная структура (конфигурация, ситуация) сущностных элементов, обозначаемая одним или несколькими близкими глаголами

ИС[размежевание по признаку] (определена для глаголов различить(ать) и отличить(ать)) -I (Idea) - идея (операция) размежевания. Сущностные составляющие: - M (Multitude) - Множество размежевания; - E (Entities) - Сущность(и) из М, вовлеченная (ые) в I; - S (Subject) - Субъект размежевания, обозначающий сущность вне М, осуществляющую размежевание; - F (Feature) - Признак размежевания. (1)Внешние объекты искажают картину поля(M), и рыба чувствует искажения(F), что позволяет ей(S) обнаруживать и различать объекты(E), то есть осуществлять локационную функцию. (2)Кошки(S) тонко различают звуки({Ei}=M).

СС[различить(ать)] I :: «ментальная диверсификация» E в М по признаку F; E :: объекты в исходном M или Ei – введенные объекты, образующие имплицитное множество Mn. М :: а) диффузное пространство (однородный фон) : «картину поля» (1) б) дискретное множество M, состоящее из n однородных сущностей : (3) Астрономы(S) научились различать звезды({Ei}=M) по внешнему виду и возрасту(F) в) имплицитное множество Mn, образуемое вновь введенными в дискурс n понятиями, источником которых является субъект S : (4) Тормоз-накат «инерционного» типа Knott(S) различает режим торможения(E1) и движения задним ходом(E2) F - ::

Грамматическая составляющая-1 «X-Acc» прямое дополнение реализует сущность E и обратно: E всегда выражается как X-Acc. Аналогом является сентенциальное дополнение, которое возможно в этой позиции - пропозиционального актанта в форме дополнительного придаточ­ного предложения: Скоро бес(S) различил, что рядом с ним летит не кто иной, как его охранник и мучитель двойник шамана(E). или косвенного вопроса: Обычно Роберт(S) различал по этой стукотне(F), кто из друзей взялся за работу(Е). «по X-Dat» – всегда реализует F, но обратное неверно.

Грамматическая составляющая-2 «в/на W-Loc», «среди/между W-Gen» – регулярно реализует M Среди декоративных томатов(M) различают растения низкорослые(E1F1) и высокорослые(E2F2). «X-Instr» – сущность ОРГАН – неотъемлемая физическая или ментальная часть S (ухо, мышление, глаз, пальцы, профессиональный взгляд): Ведуны(S) могли третьим глазом(ОРГАН) различать его облик(E). Тогда маленькая Милена(S) все время путала луковицу с головкой чеснока, не различая маленькими пальчиками(ОРГАН) чесночных ребрышек(E)… «с помощью X-Gen», «используя X-Acc» – реализует СРЕДСТВО или МЕТОД: Его(E) можно было различить лишь с помощью лупы(СРЕДСТВО). Биологи(S) научились различать легальную(E1) и браконьерскую икру(E2), используя генетические маркеры(МЕТОД).

ГС-3 (Подлежащее) - Эксплицитный S. Верно и обратное: эксплицитный S у активной формы глагола реализуется только как подлежащее. Тормоз-накат «инерционного» типа Knott(S) различает режим торможения(E1) и движения задним ходом(E2) - ОРГАН, при этом сам S часто не выражен: Зоркий взгляд(ОРГАН) птицы(S) различает табунщика(E1), молодого мужчину в седле, с винтовкой за плечами - ИСТОЧНИК (документ или раздел науки, ремесла) Фитохимия(ИСТОЧНИК) уже различает в этой белковой массе(M) два тела(E1-2): одно, растворимое в теплом (вернее в горячем) спирте, другое, нерастворимое. - F, МЕТОД или СРЕДСТВО (опосредовано): Пожалуй, единственное, что различает корабли(E), это их назначение(F). Для каждого вида мы на удивление легко нашли тот самый ключевой признак(F), который позволял легко различать спектрограммы звуков самцов и самок(E). Это свидетельствует о неадекватности стандартов и в то же время показывает, что МАРRЕС-тест(МЕТОД) позволяет различать пробы(E), различающиеся по содержанию 472-С-последовательностей всего на 0,2%.

Дискурсивные контексты (ДК) ДК – это сочетание сущностных и грамматических элементов, образующее многофакторный контекст, в котором может быть использован(ы) конкретный глагол(ы).

ДК1 «идентификация» E актуализована в сознании S в виде образа (и имени), и S знает (думает), что E присутствует в M. Обычно Роберт(S) различал по этой стукотне(F), кто из друзей взялся за работу(Е). Вар. ДК1: «комбинаторная идентификация» С этим у меня вообще проблема: когда я(S) читаю чужие романы или смотрю «толстые» фильмы, то лишь к концу начинаю различать, кого из персонажей как зовут. Синонимы: узнавать, отличать, опознать, распознать, идентифицировать

ДК2 «ориентация» S не обладает образом E, а имеет способность обнаружить в M сущности E в процессе I по типовым свойствам F Внешние объекты искажают картину поля(M), и рыба чувствует искажения(F), что позволяет ей(S) обнаруживать и различать объекты(E), то есть осуществлять локационную функцию.

ДК2.1 «выделение нюанса» M – это совокупность свойств F уже узнанного, выделенного объекта E, т.е. E=M как признаковое пространство. Голос его звучит мечтательно, но вместе с тем я(S) различаю и металлические нотки(E΄). Синоним: улавливать.

ДК3 «диверсификация как знание» М – понятия. {Ei} = M; Отличия между Ei, элементами множества M, существенные. Только НЕСОВ. В 9 лет мальчик(S) едва различал буквы {Ei}. Синоним: знать.

ДК4. «практическая диверсификация » M – эксплицитное ДК4.1: «индивидуализация по актуализованному параметру F». Астрономам(S), научившимся различать звезды(E=M) по внешнему виду и возрасту(F), стало легче разбираться в том, как протекает жизнь звезд от рождения к смерти. Для каждого вида мы на удивление легко нашли тот самый ключевой признак(F), который позволял легко различать спектрограммы звуков самцов и самок(E). Синоним: отличать друг от друга. ДК4.2: «разделение множества сущностей на группы в реально протекающем процессе» Биологи(S) научились различать легальную(E1) и браконьерскую икру(E2), используя генетические маркеры(МЕТОД). Синоним: выделять, разделять.

ДК5. «теоретическая диверсификация» M – имплицитное. Это констатация различия с указанием конкретных значений параметра F, очевидного или эксплицитного: Различают(S) плоды смородиновидные(E1F1), сливовидные, грушевидные(E2F2), и другой формы(EiFi). Среди декоративных томатов(M) различают растения (Е) низкорослые(F1) и высокорослые(F2). Закон 1641 г.(ИСТОЧНИК) различает в составе крестьянской крепости три исковые части(E1- 3): крестьянство(E1), крестьянские животы(E2) и крестьянское владение(E3).

ДК6. «идентификация распознающим устройством» S обладает распознающим ОРГАНом, который либо назван, либо очевиден. Также может присутствовать СРЕДСТВО усиления разрешающей способности ОРГАНа (8) или преграда. Ведуны(S) могли третьим глазом(ОРГАН) различать его облик(E). Человек с хорошим зрением различает мелкие детали лучше всего в 25 см от глаз (это расстояние наилучшего зрения). Синоним: ~распознавать или конкретно – видеть, слышать…

МАС и ДК «отличить(ать)» МАС1 : СВ / НСВ Распознать, обнаружить зрением или с помощью других внешних чувств; ДК6 : СВ / НСВ идентификация органом/распознающим устройством МАС1 : СВ / НСВ Распознать какой-л. предмет, явление среди других; отличить. ДК4.1 : СВ / НСВ «практическая диверсификация » (Дмитриев) : : НСВ «обладание способностью распознавать отличия, характеристики каких-либо объектов, явлений и т. п.» (Дмитриев) ДК3 : НСВ «диверсификация как знание» ДК1, ДК2, ДК4.2, ДК5

Преодоление generation gap МПО + ИС {I, M, E, F} CС {I, M, E(E1, E2), F} + ГС ____________________________ ДК1 ДК2 ДК3 и тд. | | | Гл1, Гл2 Гл3 Гл4

Выводы. Метод ДК позволяет: сформулировать общее «значение» глагола; объяснить различие между глаголами; дать объективную основу для формулирования частных значений одного глагола (ДК); объяснить различие между значениями; переходить от знаний (МПО) к лингвистическим лексическим ресурсам при генерации текстов;

Спасибо за внимание!