Коллокации и конструкции в исследовании структуры текста Лидия Пивоварова lidia.pivovarova@gmail.com Елена Ягунова iagounova.elena@gmail.com.

Презентация:



Advertisements
Похожие презентации
Е.В. Ягунова, Л.М. Пивоварова (СПбГУ) Коллокации и конструкции в исследовании структуры текста Мы рассматриваем сочетания двух и более лексических единиц,
Advertisements

Выпускная работа « Основы информационных технологий » Тема : « Структурно - семантические параметры художественной синонимии как составляющие идиостиля.
Текстообразующие функции производных имен прилагательных в романе Б.Окуджавы «Путешествие дилетантов» Магистерская диссертация магистрантки филологического.
Методы лингвистического анализа. методология, метод, методика Пополнять список методов исследования языка можно до бесконечности. Арнольд, И.В. Основы.
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
ЛЕ КСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ ДЛЯ АВТОМАТИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Е. И. Большаков а, Н. Э. Васильева, С.С. Морозов МГУ им. М.В. Ломоносова.
Частные методы, входящие в контекстный анализ. Апресян,Ю.Д. Дистрибутивный анализ // Лингвистический энциклопедический словарь. - М., 1990: 137 – 138.
МАТРИЦА ОБРАЗОВАТЕЛЬНЫХ РЕЗУЛЬТАТОВ (Из таксономии учебных целей БЛУМА)
Не мыслям надобно учить, а учить мыслить. Не мыслям надобно учить, а учить мыслить. И. Кант. И. Кант.
ДИДАКТИЧЕСКИЕ ПОДХОДЫ К СИСТЕМЕ ЗАДАНИЙ, СПОСОБСТВУЮЩИХ ФОРМИРОВАНИЮ ЕСТЕСТВЕННОНАУЧНОЙ ГРАМОТНОСТИ Богданова Н.Н., методист кафедры методики преподавания.
Общие цифры ЕГЭ по обществознанию Минимальный балл 39 Средний балл 56,3857,11 Количество cдававших Не сдали ЕГЭ, % 3,9.
Т ЕМА 3. «С ВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ »
Исследовательская работа в начальной школе Куренгина С.Ю., учитель начальных классов МБОУ «Мезенская СОШ»
I Международная on-line постерная конференция студентов, аспирантов и молодых ученых «Наука без границ» Метафорический перенос как способ терминообразования.
Виртуальная выставка трудов Н.М. Васильевой из фондов библиотеки МГОУ © Библиотека МГОУ © Жураховский С.Н.
ПАРАЛЛЕЛЬНЫЙ КОРПУС ТЕКСТОВ В ЗАДАЧАХ ЛЕКСИКОГРАФИЧЕСКОГО АНАЛИЗА PARALLEL CORPORA IN LEXICOGRAPHY Л. Н. Беляева (С.Петербург)
КОМПЛЕКСНЫЙ АНАЛИЗ ПОЭТИЧЕСКОГО ТЕКСТА 10 класс Ф.М.ТЮТЧЕВ SILENTIUM «SILENTIUM!» 8 класс А.С.ПУШКИН«ПРОРОК»
Федеральное государственное бюджетное образовательное учреждение высшего образования «Омский государственный технический университет» Кафедра «Прикладная.
Язык высокого уровня компилятор Программа компиляторов Сделал:Студент группы:Ис-2о(очная)Воротов Валентин.
Анализ эпизода литературного произведения. Эпизод (от греч. букв. вставка), относительно самостоятельная единица действия в фабульно-сюжетной системе.
Транксрипт:

Коллокации и конструкции в исследовании структуры текста Лидия Пивоварова Елена Ягунова

Коллокации и конструкции Что такое для нас коллокации и конструкции? Это сочетания двух и более лексических единиц, которые выделяются нами из текста на основании статистических критериев и/или экспериментов с информантами. Вопросы: Как они соотносятся со словарем и/или грамматикой? С номинативностью и/или предикативностью? Положения-гипотезы: Нечеткость границ между коллокациями и конструкциями Типовые или ядерные коллокации и конструкции противопоставлены как парадигматические vs. синтагматические единицы единицы, принадлежащие лексикону vs. синтаксису

Структурные составляющие текста И коллокации и конструкции – структурные составляющие текста (и шире – коллекции текстов) Опора на следующие виды контекста: минимальный контекст в нем реализуются лексические и морфолого- синтаксические явления; текст (текстовый контекст) включает в себя фрагменты текста вплоть до текста целиком; коллекции текстов предполагает учет текстов определенного типа, т.е. формирование коллекций и подколлекций

Методика экспериментов Вычислительный эксперимент, его результат – наборы связанных сочетаний связанные сочетания для коллекции (в виде частотного словаря) связанные сочетания для каждого текста отдельно (собственно структурные составляющие текста) Эксперимент с информантами, его процедура – определение степени связанности путем шкалирования, результат связанные сочетания для отдельных текстов

Идея сопоставления вычислительного эксперимента и эксперимента с носителями языка Степень связанности неоднословной единицы зависит от вероятностной модели, описывающей ее появление в ходе процедур обработки текста статистические характеристики должны описывать данные в зависимости от типа контекста: минимальный контекст – текст – коллекция текстов Носитель языка имеет интуитивные представления о связанности (степени неслучайности) сочетаний слов в тексте может «подключать» текстовые базы по текстам разных функциональных стилей воспринимает каждый конкретный текст с точки зрения соответствия некоторой текстовой базе адресата.

Данные (процедура анализа) Нами оценивались следующие данные: данные, полученные в ходе вычислительных экспериментов: список наиболее связанных n-грамм по коллекции; список наиболее связанных n-грамм по подколлекции (подколлекция является тематически более однородной, чем исходная коллекция); отдельные тексты, представленные в виде последовательности связанных сочетаний, («сегментов» в терминологии автора программы); отдельные тексты, представленные в виде последовательности связанных сочетаний, полученных в ходе эксперимента с информантами

Гипотезы с увеличением степени однородности увеличивается объем n-грамм (увеличивается n) коллекция однородная коллекциятекст с увеличением степени однородности увеличивается число конструкций (в соотношении конструкция vs. типовая коллокация), увеличивается число предикативных сочетаний ; для отдельно анализируемых текстов сходство наборов связанных сочетаний по результатам вычислительного эксперимента и эксперимента с информантами, большее число предикативных сочетаний по результатам экспериментов с информантами меньшее по результатам вычислительного эксперимента

Мы обсудим с Вами полученные результаты Мы предложим интерпретацию результатов с разных точек зрения: конструкционной, лексико-грамматической и информационной а еще… покажем сходство и различие между двумя интереснейшими типами контекста: единичным текстом и кластером (или сюжетом, т.е. максимально однородной тематической подколлекцией)