Анатолий Владимирович Венцов, Юлия Олеговна Нигматулина, Ольга Васильевна Раева, Елена Игоревна Риехакайнен, Наталия Арсеньевна Слепокурова (СПбГУ) КОРПУС.

Презентация:



Advertisements
Похожие презентации
Звуки речи [ ] Гласные [ ] Ударные Безударные Согласные [ ] Твёрдые Звонкие ^ Глухие Мягкие, Звонкие ^ Глухие.
Advertisements

Урок 3. Фонетика как раздел лингвистики. Звуки речи. Цели урока: 1) восстановить в памяти учащихся основные сведения о фонетике и системе единиц, изучаемых.
Согласные звуки речи. Непарные глухие согласные : [ х ]- [ х ], [ ц ], [ ч ], [ щ ]. Непарные звонкие согласные : [j ], [ л ]- [ л ], [ м ]- [ м ], [
Совершенствование фонетических умений – необходимое условие формирования языковых и коммуникативных компетентностей младших школьников.
Аккомпанемент Баррикада Масон Искусный Пессимизм Искусство Труженик Авторалли Оппонент Матроска.
План фонетического разбора слова План разбора в стихотворной форме Алгоритм разбора Как оформить фонетические разбор слова.
План фонетического разбора слова План разбора в стихотворной форме Алгоритм разбора Как оформить фонетические разбор слова.
Российские разработки корпусов устной речи I. Корпусы звучащей речи = фонетические базы данных II. Корпусы устных текстов.
Гласные звуки Согласные звуки ударениеслог Ютированные буквы - раздел науки о языке, изучающий звуки речи.
Алгоритм логопедической работы в коррекционной школе.
Обучение Звукобуквенному анализу. Звуки могут быть речевые и не речевые.
Презентация к уроку (1 класс) по теме: Звуко-буквенный разбор
Фонетическая система русского языка Выполнила: Неганова Дарья Ученица 5 класса «Б» Учитель: Агафонова Т. Е.
Памятки. Образец разбора 1 класс Школа России Автор-составитель: Печенкина Светлана Владимировна, учитель начальных классов МКОУ «СОШ 44» Миасский городской.
Автоматическое стенографирование речи: состояние и перспективы Пилипенко В.В. Международный научно-учебный центр информационных технологий и систем.
Обучение устной речи на основе УМК Forward Вербицкая Мария Валерьевна, доктор филологических наук, профессор, Заслуженный работник высшей школы, председатель.
МБДОУ детский сад комбинированного вида 147 «Голубые дорожки» г.Брянска. Презентацию подготовила Щербакова Ольга Ивановна, воспитатель 1 квалификационной.
Что такое фонетическая транскрипция Материалы к урокам русского языка в 5-6 классах Учитель Чевдарь Л.К.
Содержание работы по развитию слухового восприятия речи.
Распознавания речи распознавания речи. Что такое распознавание речи? Система преобразования речевых сигналов в текст либо в набор управляющих команд.
Транксрипт:

Анатолий Владимирович Венцов, Юлия Олеговна Нигматулина, Ольга Васильевна Раева, Елена Игоревна Риехакайнен, Наталия Арсеньевна Слепокурова (СПбГУ) КОРПУС РУССКИХ СПОНТАННЫХ ТЕКСТОВ: СТРУКТУРА И ЕДИНИЦЫ

Цель создания корпуса изучение особенностей сигнала, с которым слу­ шающий сталкивается при восприятии речи в естественных усло­виях разработка возможных алгоритмов преобразования непрерывного речевого акустического сигнала в линейную по­следовательность лексических единиц ФУНКЦИОНАЛЬНАЯ МОДЕЛЬ ВОСПРИЯТИЯ РЕЧИ

Виды аннотирования: - орфографическая расшифровка; - акустико-фонетическая транскрипция

Общая информация -расшифровки теле- и радиопередач; -орфографическая расшифровка: 224 минуты звучания; -Орфографическая расшифровка + акустико- фонетическая транскрипция: 90 минут звучания.

Принципы транскрибирования Гласные Символы (латиница) Между твердыми После или между мягкого(ими) Перед мягким /a/a&a" /е/eEe" /i/iii /ı//ı/Q-Q /u/uYu" /ə/***" Излишне долго произнесенные гласные :: Ударность гласного«+» в постпозиции

Принципы транскрибирования Согласные Символы (латиница) Глухие Звонкие и озвонченные /ʒ//ʒ/-Z /ʦ//ʦ/cD /x/xh /ʨ//ʨ/CG /ʃ//ʃ/S- /ɕ//ɕ/$Z' Мягкость согласных '

Принципы транскрибирования Условное обозначение / маркер Описание (нрзб)неразборчиво произнесенное слово или фраза (ансмбл)одновременная речь нескольких дикторов pauseглухая пауза inhвдох sighвздох (gst)гортанная смычка или участки ларингализации (pXX)краткая пауза (ХХ -длительность в мс)

Принципы транскрибирования Пример: pause 0,202 по [po+] 0,238 inh 0, 493 а-а причинам н-н-ну таким вот [ao pr'iCi+n*m n::u te"k'i+m v*t] 1,712 небесным, наверное, [n'ib'E+sn*m na"v'Erne::+] 1,214

Доступ к Корпусу Корпус русского литературного языка Раздел «Наши ресурсы» Создание конкорданса по текстам речевого корпусатекстам

Доступ к Корпусу Речевой корпус: -монологическое (спонтанные монологи); -дикторское (радиосводки Ю.Б. Левитана); -прочитанное; -диалоги.

Доступ к Корпусу

Частотный словарь словоформ русской спонтанной речи Орфографическая расшифровка ТранскрипцияЧастотность городу [go+r*du]2 Количество уникальных строкС/фС/у потом [patu+m] 3 потом [pato+m] 8 потом [p*tu+] 1

Граница между словами в корпусе устных текстов «Составные слова» = «сочетания эквивалентные слову» потому_что как_бы то_есть … и др. Венцов А.В., Грудева Е.В., Касевич В.Б., Ягунова Е.В. Идиомы в Национальном корпусе русского литературного языка // Международная конференция «Корпусная лингвистика–2004» Тезисы докладов (12-14 октября 2004 г., С.-Петербург). СПб, С. 17–18. Венцов А.В., Грудева Е.В. Частотный словарь словоформ русского языка (проект). Череповец, с.

Граница между словами в корпусе устных текстов то_есть [tQs / tıs j ] потому_что [gua+S / guá ʃ ]

Граница между словами в корпусе устных текстов человека_общаться [C*lE+kap$a+c* / ʨ əl ɛ +kap ɕ a+ ʦ ə] Стяжение – слияние двух смежных звуков, приводящее к возникновению одного. театр [t&tr / t ʲ ætr] ему_уже [Qimu+Z / ɨ mu+ ʒ ] дети_оттуда [dEt&tuda / d ʲ ε+t ʲ ætuda] при своём_мнении [pr* sa+emnE+ni / prə sa+emn ʲɛ +n ʲ i]

Спектрограмма сочетания когда_он [kagda+ o+n] – стяжения не произошло

Спектрограмма стяжения щи_ото [$&ta / ɕʲ æta] (из словосочетания вещи_отождествлять [v'E+$&taZd'istl'&+t / v ʲɛ + ɕ æta ʒ d ʲ istl ʲ æ+t ʲ ]) стяжение

Стяжения гласных и согласных в Корпусе русских спонтанных текстов СтяженияКоличествоПроцент от общего числа проанализи- рованных сочетаний V+V или C+C на стыке словоформ, % гласных31055,5 согласных10674,1

Стяжения в спонтанной и прочитанной речи гласныесогласные всего сочетаний стяжениявсего сочетаний стяжения спонтанная (115 мин) (55,5%) (74,1%) прочитанная (46 мин) (63,0%) 3938 (97,9%)

Три вида единиц: отдельные словоформы (я, четыре и т.д); составные слова (то_есть, всё_равно и др.); словоформы, подвергшиеся стяжению (что_он [Ston / ʃ ton], дайте_им [da+etim / dáet j im] и др.)

Перспективы верификация со­зданной транскрипции; дальнейшая фонетическая рас­шифровка записей; пополнение общего объема корпуса, в том числе за счет привлечения записей подготовленной русской речи (дикторской речи, прочитанных текстов); разработка более совершенной системы поиска.

Спасибо за внимание!