1 ToBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков)

Презентация:



Advertisements
Похожие презентации
Современное состояние проблемы моделирования систем Докладчик: Виноградов Андрей Группа: ИТО-4-07 Группа: ИТО-4-07.
Advertisements

1 Диаграммы реализации (implementation diagrams).
Теория Курс пользователя типового реестра государственных и муниципальных услуг 1.
Лекция 2 Фонетика. Фонетические явления Введение в языкознание Перевод в сфере профессиональной коммуникации Центр иностранных языков ст. преп. Василенко.
1 Изучение особенностей цветового оформления материала в презентации Работа 3 Федеральное агентство по образованию Государственное образовательное учреждение.
Александров А.Г ИТО Методы теории планирования экспериментов 2. Стратегическое планирование машинных экспериментов с моделями систем 3. Тактическое.
- поддержка справочных данных (ТФЕ, ТФС); - поддержка информационной базы влияния факторов на показатели качества выполнения операций; - описание функциональной.
Концепция учебника по алгебре и началам анализа для профильной школы.
Графический метод решения задач математического программирования 1. Общий вид задачи математического программирования Z = F(X) >min Z = F(X) >min g i (x.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Фонетика как лингвистическая дисциплина Вводная лекция.
НАЗВАНИЕ Работу выполнил: ст. 4 курса ФИО Научный руководитель: Должность, ФИО Г. Пермь, 2009 ГОУ ВПО Пермский государственный университет Физический факультет.
ОФОРМЛЕНИЕ ДАТ И ЧИСЕЛ В ДОКУМЕНТАХ Иванова В.Н., Земцовская школа Компьютерное делопроизводство, 11 класс Тема урока:
Классификация и регрессия Доклад по курсу Интеллектуальный анализ данных Закирова А.Р. 1.
ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
1 Федеральное агентство по образованию Государственное образовательное учреждение Московский государственный индустриальный университет (ГОУ МГИУ) Москва.
Цель проекта. Повторить и обобщить курс информатики. Форма проекта. Многостраничный html-документ (сайт), содержащий ссылки на иллюстративный материал.
Требования к структуре и формату презентации инженерного кейса Международный инженерный чемпионат «CASE-IN».«Студенческая лига»
ЧЕЛОВЕКО-МАШИННОЕ ВЗАИМОДЕСТВИЕ. ЧЕЛОВЕК - КОМПЬЮТЕР 2 Задача Человек Компьютер Решение задачи.
Основные этапы моделирования. Моделирование – исследование объектов путем построения и изучения их моделей. Моделирование – творческий процесс, и поэтому.
Транксрипт:

1 ToBI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков)

2 ToBI ( ) Стандартная транскрипционная система для интонации американского варианта английского языка (AE), разработанная и протестированная международной группой исследователей (Silverman et al. 1992). Цели стандартизации 1.Создание единой теоретической и практической парадигмы для дальнейших научных исследований и технологических разработок, которая позволила ли бы разным лабораториям и рабочим коллективам интерпретировать и использовать накопленные данные по интонации английского языка в его главных вариантах (АЕ, АА, АB ). 2.Создание ресурсов для разработки и использования он-лайновых баз данных с просодически размеченной и затранскрибированной речью.

3 Вопросы для дальнейшего обсуждения Теоретическая база системы ToBI Иллюстративные примеры Соглашения и инструкция для разметчиков; Компьютерный инструментарий, примеры; Структура разметочных файлов, совместимость; Экспериментальная проверка работоспособности (валидности) системы; Расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRI, + итальянский, испанский, арабский (каирский вар.).

4 Теоретическая база системы ToBI Общее направление – интонационная фонология, в ее рамках автосегментная тональная теория, метрическая теория. 1. J. Pierrehumbert, 1980 – модель английской интонации 1 ; 2. M. Beckman & J. Pierrehumbert, модель английской интонации; 3. J. Pierrehumbert. Tonal elements and their alignment, модель английской интонации; 4. Goldsmith J., 1990 – общие вопросы автосегментной и метрической фонологии 2 ; 5. Ladd D. R. (1983, 1996) – интерпретация явления даунстепа и тональный диапазон; 6. Wightman C. et. al. – 1992 – интерпретация просодических стыков=швов; 7. Selkirk E. 1984, 1995 – метрическая теория и просодическое фразирование (формирование просодических составляющих). 1 См.учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология.

5 J. Pierrehumbert. Tonal elements and their alignment, модель английской интонации, АЕ Из истории : 50-е годы ХХ в. – первые попытки фонологизации тональных явлений= интонации на материале АЕ. Признание автономной, супрасегментной фонетической природы интонации и ее отдельных элементов; слог - основное поле реализации интонационных контрастов. Два подхода в в фонологической интерпретации интонации. 1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных контуров в терминах 4 функционально значимых тональных уровней=уровневых тонов: L, LM, HM, H. 2. Bolinger (1951,1958), Британская фонет. школа + современные исследоваватели Liberman M. (1975), Ladd (1979).- декомпозиция контуров в терминах тональных движений- конфигураций. Каждый подход имеет свои преимущества и недостатки.

6 Современные модели J. Pierrehumbert и ( ) и другие в той же парадигме - попытка интегрировать прежние подходы с учетом их недостатков. Краткая характеристика модели Базовый тональный контраст: H ~ L использование верхней и нижней части голосового диапазона в качестве основных целевых зон (мишеней= targets) во всех тональных элементах системы битональная модель интонации. Постулируется инвентарь из 6 фонологически разных тональных элементов: Два простых L и H Четыре сложных: L + H*, L* + H, H* + L, H+ L* Различаются по локализации во фразе и дискурсивной функции (см. слайд 7). L*, H*, L+H*, L*+H, H+L*, H*+L,

7

8 Грамматика возможных интонационных структур английского языка (ИГ) Интонационная структура (ИС) фразы = линейная последовательность фонологически значимых тональных элементов, ассоциированных с метрически сильными (акцентированными) слогами и границами просодических составляющих двух уровней иерархии (промежуточными и интонационными фразами) (сл. 10 ). Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных состояний; любой путь через сеть порождает некоторую ИС (сл. 9). Свойства порождаемых ИС: Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5. Но это ограничение не самой ИГ, а ритмометрики фразы: количество метрически сильных слогов в составляющей ограничивает кол-во тон. Акцентов в ней. Комбинаторика тональных элементов. Тональные акценты и граничные тоны не имеют принципиальных ограничений на комбинаторику, порождая 36 сложных тон. конфигураций в завершении фразы (сл.11). Но комбинаторика акцентов внутри одной и той же фразы имеет ограничения, как показывают исследования. Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот же. Иерархия в ИС - Линейная последовательность тональных элементов, организованных в иерархическую фразово-просодическую структуру. (сл.10)

9 Интонационная порождающая грамматика Х- X% X*

10 Линейно-иерархическая природа интонационной структуры предложения Adelaides in South Australia and Sydneys in New South Wales.

11 Тональные конфигурации в завершении фразы ТА Г Т

12 Просодические тональные правила 1.Tone alignment rules = Постлексические правила выбора тональных элементов и их связывания с сегментным составом (слоговой последовательностью, представляющей высказывание). Связь ТА с акцентированными слогами мб объяснена общей организацией моторного контроля 1. 2.Правила формирования ЧОТ-контура на основе данной ИС = реализационные правила тональной параметризации. Абстрактные тон. элементы ИС условно можно рассматривать как маршрут или схему движения в целевом ЧОТ-пространстве. 3.Есть два типа реализационных правил – таймирование и частотное шкалирование акустических событий, соотносимых с абстрактными тон. элементами. Учитывается не только исходная ИС, но и ряд других факторов – тон. диапазон фразы, взаимодействие тональных элементов, деклинационные тенденции и пр.Очень важны для автом. синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ. Кривнова О.Ф.Генерация тонального контура фразы в системах автоматического синтеза речи // Диалог2000. С КривноваО.Ф. Моделирование и синтез фразовой интонации на основе особых точек тонального контура // Диалог'97. М., C это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно.

13 Иллюстративные примеры [[Adelaide] [is in South Australia] ] - вверху H* H- H* L- L% [[Adelaide] [is in South Australia?] ] - внизу H* H- L* H- H%

14 [[Adelaides] [ in South Australia] ] - вверху H* H- H* H* L- H% [[Adelaides] [ in South Australia] ] H* H- H* H* H- L%

15 [[Sydney isnt in South Australia!] ] - внизу L*+H* L- H%

16 ToBI Annotation Conventions (1992 ) M. Beckman and J. Hirshberg Соглашения и инструкция для разметчиков Разметочная система ToBI обеспечивает для каждого речевого высказывания следующую информацию: цифровую запись звучания, ассоциированный ЧОТ-контур, собственно транскрипцию – маркеры (labels) для различных речевых событий в следующих 4 слоях (каналах): 1.Орфографический слой: w*ord 2.Тональный слой:TA; PhT; BT; !H; HiF0 3.Слой показателей просодических швов (стыков): 0,1,2,3,4- числовой показатель фонетической выраженности словораздела; 4.Слой дополнительных комментариев (прочие события разного рода): паузы, речевые сбои, хезитации и пр. Соглашения касаются как собственно транскрипционных файлов, так и компьютерного инструментария waves TM, форматов речевых файлов и средств временной синхронизации разных информационных слоев.

17 Компьютерный инструментарий, примеры; waves TM - часть пакета ESPS (Entropic Speech Processing System, ОС Unix ) – Англия EMU Labeller – Австралия Pitchworks – SciConcord.com (сл.18, 19 + Demo) SA SIL ?

18 Рабочее окно разметчика PitchWorks

19

20 Структура разметочных файлов, чекеры, совместимость waves TM формат Каждая строка в разметочном текстовом файле содержит несколько полей, разделенных маркерами: field_1; field_2; field_3; field_4; field_5. С учетом содержания полей типичная строка в абстрактном виде выглядит так:: w(*)ord – comment В системе имеется чекер для проверки правильности состава и структуры разметочных протоколов. Большинство работ с иcпользованием ToBI сделано с помощью инструментария waves TM (ESPS) в среде Unix, в собственном формате. Для работы с ESPS-форматом, например, для изучения тренировочного материала по этой просодической разметке на сайте Ohio State Univ., под Windows требуется конвертер. См. сайт EMU-Австралия. Кроме традиционной формы разметки, EMU строит иерархическую просодическую аннотацию. Мои данные об указанных сайтах на сегодняшний день устарели, поэтому здесь не приводятся.

21 Эксперимент по оценке валидности системы проводился с участием 26 разметчиков, на материале из 34 высказываний. По оценкам экспертов (Pitrelli et al. 1994) протоколы продемонстрировали хорошую согласованность работы экспертов при попарном сравнении протоколов с учетом транскрипционных символов на каждом слове. 88% согласования по наличию-отсутствию тонального маркера; 81 % по выбору определенного тонального маркера; 92% согласования в пределах одного уровня фразирования (членения) = разметки просодических швов; Полученный уровень согласования значительно выше, чем показывали предыдущие транскрипционные системы интонации, обеспечивает дальнейшее развитие в области создания и использования интонационных корпусов. Экспериментальная проверка работоспособности (валидности) системы ToBI

22 Заключение Ограничения ToBI Разработчики ToBI не утверждают, что система покрывает всё содержание интонационного оформления речи. Имеющиеся слои относятся к наиболее значимым, по общему мнению, просодическим характеристикам речевых сообщений. Последний, 4-ый канал может использоваться для любой дополнительной информации, например, для наблюдений об экспрессивном использовании фонации. Стандарт-ToBI разрабатывался под влиянием теорий для конкретного языка, но в ряде важных теоретических отношений он нейтрален. Однако, не следует ожидать сходства тональных инвентарей и физического тождества тональных элементов в разных языках. В то же время, можно ожидать, что широкие типы тональных контрастов и тональных реализаций могут воспроизводиться в разных интонационных системах (аналогично с ситуацией в сегментной фонетике). Это подтверждают попытки расширения парадигмы ToBI на другие языки – ToGI, ToDI, GRToBI, ToRi I, +шведский, итальянский, испанский, арабский (каирский вар.), японский, китайский…..