Синтез речи по тексту: проблемы персонализации и выразительности синтезированной речи Б.М. Лобанов (lobanov@newman.bas-net.by ) Объединённый институт проблем.

Презентация:



Advertisements
Похожие презентации
Объединенный институт проблем информатики НАН Беларуси.
Advertisements

Тема урока: Синтаксис словосочетания и простого предложения Цель урока: повторить, что входит в понятия «Синтаксис и пунктуация», «пунтограммы», «словосочетание»,
Введение в языкознание Л.А. Козловская. Лекция 1. Предмет, структура и задачи языкознания Место языкознания в системе наук. Внутренняя и внешняя лингвистика.
Тема урока: «Предложение с однородными членами» Тип урока: обобщение и систематизация знаний Подготовка к ЕГЭ.
Лекция 2 Фонетика. Фонетические явления Введение в языкознание Перевод в сфере профессиональной коммуникации Центр иностранных языков ст. преп. Василенко.
Союз как часть речи. Союз значение совместности.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Урок русского языка 11 «Б» класс Учитель Юманова Татьяна Викторовна.
Принципы русской пунктуации. Что такое пунктуация? Обратимся к словарю.
Тема урока: «Предложения с однородными членами» Класс 8 УМК В.В. Бабайцева.
Требования к литературному тексту для пересказа каждое произведение должно учить чему-то хорошему развивать в ребенке нужные в обществе черты личности.
Первая лекция: Основное положение о фонетике Предмет и значение фонетики Различные фонетические единицы линейные и суперсегментные фонетическая транскрипция.
"Электронные библиотеки " Дубна Россия Метаданные в системе управления многоязычной лингвистической базой знаний Н.В. Лунева Институт.
1 Урок-кроссворд(русский язык 5 класс.) Обобщение и закрепление темы «Синтаксис»
Техника речи и её характеристики.. Техника речи это мастерство публичного выступления, делового общения людей посредством языковых конструкций, создаваемых.
Задачи: 1. Развитие умения говорения и слушания 2. Развитие интереса и внимание к слову, к собственной речи и речи окружающих 3. Обогащение активного,
ЕГЭ по русскому языку в 2015 году в новом формате Часть 1: особенности структуры специфика подготовки.
Изучение стилистики на уроках русского языка в старших классах.
Знаки препинания - это как нотные знаки. Они твердо держат текст и не дают ему рассыпаться К. Г. Паустовский.
В этих словах звуков больше, чем букв: А) жизнь; б) копают; в) ходьба; г) соловьи; д) яблоко; е) редкие. Эти слова разделены для переноса правильно: А)
Транксрипт:

Синтез речи по тексту: проблемы персонализации и выразительности синтезированной речи Б.М. Лобанов ) Объединённый институт проблем информатики НАН Беларуси, Минск, Беларусь

Введение Несмотря на широкое развитие исследований в области синтеза речи по тексту, основным критерием качества до недавних пор оставалась разборчивость синтезированной речи. Недостаточное внимание, уделяемое естественности синтезированной речи, ставит барьер для широкого использования систем синтеза речи. Решение проблемы естественности синтезированной речи связано с разработкой средств достижения её персонализации и выразительности. Для этого предлагаентся воспользоваться новыми методами компьютерного клонирования персональных характеристик речи диктора. При этом решается не только проблема повышения естественности синтезированной речи, но и проблема воспроизведения манеры чтения и голоса конкретного человека.

Задачи компьютерного клонирования персональных и выразительных характеристик речи Компьютерное клонирование – это дальнейший этап развития систем искусственного интеллекта, когда моделируется не только сама интеллектуальная функция, но и особенности её проявления у конкретного человека. В речевых технологиях целью компьютерного клонирования является создание системы синтеза речи по тексту с максимально возможным приближением по звучанию к голосу и манере чтения конкретного человека. При этом ставится задача воспроизведения персональных акустических особенностей голоса, фонетических особенностей произношения, а также интонационной индивидуальности и выразительности речи диктора.

Структура системы синтеза речи по тексту Выразительность речи Персонализация речи

Структура текстового процессора

Текстовый процессор: блок предварительной обработки текста

Текстовый процессор: блок морфологической и акцентной маркировки

Структура просодического процессора

П росодический процессор: блок членения текста на предложения, пунктуационные (ПС) и лексические (ЛС) синтагмы

Пример членения сложного предложения на ПС и ЛС Служил он с прохладцей / и, / несмотря на то, / что бесстрашное сердце гоняло его кровь, / не особенно искал возможности выслужиться – / зато послужной список Митьки / являл некоторое неблагополучие: / был хозяин его два раза судим – / по обвинению в изнасиловании русско-подданной польки / и в грабеже, / за три года войны подвергался бесчисленным наказаниям / и взыскам; / однажды военно-полевой суд чуть не прилепил ему даже расстрела, / но как-то умел Митька / выкручиваться из бед, / и, / хотя / и был в полку на последнем счету, – / любили его казаки за веселый улыбчивый нрав, / за похабные песни / (на них был Митька / мастер не из последних), / за товарищество / и простоту, / а офицеры – / за разбойную лихость.

П росодический процессор: блок разметки ПС и ЛС на синтаксические синтагмы

Идеальным решением проблемы членения такого рода предложений на синтагмы было бы использование комплекса правил разбора на синтаксические компоненты. Вариант 1 {(Идеа=льным реше+нием)}[1] {(пробле+мы члене=ния)}[1] {(тако=го ро+да) (предложе+ний)}[2] {(наЪсинта+гмы)}[1] {(бы+лоЪбы испо=льзование)}[1] {(ко+мплекса пра=вил) ( разбо+ра)}[2] {(наЪсинтакси=ческие компоне+нты)}[1] Вариант 2 {(Идеа=льным реше+нием)} {(пробле+мы члене=ния)}[2] {(тако=го ро+да) (предложе+ний)} {(наЪсинта+гмы)}[3] {(бы+лоЪбы испо=льзование)} {(ко+мплекса пра=вил) ( разбо+ра)}[3] {(наЪсинтакси=ческие компоне+нты)}[1] Пример членения ПС на синтаксические синтагмы

Просодический процессор: Блок интонационной разметки синтагм

Просодический процессор: Интонационные типы синтагм повествовательных предложений

Просодический процессор: Маркировка комбинаторных вариантов интонационного типа синтагмы

Просодический процессор: Маркировка позиционных вариантов интонационного типа синтагмы

Структура фонетического процессора

Структура акустического процессора

Акустический процессор: синтез акустико-просодических характеристик

Акустический процессор: синтез акустико-фонетических характеристик

Клонирование просодических характеристик речи (1) 3- х акцентная синтагма с интонацией незаверщенности Ma+shenka atkry+la glaza+, (Marry has opened eyes,)Машенька открыла глаза, …

Клонирование просодических характеристик речи (2) 3-х акцентная синтагма с интонацией заверщенности …, а сегодня я всё забыла.

Клонирование просодических характеристик речи (3) 3-х акцентная синтагма с интонацией общего вопроса Ленточки заплетать красные?

Клонирование просодических характеристик речи (4) 3-х акцентная синтагма с интонацией частного вопроса Где мой портфель?

Клонирование просодических характеристик речи (5) 3-х акцентная синтагма с интонацией восклицания Ура! Сегодня в школу!

Клонирование просодических характеристик (6) конечная АЕ для 5-ти дикторов и 4-х интонационных типов Весело запела, Ура! А моя ручка на месте? Настало утро. Рассказ (Клон «Елена») Диалог (Клоны: М1, М2, Ж1, Ж2)

Нерешённые проблемы (1) Го+ре Горе+ Мо+чи Мочи+ Кру+гом Круго+м Са+дится Сади+тся Зе+млю Землю+ Ко+льца Кольца+ Ме+лки Мелки+ Пры+гнул Прыгну+л По+лю Полю+ Ро+жу Рожу+ Мо+лодец Молоде+ц Све+тил Свети+л Бо+ка Бока+ Гла+за Глаза+ Поде+лим Подели+м Чу+дную Чудну+ю Де+вицу Деви+цу Всё Все По+ля Поля+ Све+ту Свету+ Го+рю Горю+ Рабо+тать Работа+ть На+чал Нача+л Засве+тилЗасвети+л Взви+лся Взвился+ Спа+ли Спали+ У+тра Утра+ Го+спода Господа+ Че+ртиЧерти+ Ря+ду Ряду+ Во+рот Воро+т Доро+гой Дорого+й Кра+сно Красно+ Чу+дно Чудно+ Хи+тро Хитро+ Ки+ту Киту+ Графические омографы: список, классификация, правила разрешения омографо

Нерешённые проблемы (2) Определение местоположения синтагматического ударения

Нерешённые проблемы (3) Распознавание предложений с обращениями, вводных слов и сочетаний, однородных членов предложения и т.д. и т.п.

Нерешённые проблемы (4) Класификация функционально- семантических признаков частиц, союзов, междометий и определение их роли как индиеаторов выразительности и эмоциональности речи.

ЗАКЛЮЧЕНИЕ К сожалению, или, к счастью, остаётся еще очень много нерешённых проблем в автоматической генерации речи по произвольному тексту: орфоэпически правильной, выразительной, наделённой чертами конкретной личности. Хочется надеяться, что коллеги из смежных областей компьютерной лингвистики примут активное участие в решении этих не простых проблем!

ПОСЛЕСЛОВИЕ В апреле 2008 года вышла в свет монография: Лобанов Б.М., ЦирульникЛ.И. Лобанов Б.М., Цирульник Л.И. Компьютерный синтез и клонирование речи – Минск : Белорус. Наука, 2008, 337с. ISBN

КУПЛЯЙЦЕ БЕЛАРУСКАЕ!!! Заказать книгу можно: В Москве – ООО"Техническая книга" Тел.(+7) , В Минске – Изд. "Белорусская наука", ул. Ф. Скорины, 40, тел. (+375)