Ідэнтыфікацыя выразаў для сінтэзу маўлення па тэксце на беларускай і рускай мовах Сушукальнік – Скопінава А.М. Навуковы кіраўнік – кандыдат тэхнічных навук.

Презентация:



Advertisements
Похожие презентации
Ідэнтыфікацыя выразаў для сінтэзу маўлення па тэксце на беларускай і рускай мовах Сушукальнік – Скопінава А.М. Навуковы кіраўнік – кандыдат тэхнічных навук.
Advertisements

Ідэнтыфікацыя выразаў для сінтэзу маўлення па тэксце на беларускай і рускай мовах Сушукальнік – Скопінава А.М. Навуковы кіраўнік – кандыдат тэхнічных навук.
Транксрипт:

Ідэнтыфікацыя выразаў для сінтэзу маўлення па тэксце на беларускай і рускай мовах Сушукальнік – Скопінава А.М. Навуковы кіраўнік – кандыдат тэхнічных навук Елісеева В.Я. Дысертацыя на сушуканне ступені магістра філалагічных навук

Змест Тэма і кіраўнік Тэма і кіраўнік Актуальнасць Пастаўленыя мэты і задачы Пастаўленыя мэты і задачы Абект даследавання Абект даследавання Прадмет даследавання Прадмет даследавання Навуковая гіпотэза Навуковая гіпотэза Асноўныя вынікі Асноўныя вынікі Навуковая навізна Навуковая навізна Палажэнні, якія выносяцца на абарону Палажэнні, якія выносяцца на абарону Дзякуй за ўвагу Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Актуальнасць Да цяперашняга часу сістэмы сінтэзу маўлення дасягнулі пэўнага ўзроўню развіцця і ўжо выкарыстоўваюцца ў шэрагу практычных прыстасаванняў. Аднак камфортнасць успрымання сінтэзаванага маўлення ў рэальных умовах сістэм масавага абслугоўвання застаецца яшчэ не цалкам задавальняючай. Сусветная тэндэнцыя развіцця маўленчых тэхналогій паказвае на актуальнасць стварэння сістэм сінтэзу маўлення па тэксце, у якім будуць цалкам і якасна ідэнтыфікаваныя разнастайных фарматаў выразы, напрыклад, адзінкамі вымярэння. Без гэтага немагчыма рэалізаваць выразнае маўленне. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Тэксты, якія ўтрымліваюць выразы з адзінкамі вымярэння, патрабуюць спецыяльных алгарытмаў ідэнтыфікацыі і апрацоўкі у наступных сферах: інтэлектуальных сістэмах (для фармавання разнастайных запытаў як кампанент інтэлектуальнага інтэрфейса; для хуткай класіфікацыі выразаў з адзінкамі вымярэння па спецыяльных класах у складзе базаў ведаў; для ўдакладнення параметраў вызначаных абектаў у блоку лагічных аперацый); сістэмах сінтэзу маўлення па тэксце (для правільнай генерацыі арфаграфічнага тэксту і яго інтанацыйнага афармлення); сістэмах пошуку інфармацыі і бібліятэках (для фармавання пашыраных пошука-вых запытаў, для лакалізацыі канкрэтных выразаў у Інтэрнэце, у лакальнай базе тэкс-таў, пры аўтаматычным рэфераванні); выдавецкіх установах (для аўтаматызаванай лакалізацыі канкрэтнага спісу выразаў з адзінкамі вымярэння і для хуткай класіфікацыі знойдзеных выразаў па класах адзінкі СІ, адзінкі вытворныя ад СI, адзінкі не ў CI і інш., а таксама для хуткай праверкі правільнасці ўжыванняў разгорнутых формаў назваў адзінак вымярэння). Напрыклад Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Мэты і задачы Мэта: распрацоўка алгарытмаў і рэсурсаў для якаснай ідэнтыфікацыі выразаў з улікам лінгвістычных асаблівасцей у тэкстах на беларускай і рускай мовах. Задачы: Абазначыць, прааналізаваць і апісаць віды лінгвістычных выразаў, якія патрабуюць спецыяльных алгарытмаў і рэсурсаў для двухмоўнага сінтэзатару маўлення. Зрабіць параўнальны агляд існуючых сінтэзатараў маўлення. Распрацаваць лінгвістычныя рэсурсы, неабходныя для якаснай ідэнтыфікацыі асаблівых лінгвістычных выразаў. Распрацаваць алгарытмы для якаснай ідэнтыфікацыі асаблівых лінгвістычных выразаў на беларускай і рускай мовах для сінтэзу маўлення. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Абект даследавання Працэсы, звязаныя са своеасаблівымі выразамі пры сінтэзаванні беларуска- і рускамоўнага маўленняў па тэксце. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Прадмет даследавання Алгарытмы і рэсурсы для ідэнтыфікацыі выразаў падчас сінтэзавання беларускага і рускага маўлення з улікам іх лінгвістычных асаблівасцей. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Навуковая гіпотэза У дачыненні да двухмоўнага сінтэзу маўлення дзеля якаснай ідэнтыфікацыі асабліва складаных выразаў патрэбныя адмысловыя алгарытмы і рэсурсы, пры гэтым на практыцы яны могуць быць рэалізаваныя праз распрацоўку адпаведных канчатковых аўтаматаў і слоўнікаў. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Асноўныя вынікі 1.Разгледжана актуальнасць праблемы ідэнтыфікацыі адзінак вымярэння ў тэкстах. 2.Распрацаваныя алгарытмы, рэсурсы і апісаныя ацэнкі якасці іх працы ў тэрмінах дакладнасці і паўнаты для пошуку выразаў з адзінкамі міжнароднай сістэмы адзінак (СІ), з вытворнымі ад СІ і не ў сістэме СІ, а таксама ў скарочанай і поўнай формахз кратнымі і дольнымі прэфіксамі ў тэкставых корпусах на беларускай і рускай мовах. 3.Распрацаваныя алгарытмы рэалізаваны ў форме канчатковых аўтаматаў для пабудовы сінтаксічных і марфалагічных кампанентаў у праграме NooJ. 4.… Тэ Ак П Аб Пр Нг Ав Нн Па Дз

5. Распрацаваная універсальная схема працэсу ідэнтыфікацыі мерных выразаў праз марфалагічныя і сінтаксічныя кампаненты Малюнак 1 – Універсальная схема працэсу ідэнтыфікацыі мерных выразаў праз марфалагічныя і сінтаксічныя кампаненты Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Навуковая навізна Сінтэзаванне беларускага і рускага маўлення па тэксце зяўляецца складаным і да канца не вырашаным працэсам у ракурсе якаснай лінгвістычнай апрацоўкі тэкстаў. Пакуль існуючыя беларуска- і рускамоўныя сінтэзатары не прадугледжваюць цэласнай і якаснай ідэнтыфікацыі складаных тэкставых выразаў (напрыклад, з адзінкамі вымярэння). Дадзеная дысертацыя – спроба рэалізаваць крокі ў гэтым напрамку. Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Асноўныя палажэнні, якія выносяцца на абарону 1)Колькасныя словаспалучэнні з адзінкамі вымярэння – складаныя выразы, якія патрабуюць адмысловых алгарытмаў ідэнтыфікацыі. 2)… Тэ Ак П Аб Пр Нг Ав Нн Па Дз

Дзякуй за ўвагу! Тэ Ак П Аб Пр Нг Ав Нн Па Дз