Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~otipl/SpeechGroup/publications/arso92.doc
Дата изменения: Thu Mar 10 15:18:38 2005
Дата индексирования: Sat Dec 22 13:42:32 2007
Кодировка: Windows-1251

О. Ф. Кривнова

АЛГОРИТМЫ ПРОСОДИЧЕСКОГО ОФОРМЛЕНИЯ

СИНТЕЗИРОВАННЫХ ВЫСКАЗЫВАНИЙ

В настоящем сообщении дается общая характеристика правил временного и
мелоди?еского оформления синтагм и фраз с у?етом их ритми?еского и
звукового наполнения. Правила реализованы в комплексной системе
лингвисти?еского обеспе?ения компилятивного синтеза русского текста
(разработка МГУ, филологи?еский факультет).
Функция описываемых правил состоит в том, ?тобы определить временные (в
мс) и мелоди?еские (в Гц) характеристики базовых элементов компиляции,
которые при обработке синтагмы выбираются в нужной последовательности
специальным процессором (блоком кодировки). Необходимые для этого
предварительные операции над синтезируемым текстом: выделение синтагм,
выбор типа мелоди?еского контура, определение степени выделенности
(ударности-безударности) гласных и символьного звукового наполнения
слоговых комплексов, - осуществляются блоком автомати?еского транскриптора.
Правила временного оформления синтагмы сформулированы отдельно для
гласных и согласных.
Правила, задающие временные характеристики гласных в обрабатываемой
синтагме, у?итывают степени выделенности (редукции) гласного (4 градации) и
его фонети?еское ка?ество (степень открытости - 3 градации). Кроме того,
для ударного гласного последнего полнозна?ного слова у?итывается ?исло
слогов в слове и коли?ество ударных гласных, предшествующих данному в
синтагме. Предусмотрено также продление гласных (независимо от степени их
редукции и фонети?еского ка?ества) в позиции абсолютного конца синтагмы.
Что касается влияния согласных на длительность гласных, то оно у?итывается
лишь в наиболее ярких слу?аях, прежде всего, для гласных в позиции перед
интервокальными вибрантами.
Для последовательностей гласных, образующих единый элемент компиляции
(заударные флексии), действует правило аддитивного сложения длительностей,
задаваемых другими правилами временного процессора.
Правила, определяющие временные характеристики согласных у?итывают
следующие факторы: позиция согласного относительно границ синтагмы и
фонети?еского слова; интервокальная-неинтервокальная позиция; позиция в
кластере (сте?ения согласных); простой-сложный состав базовых элементов
компиляции, необходимых для звукового синтеза согласных.
Во временной процессор входят также правила, задающие длительность
паузы после окон?ания синтагмы (коне?ной-неконе?ной), которые необходимы
для синтеза связного текста.
Правила мелоди?еского оформления синтагмы задают два зна?ения ?астоты
основного тона (F0) для каждого выбранного элемента компиляции, которые
образуют его на?альную и коне?ную мелоди?еские характеристики. Вы?исление
этих "физи?еских" зна?ений происходит на основе предварительного
определения по правилам мелоди?еских характеристик транскрипционных
аллофонов в полутоновой шкале (Т-зна?ения). Полутоновые характеристики
(на?альная и коне?ная) каждого аллофона формируются текущим образом (слева
направо) слоговыми циклами, т.е. в рамках последовательности (Cn)Г, где Cn
- любое ?исло согласных, в том ?исле 0, предшествующих гласному.
В нашей системе мелоди?еский процессор содержит правила для
формирования следующих типов мелоди?еских контуров: завершенность, два вида
незавершенности, общий вопрос, специальный вопрос. Для всех контуров, кроме
последнего, у?итывается возможность разного положения главноударного слога
(мелоди?еского центра) синтагмы. Специальный вопрос формируется для слу?ая
совпадения мелоди?еского центра с вопросительным местоимением.
При определении мелоди?еских характеристик элементов компиляции,
входящих в обрабатываемый слог, у?итываются следующие факторы: тип
мелоди?еского контура синтагмы; положение слога относительно мелоди?еского
центра контура (совпадение, слева, справа); положение слога относительно
на?альной и коне?ной границы синтагмы; степень выделенности (редукции)
гласного в обрабатываемом слоге; степень выделенности (редукции) гласного,
непосредственно предшествующего обрабатываемому слогу; ?исло символьных
элементов в слоге; тип символьного элемента слога (согласный, гласный) и
положение этого элемента относительно на?ала слога (первый-непервый);
фонети?еское ка?ество согласных в слоге (глухость-звонкость); простой-
сложный состав базовых элементов компиляции, необходимых для звукового
синтеза согласных в слоге.
Просоди?еские правила реализованы программно, и результат их применения
к любой затранскрибированной нужным образом синтагме может быть представлен
в виде таблицы стандартного формата, пример которой приводится ниже для
фразы "Мама мыла малину?" (в мужском произнесении).

# ма+ма мы?лъ мал'и+ну2 #

|звук |код |длит-ть Т|зна?. ЧОТ в пт |зна?. ЧОТ в Гц |
| | |(в мс) |на?. |кон. |на?. |кон. |
|м |410000 |60 |12 |12 |120 |120 |
|а+ |811411 |100 |13 |13 |125 |125 |
|м |410000 |60 |12 |12 |120 |120 |
|а |911411 |75 |13 |13 |125 |125 |
|м |410000 |60 |13 |19 |125 |180 |
|ы? |841411 |80 |19 |24 |180 |240 |
|л |520401 |40 |24 |23 |240 |225 |
|ъ |971111 |50 |23 |23 |225 |225 |
|м |410000 |60 |23 |12 |225 |120 |
|а |911416 |75 |12 |11 |120 |110 |
|л' |570104 |50 |11 |11 |110 |110 |
|и+ |831610 |95 |11 |11 |110 |110 |
|н |420000 |60 |11 |6 |110 |85 |
|у2 |921318 |110 |6 |5 |85 |80 |