Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2004/z-6.doc
Дата изменения: Thu Mar 10 15:18:40 2005
Дата индексирования: Sat Dec 22 20:38:24 2007
Кодировка: koi8-r

Методики использования магнитно резонансной томографии

для исследования артикуляторных процессов порождения речи
Г. Е. Кедрова, Л. М. Захаров, Н. В. Анисимов, В. В. Гладун, Ю. А. Пирогов
Московский государственный университет им. М. В. Ломоносова
kedr@philol.msu.ru
aункциональная магнитно резонансная томография, артикуляция, русская
фонетика, вокализм
Summary. The paper presents main preliminary results of the original cross-
disciplinary study of mechanisms of Russian articulation. The project is
targeted at elaboration and experimental testing of new investigative
method for real-time observation, processing and visualization of the
speech articulation's dynamics. Initial stage of the experiment dealt with
obtaining and

investigating detailed images of articulative gestures of Russian vowels
(produced both in isolated position as well as in syllables and phrases)
and their acoustic correlates. The data collected through several
experimental sessions was analyzed and labeled, forming therefore solid
basis for authoritative visual articulatory data base, that may be enriched
and amplified in the future.

1. Введение
Магнитно резонансная томография (МРТ) успешно применяется для исследования
объектов не только в статическом состоянии, но и режиме реального времени -
функциональная МРТ [1]. Методы ФМРТ используют для локализации активных
участков коры головного мозга, для визуализации пульсирующих органов
(сердце), для исследования конечностей при их сгибании и разгибании,
решении других задач, возникающих в ходе медицинской диагностики.
Представляется перспективным применить методы ФМРТ для визуализации
артикуляторных органов с целью исследования механизмов речепорождения.
Актуальность такого исследования обуславливается тем, что в настоящее время
отсутствуют достоверные знания о динамических механизмах речепорождения в
разных языках, и в частности, применительно к русскому языку. До настоящего
времени наиболее информативным средством экспериментального исследования
речевой артикуляции считалась кинофоторентгенография. С помощью этого
метода построена хорошо известная и, по-видимому, пока единственная,
артикуляторная база русского языка (в части стационарных участков
звучания), приводимая в справочном издании «Атлас звуков русской речи» [2].
Процесс снятия, расшифровки и прорисовки кинофоторенгенограмм технически
сложен, имеет санитарно-гигиенические ограничения. Метод, в основном,
рассчитан на получение статических изображений и неприспособлен для
изучения речи в процессе ее развертывания (в реальном времени).
Методы МРТ позволяют преодолеть ограничения рентгенографического метода и,
благодаря его чувствительности к сигналам от мягких тканей, получить
высококонтрастные изображения артикуляционных органов - губ, языка, ротовой
полости, нёбной занавески, гортани и др. в процессе порождения звука.
2. Эксперимент
(1) МР сканирование проводилось с помощью МР томографа TOMIKON S50
(BRUKER) по сагиттальному срезу шириной 9 мм и зоне сканирования - 20 вE12
см. Параметры импульсной последовательности подбирались с расчетом получить
МР изображение с приемлемым контрастом и разрешающей способностью не хуже
3.5 мм на пиксел за время сканирования 0.5-0.8 с. Этим требованиям
удовлетворяла программа SNAP, построенная на базе импульсной
последовательнос-

ти «градиентное эхо» с параметрами - TR 'E12 мс, TE ' 5.5 мс и углом
поворота намагниченности 100 [3]. Сканирование проводилось многократными
(128-256) запусками без пауз. Синхронизации действий диктора и запусков
сканирования мы не предусматривали. Поэтому в ходе эксперимента велась
контрольная аудиозапись на два канала, один из которых использовался для
записи голоса, а другой - для записи импульсов начала сканирования. Это
позволило провести простое отнесение МР изображений, получаемых при
многократных запусках МР сканера, и соответствующих участков аудиозаписи.
(2) Диктор произносил звуки в обычном для томографической съемки положении
- лежа на спине. Микрофон (фирмы LifeVideo) крепился к приемной катушке
(катушка Гельмгольца), используемой для МР съемки шейного отдела, и был
расположен в непосредственной близости от рта диктора. Такое расположение
позволило минимизировать влияние акустического шума, обычно возникающего
при МР сканировании из-за вибрации катушек при пропускании через них
импульсных токов. Влияния микрофона на качество съемки (из-за наличия в его
конструкции кабеля и металлических компонентов, а также протекания тока) мы
не обнаружили.
3. Выводы
В результате проведенного исследования доказана информативность полученных
по разработанной методике ФМРТ-изображений, их релевантность в отношении
фиксации основных особенностей артикуляции русских гласных звуков, а также
возможность объективного определения некоторых индивидуальных особенностей
артикуляторной базы. Проведенное сравнение полученных изображений с
результатами кинофоторентгенографического исследования, опубликованного в
книге К. Боллы, показало, что при определенном совпадении основных
параметров изображений (в первую очередь, взаиморасположение основных
артикуляторных органов) разрабатываемый нами метод позволяет получить
бульшую детализацию изображения, особенно в отношении мягких и / или
наиболее подвижных тканей (в частности, кончик языка и др.). Проведенное
нами сопоставление визуального отображения динамики процесса артикуляции с
данными акустического анализа звукового сигнала позволяет установить
корреляционные связи между динамикой распределения энергии в акустическом
спектре звуков и соответствующими артикуляторными жестами. Таким образом,
можно утверждать, что полученные в результате нашего

исследования и специальным образом обработан-

ные изображения (МРТ-снимки) артикуляции русских гласных звуков могут
послужить базовым материалом для создания артикуляционных эталонов в
процессе формирования единой универсальной базы данных русской речи. Это, в
свою очередь, создает возможности для успешного решения как ряда
фундаментальных задач теоретической фонетики и фонологии (прежде всего
совершенствования теории речепорождения), так и для множества прикладных
областей речеведения (лингводидактики, автоматического распознавания и
синтеза речи, компьютерных речевых баз данных, идентификации и верификации
диктора по речи и т. д.).

Литература
1. Hartshorne J. A., Michael F. Functional Brain Imaging. St. Louis, 1995.
2. К. Болла. Атлас звуков русской речи. Будапешт, 1981.
3. Snapshot FLASH MRI A. Haase, Magn. Reson. Med. 13, 77-89 (1990).