Документ взят из кэша поисковой машины. Адрес оригинального документа : http://mph.cs.msu.ru/Home/Opus/a75.doc
Дата изменения: Tue Apr 6 14:58:22 2010
Дата индексирования: Mon Oct 1 19:43:12 2012
Кодировка: koi8-r


А.Н.Тихонов


О методах регуляризации задач оптимального управления


Пусть дана система уравнений
[pic]
с управляющими функциями [pic] из некоторого полного функционального класса
[pic] и начальными условиями
[pic]
и непрерывный неотрицательный функционал [pic] определенный на функциях
[pic], заданных в [pic] (задача (1)).
Допустим, что в классе [pic] существует оптимальное управление, т.е.
что существует такая функция [pic] что [pic] реализует минимум
функционала [pic]
[pic]
Рассмотрим задачу о приближенном определении [pic].
Для приближенного нахождения оптимизирующего управления широко
употребляется метод минимизации функционала [pic], в котором при помощи
какого-либо алгоритма вычисляется последовательность функций [pic]таких,
что
[pic]
при этом функцию [pic], для которой значение [pic] достаточно близко к
[pic], трактуют как приближение к [pic].
В дальнейшем будем допускать, что мы обладаем методом, позволяющим
конструировать минимизирующие последовательности для рассматриваемых задач,
и что [pic] не содержит изолированных элементов.
Нетрудно убедиться, что гипотеза о приближении [pic] к [pic] неверна.
Какова бы ни была точность [pic], нетрудно найти такое управление [pic],
что
[pic]
и такое, что разность [pic] может принимать как угодно большие значения,
допустимые принадлежностью [pic]классу [pic].
Выберем [pic]совпадающей с [pic]всюду, кроме небольшого интервала [pic]
около какой-либо точки [pic], в котором разность [pic] сделаем
превосходящей некоторое фиксированное число [pic], допустимое классом
[pic]. Очевидно, что для любой точности [pic] величину [pic] можно выбрать
так, чтобы разность [pic] Выбирая [pic] , а тем самым и [pic] достаточно
малыми, будем иметь, что [pic]
Вариационные задачи, для которых существуют минимизирующие
последовательности функций, не сходящиеся равномерно к экстремальному
решению, мы будем называть некорректными вариационными задачами. Таким
образом, поставленная выше задача оптимального управления будет
некорректной вариационной задачей.
Целью настоящей статьи является построение регуляризующих алгоритмов для
нахождения оптимального управления, т.е. таких алгоритмов, что
минимизирующие последовательности, построенные с их помощью, будут
сходиться к [pic].
Рассмотрим сглаживающий функционал
[pic]
где [pic]- регуляризующий функционал - выберем, например, в виде
[pic]
Функционал [pic] неотрицателен, и тем самым существует его нижняя грань
[pic] Рассмотрим какую-либо убывающую последовательность чисел [pic] и
какие-либо управления [pic] для которых
[pic]
где [pic] константа, не зависимая от [pic].
Теорема 1. Если существует единственное оптимальное управление
[pic] задачи (1), являющееся гладкой функцией, то последовательность
функций [pic]удовлетворяющих условиям
[pic]
равномерно сходится к [pic].
Очевидно, что
[pic] отсюда следует, что
[pic]
и что
[pic]
так как
[pic]
Таким образом,
[pic]
и совокупность функций [pic] образует компактное семейство. Пусть
последовательность [pic] равномерно сходится к функции [pic]. Очевидно,
что
[pic]
и что, в силу единственности оптимального управления, [pic]
Замечание 1. Если существует хотя бы одно оптимальное управление,
принадлежащее классу [pic], то сходящаяся подпоследовательность из [pic]
будет сходиться к одному из оптимальных управлений.
Замечание 2. Теорема 1 имеет место, если [pic] содержит подмножество
[pic], допускающее новую метризацию [pic] мажорантную по отношению к
метрике [pic] и такую, что [pic]( [pic] - какой - либо фиксированный
элемент в [pic]) компактно в [pic]. В этом случае, полагая
[pic],
мы получим сходимость минимизирующей последовательности , если существует
оптимальное управление [pic] [pic].
Обозначим [pic]множество элементов [pic], для которых определено [pic],
и предположим, что [pic] является выпуклым полным множеством в гильбертовой
норме [pic].
Теорема 2. Если [pic]- множество элементов [pic], на которых определено
[pic], выпукло и полно, то существует по крайней мере одна функция [pic],
реализующая минимум функционала
[pic]

В самом деле, пусть последовательность минимизирующих функций [pic]
равномерно сходится к функции [pic]. Покажем, что [pic] и что
[pic] [pic]
Для этого достаточно доказать, что последовательность [pic]
фундаментальна:
[pic]

Если это неверно, то существует такое [pic], что для бесконечной
последовательности номеров
[pic]
Положим [pic] и [pic] так что [pic]
Далее, так как [pic] то и [pic]и, в силу непрерывности функционала
[pic],
[pic]
Очевидно, что для функций [pic]будем иметь
[pic]для [pic],
т.е. что
[pic]
или
[pic]
Аналогично, используя представление [pic] получим
[pic]
откуда
[pic]
или
[pic]
что при соответствующем выборе [pic]противоречит предположению
[pic]
для бесконечной последовательности номеров [pic]
Следуя основной идее доказательства теоремы 1, нетрудно убедиться, что
функции [pic] реализующие минимум [pic] таковы, что [pic] если [pic]-
единственное оптимальное управление.
Аналогично исследуется вопрос об устойчивости задачи по отношению к
малым возмущениям [pic] и [pic].

Литература

1. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф.
Мищенко, Математическая теория оптимальных процессов, М., 1961.
2. Р. Беллман, Динамическое программирование, М., 1960.
3. А. Н. Тихонов, ДАН, 151, ?3 (1963); 161, ? 5 (1965).