Оптимальное управление

Оптимальное управление — это задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы ^[1].

Для решения задачи оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния. Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравнений, описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств^[2].

Наиболее широко при проектировании систем управления применяются следующие методы: вариационное исчисление, принцип максимума Понтрягина и динамическое программирование Беллмана^[1].

Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные. ^[3]

Содержание

1 Задача оптимального управления
2 Вариационное исчисление
3 Принцип максимума Понтрягина
- 3.1 Где применяется
- 3.2 История
4 Метод динамического программирования
5 Примечания
6 Литература
7 См. также

Задача оптимального управления

Сформулируем задачу оптимального управления:

Уравнения состояния: (1).
Граничные условия , (2).
Минимизируемый функционал: .

здесь — вектор состояния — управление, — начальный и конечный моменты времени.

Задача оптимального управления заключается в нахождении функций состояния и управления для времени , которые минимизируют функционал.

Вариационное исчисление

Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления ^[4]. Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа ^[4]. Функция Лагранжа имеет вид: , где — граничные условия. Лагранжиан имеет вид: , где , , — n-мерные вектора множителей Лагранжа.

Необходимые условия экстремума, согласно этой теореме, имеют вид:

стационарность по u: , (3)
стационарность по x, уравнение Эйлера: (4)
трансверсальность по x: , (5)

Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть — в конечный момент. Методы решения подобных задач подробно разбираются в книге^[5]

Принцип максимума Понтрягина

Необходимость в принципе максимума Понтрягина возникает в случае когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно .

В этом случае условие (3) заменяется на условие (6):

$\begin{align} \min_{u \in U}L(t,x(t),\dot{x}(t),u)&=L(t,\hat{x}(t),\dot{x}(t),\hat{u}) \Longleftrightarrow\\ &\Longleftrightarrow \min_{ u \in U}\left(F(t,x(t),u)-\lambda(t)a(t,x(t),u)\right)=f(t)-\lambda(t)a(t). \end{align}$ (6)

В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона Н, определяемой соотношением . Из уравнений следует, что функция Гамильтона H связана с функцией Лагранжа L следующим образом: . Подставляя L из последнего уравнения в уравнения (3-5) получаем необходимые условия, выраженные через функцию Гамильтона:

уравнение управления по u: , (7)
уравнение состояния: , (8)
сопряжённое уравнение: , (9)
трансверсальность по x: , (10)

Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге^[4].

Где применяется

Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.

История

За разработку теории оптимального управления Л.С. Понтрягину и его сотрудникам В.Г. Болтянскому, Р.В. Гамкрелидзе и Е.Ф. Мищенко в 1962 г была присуждена Ленинская премия.

Метод динамического программирования

Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса^[6]. Более подробно метод динамического программирования изложен в книге^[7]

Примечания

↑ ¹ ² Самойленко В. И., Пузырев В. А., Грубрин И. В. «Техническая кибернетика», учеб. пособие, М., изд-во МАИ, 1994, 280 с. ил., ISBN 5-7035-0489-9, гл. 4 «Оптимальные системы управления динамическими объектами и процессами», с. 63-113;
↑ Коршунов Ю. М. «Математические основы кибернетики», учеб. пособие для вузов, 2-е изд., перераб. и доп., М., «Энергия», 1980, 424 с., ил., ББК 32.81 6Ф0.1, гл. 5 «Структура и математическое описание задач оптимального управления», c. 202;
↑ Методы робастного, нейро-нечёткого и адаптивного управления: Учебник / Под ред. Н.Д. Егупова, изд. 2-ое, стер., М., Изд-во МГТУ им Н.Э. Баумана, 2002, 744 с ил., ISBN 5-7038-2030-8, тир. 2000 экз, ч. 2 "Нечёткое управление"
↑ ¹ ² ³ Э. М. Галеев, В. М. Тихомиров «Оптимизация: теория, примеры, задачи», М., «Эдиториал УРСС», 2000, 320 с., ISBN 5-8360-0041-7, гл. 3 «Вариационное исчисление», п. 6 «Задача Лагранжа», с. 173—181;
↑ «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 2 «Численные методы расчета оптимальных программ, использующие необходимые условия экстремума», с 80 — 155;
↑ Беллманн Р. «Динамическое программирование», ИЛ, М., 1960;
↑ «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 3 «Прямые методы теории оптимального управления», с 156—265;

Литература

Растригин Л.А. Современные принципы управления сложными объектами. - М.: Сов. радио, 1980. - 232 с., ББК 32.815, тир. 12000 экз.
Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. - М.: Наука, 1979, УДК 519.6, - 223 c., тир. 24000 экз.

Stavkvantorium.ru

Технопарк Кванториум

Категории