ОПТИМА́ЛЬНОЕ УПРАВЛЕ́НИЕ
-
Рубрика: Технологии и техника
-
Скопировать библиографическую ссылку:
ОПТИМА́ЛЬНОЕ УПРАВЛЕ́НИЕ, 1) в автоматизации – управление, которое обеспечивает достижение цели при следующих условиях: получение экстремального значения заданного критерия (показателя) качества управления и соблюдение ограничений на управляющие воздействия и выходные величины (фазовые координаты). О. у. широко применяется для решения прикладных технических (напр., космич. навигация, регулирование технологич. процессов), экономических (формирование оптимального плана развития предприятия и др.), транспортных (напр., выбор наиболее экономичных маршрутов перевозки грузов) и др. задач. При постановке задачи О. у. необходимо учитывать ряд особенностей. О. у. применяется при управлении динамич. процессами в объекте, а именно процессами перевода значений заданных фазовых координат объекта из некоторого начального в заданное конечное состояние. О. у. может быть реализовано только при задании одного критерия качества. Это, как правило, характеристика траектории изменения фазовых координат (заданная функционалом), зависящая от параметров управляющих воздействий. Задача О. у. заключается в нахождении среди множества возможных траекторий движения фазовых координат (соответствующих достижению цели управления) такой траектории (экстремали), на которой критерий качества принимает экстремальное (миним. или макс.) значение. Показателями качества функционирования объектов управления могут быть, напр., среднее или макс. отклонение параметров технич. системы от заданных значений, объём выхода готовой продукции, затраты материалов, энергии и др. ресурсов на единицу готовой продукции. Кроме того, при постановке задачи О. у. должны быть указаны ограничения на изменения управляющих воздействий и фазовых координат. Различают безусловные и условные ограничения. К безусловным относят ограничения таких координат, которые не могут быть нарушены в силу конструктивных и/или физич. особенностей объекта управления. Чаще всего к ним относят ограничения на управляющие воздействия. Напр., для электропривода это напряжение электросети, для самолётов – углы поворота рулевых устройств. К условным ограничениям относят ограничения, которые могут, но не должны быть по к.-л. условиям нарушены при управлении объектом. Напр., применяя электропривод для перемещения кабины лифта, необходимо ограничивать ускорение разгона и торможения кабины с учётом физиологич. возможностей пассажиров. О. у. также требует знания математич. модели объекта, т. е. математич. зависимостей, связывающих управляющие воздействия, выходные и ограничиваемые координаты.
Совокупность технич. средств, осуществляющих О. у., составляет систему О. у. (оптимальную систему), включающую блок средств сбора информации об изменениях фазовых координат, блок реализации алгоритма О. у. (выработки управляющих воздействий), блок реализации управляющих воздействий. Наибольшие трудности реализации О. у. сопряжены с условными ограничениями фазовых координат, поскольку требуются средства для их непрерывного контроля и подключения спец. алгоритмов удержания их на заданном уровне.
Первые попытки разработать методы поиска О. у. объектами с заданными ограничениями на их координаты предприняты специалистами, работавшими над проблемами теории управления. Так, в кон. 1940-х гг. рос. учёный А. А. Фельдбаум предложил теорему об $n$-интервалах, в которой утверждается, что О. у. объектами, описываемыми обыкновенным дифференциальным уравнением с одним ограниченным управляющим воздействием, состоит из числа $n$ знакопеременных интервалов, равного порядку уравнения.
В нач. 1950-х гг., кроме поиска аналитич. решений, велись разработки приближённых инж. решений. Напр., широко применяется метод поиска оптимального процесса с помощью быстродействующей ЭВМ на математич. модели с последующим воспроизведением найденных значений управляющих воздействий на реальном объекте управления.
2) В математике О. у. – раздел, в котором изучаются неклассич. задачи вариационного исчисления. В отличие от классич. вариационных задач, где управляющие параметры меняются в некоторой открытой области (без границы), теория О. у. охватывает и тот случай, когда управляющие параметры могут принимать и граничные значения.
Основным результатом теории О. у. является принцип максимума Понтрягина, дающий общее необходимое условие оптимальности управления. Этот результат и связанные с ним исследования, проведённые с нач. 1950-х гг. Л. С. Понтрягиным и его сотрудниками, послужили исходным пунктом разработки теоретич., вычислит. и прикладных аспектов теории О. у. При решении ряда задач О. у. с успехом используются идеи метода динамического программирования, основы которого разработаны Р. Беллманом и его сотрудниками.
В качестве типичной для теории О. у. можно привести задачу об О. у. объектом, математич. модель которого даётся системой обыкновенных дифференциальных уравнений $$\frac{dx^i}{dt}=f^i(x^1, \dots, x^n, u^1, \dots,u^r),i=1, \dots,n, \quad\tag{1}$$где $x^1, \dots, x^n$ – фазовые координаты, характеризующие состояние объекта в момент $t$, а $u^1, \dots, u^r$ – управляющие параметры. Управление объектом означает выбор управляющих параметров как функций времени, $$u^j=u^j(t), j=1, \dots, r, \quad\tag{2}$$являющихся допустимыми с учётом имеющихся возможностей управления объектом. Напр., в прикладных задачах часто требуется, чтобы в каждый момент времени точка $(u^1, \dots, u^r)$ принадлежала заданному замкнутому множеству $U$. Последнее обстоятельство делает рассматриваемую вариационную задачу неклассической.
Пусть заданы начальное $(x_0^1, \dots, x_0^n)$ и конечное $(x_1^1, \dots, x_1^n)$ состояния объекта (1). Об управлении (2) говорят, что оно реализует цель управления, если найдётся такой момент времени $t_1 \gt t_0$, что решение $(x^1(t), \dots, x^n(t))$ задачи $$\frac{dx^i}{dt}=f^i(x^1, \dots, x^n, u^1(t), \dots, u^r(t)), x^i(t_0)=x_0^i, i=1, \dots, n, \quad\tag{3}$$удовлетворяет условию $x^i(t_1)=x_1^i, i=1,\dots,n$. Качество этого управления оценивают значением функционала $$J(u)=\int_{t_0}^{t_1} f^0(x^1(t),\dots,x^n(t),u^1(t),\dots,u^r(t))dt,\quad\tag{4}$$где $f^0(x^1,\dots,x^n, u^1, \dots,u^r)$ – заданная функция. Задача О. у. состоит в отыскании такого реализующего цель управления, для которого функционал (4) принимает наименьшее возможное значение. Таким образом, математич. теория О. у. – это раздел математики, в котором рассматриваются неклассич. вариационные задачи отыскания экстремумов функционалов на решениях уравнений, описывающих управляемые объекты, и управлений, на которых реализуются экстремумы.
Для этих задач справедливо следующее необходимое условие оптимальности управления.
Принцип максимума Понтрягина. Пусть вектор-функция $$u=u(t)=(u^1(t),\dots,u^r(t)), t_0 \leq t \leq t_1 \quad\tag{5}$$ – оптимальное управление, а вектор-функция $$x=x(t)=(x^1(t),\dots,x^n(t)), t_0 \leq t \leq t_1,$$ – соответствующее ему решение задачи (3). Рассматривают вспомогат. линейную систему обыкновенных дифференциальных уравнений $$\frac{d\psi_k}{dt}=-\sum^n_{v=0}\frac{\partial f^v(x(t),u(t))}{\partial x^k}\psi_v,\\ k=0,1,\dots,n, \quad\tag{6}$$ и функцию $$H(\psi,x,u)=\sum^n_{v=0}\psi_v f^v(x,u),$$зависящую, помимо $x$ и $u$, от вектора $\psi=(\psi_0, \psi_1,\dots,\psi_n)$. Тогда у линейной системы (6) существует такое нетривиальное решение $$\psi=\psi(t)=(\psi_0(t), \psi_1(t), \dots, \psi_n(t)),\\ t_0 \leq t \leq t_1,$$что для всех значений $t$ из отрезка $[t_0,t_1]$, в которых функция (5) непрерывна, выполнено соотношение $$\max_{u \in U}H(\psi(t), x(t), u)=H(\psi(t),x(t),u(t))=0$$причём $\psi_0(t)$ – постоянная, не превосходящая нуля.
К виду (1) обычно приводятся уравнения движения в случае управляемых механич. объектов с конечным числом степеней свободы. В многочисл. реальных ситуациях возникают и иные постановки задач О. у., отличающиеся от приведённых выше: задачи с фиксированным временем, когда продолжительность процесса заранее задана; задачи со скользящими концами, когда про начальное и конечное состояния известно лишь, что они принадлежат некоторым множествам; задачи с фазовыми ограничениями, когда решение задачи (3) в каждый момент времени должно принадлежать фиксированному замкнутому множеству, и др. В задачах механики сплошных сред характеризующая состояние управляемого объекта величина $x$ является функцией не только времени, но и пространственных координат (напр., величина $x$ может описывать распределение температуры в теле с течением времени), а закон движения будет дифференциальным уравнением с частными производными или интегродифференциальным уравнением. Часто приходится рассматривать управляемые объекты в случае, когда независимая переменная принимает дискретные значения, а закон движения представляет собой систему конечно-разностных уравнений. Наконец, отд. теорию составляет О. у. стохастич. объектами.