Рівняння Ейлера і його застосування для рішення завдань оптимального керування
Рівняння Ейлера доцільно застосовувати для рішення оптимальних завдань керування, де за фізичним змістом важко очікувати рішення у вигляді розривних функцій і де функціонал і рівняння зв'язку істотно нелінійні.
Рівняння Ейлера для знаходження функції х (t), що доставляє екстремум функціоналові має вигляд:
де
У більшості технічних додатків варіаційного обчислення функції, що доставляють екстремум функціоналові, підлеглі деяким додатковим умовам (рівнянням зв'язку).
Для завдань керування - це рівняння керованого об'єкта
Для рішення варіаційного завдання в цьому випадку використається метод невизначених множників Лагранжа, суть якого полягає в тому, що рівняння Ейлера складається для допоміжної функції
де λt(t) — множники Лагранжа, що підлягають визначенню.
Функція х (t) і множники λt(t) Лагранжа визначаються із системи (n + 1) рівнянь: рівняння Ейлера для функції F і рівнянь зв'язку (рівнянь об'єкта керування). У такий спосіб сформульоване завдання на умовний екстремум називають загальним завданням Лагранжа.
Якщо умови, яким підлеглі шукані функції, задані у вигляді певних інтегралів виду
де Qt — задані величини, то для рішення завдання також складається допоміжна функція
Тут λ невизначені множники Лагранжа, що не залежать від часу. Варіаційне завдання в цьому випадку називається ізопериметричним завданням. Для знаходження функції х(t) і множників λ використаються, як і в загальному завданні Лагранжа, рівняння Ейлера для функції F і п рівнянь зв'язку.
Для представлення рівняння Ейлера в канонічній формі використовується функція, введена У. Гамільтоном для опису рухів механічних систем, яка зветься Гамільтоніаном і має вид:
. Динамічне програмування і його застосування для рішення завдань оптимального керування. Принцип оптимальності й рівняння оптимальності Беллмана.
У техніці існує великий клас об'єктів і процесів, керування якими здійснюється на основі обмеженого числа рішень, прийнятих послідовно в деякі фіксовані моменти часу.
Визначення закону керування для таких процесів пов'язане з рішенням так званої задачі багатокрокового вибору. Керування дискретними системами може бути прикладом таких багатокрокових процесів.
Кожний безперервний процес можна представити як багатокроковий, якщо розглядати його в дискретні моменти часу.
Підхід, що дозволяє знайти оптимальне рішення на основі багатокрокових процесів ухвалення рішення, одержав назву динамічного програмування.
В основі методу динамічного програмування лежить принцип оптимальності, сформульований Беллманом Р.
Оптимальна стратегія визначається лише станом системи в даний момент і не залежить від того, як система прийшла в дану точку (рис.3.1).
Рис. 1.1.
Під стратегією ми розуміємо правило прийняття рішень.
Принцип оптимальності може бути сформульований і по-іншому.
Якщо траєкторія системи оптимальна на відрізку часу , то кінцева
ділянка цієї траєкторії на відрізку у свою чергу є оптимальною траєкторією, де довільний момент часу (рис.1.1).
Із принципу оптимальності можна одержати необхідні умови оптимальності для безперервних і дискретних систем.
Припустимо що об'єкт описується рівнянням
(1.1)
Визначити керування і траєкторію , що доставляють екстремум функціоналу
(1.2)
де фіксовано,
відкрита область.
Нехай відома оптимальна траєкторія , рис1.2. Розглянемо ділянку .
Відповідно до принципу оптимальності функціонал (1.2) досягає на ньому мінімум.
Введемо позначення
(1.2)
Рис. 1.2.
При певному керуванні мінімальне значення функціонала залежить тільки від і .
Функція називається функцією Беллмана.
Розглянемо дві близькі точки оптимальної траєкторії й .
Точка перебуває ближче до кінцевого стану. Тому, дотримуючись принципу оптимальності, ділянка траєкторії від до вже оптимальна.
(1.4)
Відповідно до теореми про середнє можна записати
(1.5)
У такий спосіб
(1.6)
Приймемо допущення, що функція має частинні похідні по всіх координатах і за часом .
Тоді, розклавши в ряд Тейлора, одержимо
(1.7)
Згідно (3.1), запишемо
Тоді (3.7) приймає наступний вид
(1.8)
Підставимо (3.8) в (3.6) і одержимо
(1.9)
Беручи до уваги, що і не залежать від , (3.9) можна перетворити до виду
(1.10)
У результаті одержуємо
(1.11)
Або у векторній формі
(1.12)
Це рівняння в частинних похідних, називається рівнянням Беллмана. Рівняння Беллмана аналітичний вираз принципу оптимальності для безперервних процесів. Він обґрунтований лише за умови, що існують частинні похідні функції по всіх координатах і часу . Випадки, коли це допущення не виконується, зустрічаються досить часто. Наприклад, допущення не виконується для лінійних систем у точках, що належить лінії (поверхні) перемикання.
За допомогою рівняння (1.11) можуть бути отримані оптимальні керування й траєкторії. Однак процедура аналітичного рішення рівняння в частинних похідних, ускладненого умовою мінімуму, представляє більші труднощі.
Поділіться з Вашими друзьями: |