Синтез оптимальных уравнений

Курсовой проект - Математика и статистика

Другие курсовые по предмету Математика и статистика

Скачать Бесплатно!
Для того чтобы скачать эту работу.
1. Пожалуйста введите слова с картинки:

2. И нажмите на эту кнопку.
закрыть



непрерывную функцию u(t), t0≤tt1, со значениями в области управления U, непрерывную справа в точках разрыва (для определённости нам так удобно предполагать) и непрерывную в концах отрезка [t0; t1], на котором она задана.

Задача об оптимальных быстродействиях уточняется теперь следующим образом:

Среди всех допустимых управлений u=u(t), под воздействием которых управляемый объект (1.3) переходит из заданного начального фазового состояния x0 в предписанное конечное состояние x1, найти такое, для которого этот переход осуществляется за кратчайшее время

2. Об основных направлениях в теории оптимальных процессов

  1. Метод динамического программирования. Для управляемого объекта, описанного в предыдущем параграфе, мы рассмотрим задачу об оптимальном переходе ─ в смысле быстродействия ─ из фазового состояния x в фазовое состояние x1. При этом конечную фазовую точку x1 будем считать фиксированной, а в качестве начальной точки x будем рассматривать различные точки фазового пространства. Мы будем предполагать в этом пункте, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x0 в точку x1 (рис. 6).

Время, в течение которого осуществляется оптимальный переход из точки x0 в точку x1, обозначим через T(x). В дальнейших рассуждениях будет удобно вместо T(x) ввести функцию ω(x), отличающуюся от неё знаком

ω(x)= ─T(x).(1.8)

Так как каждая точка x фазового пространства имеет координаты x1,…,xn, то ω(x)= ─T(x) является функцией от n переменных, т. е. ω(x)= ω(x1,…,xn). Поэтому имеет смысл говорить о непрерывности этой функции (по совокупности переменных x1,…,xn) и о дифференцируемости этой функции по каждой из переменных x1,…,xn.

А также будем предполагать, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 2. Функция ω(x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные

Пусть теперь x0 ─ произвольная отличная от x1 точка фазового пространства, а u0 ─ произвольная точка области U. Предположим, что объект находится в момент t0 в фазовом состоянии x0 и движется в течение некоторого времени под воздействием постоянного управления u= u0. Фазовую траекторию объекта при этом движении обозначим через y(t)=(y1(t),…, yn(t)). Таким образом, фазовая траектория y(t) при t>t0 удовлетворяет уравнениям

(1.9)

(см. (1.2), (1.3)) и начальному условию

y(t0)=x0.(1.10)

Если мы будем двигаться из точки x0 до точки y(t) (по рассматриваемой фазовой траектории), то затратим на это движение время tt0. Двигаясь затем из точки y(t) оптимально, мы затратим на движение от точки y(t) до точки x1 время T(y(t)). В результате мы совершим переход из точки x0 в точку x1, затратив на этот переход время (t t0)+T(y(t)). Но так как оптимальное время движения от точки x0 до точки x1 равно T(x0), т. е. равно T(y(t0)), то T(y(t0))≤(t t0)+T(y(t)). Заменяя функцию T через ω (см. (1.8)) и разделив обе части неравенства на положительную величину t t0, получаем отсюда и поэтому, переходя к пределу при t→t0, находим

│при ≤1.(1.11)

Но производная, указанная в левой части этого неравенства, вычисляется по формуле полной производной Поэтому согласно (1.9) и (1.10) неравенство (1.11) принимает вид Точки x0, u0 здесь были произвольными. Таким образом, для любой (отличной от x1) точки x фазового пространства и любой точки u области управления U выполнено соотношение

(1.12)

Пусть теперь (u(t), x(t)) ─ оптимальный процесс, переводящий объект из фазового состояния x0 в состояние x1, и t0≤tt1 ─ отрезок времени, в течение которого это оптимальное движение происходит, так что x(t0)= x0, x(t1)=x1 и t1=t0 + T(x0). Движение по рассматриваемой оптимальной траектории от точки x0 до точки x(t) осуществляется в течение времени t t0, а движение от точки x(t) до точки x1 ─ в течение времени T(x0) ─ (t t0). Быстрее, чем за время T(x0) ─ (t t0), из точки x(t) попасть в точку x1 невозможно. Итак, T(x0) ─ (t t0) есть время оптимального движения из точки x(t) в точку x1, т. е. T(x(t))= T(x0) ─ (t t0). Заменив здесь T через ω, т. е. ω(x(t))= ω(x0) + t t0) и взяв производную по t, получаем

t0≤tt1.(1.13)

Таким образом, для каждого оптимального процесса в течение всего движения выполняется равенство (1.13).

Если мы теперь введём в рассмотрение функцию

B(x, u(t))=,(1.14)

То соотношения (1.12) и (1.13) могут быть записаны следующим образом:

B(x, u)≤1 для всех точек xx1 и u;(1.15)

B(x, u)≡1 для любого оптимального процесса (u(t), x(t)).(1.16)

Итак, справедлива следующая

Т е о р е м а 1.1. Если для управляемого объекта, описываемого уравнением (1.5) и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1.15) и (1.16) (оптимальность понимается в смысле быстродействия).

Эта тео

s