Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами

Зміст

оптимальний диференціальний понтрягiн продуктивність

Вступ

. Теоретична частина

.1 Постановка задачі оптимального керування

.2 Принцип максимуму Понтрягіна

.3 Моделювання оптимального економічного зростання

. Практична частина

Висновки

Список використаної літератури

Вступ

Принцип максимуму в задачі з запізненням ґрунтується на диференційних рівняннях з аргументом, який запізнюється або відхиляється, тобто на таких диференційних рівняннях, в яких невідома функція та її похідна входять при різних значеннях аргументу.

Вперше окремі рівняння такого типу з'явилися в літературі в другій половині XVIII століття (Кондорсе, 1771 р.), але систематичні дослідження почалися лише в XX столітті у зв'язку з потребами прикладних наук. Зокрема, вони знайшли своє застосування і в принципі максимуму Л.С. Понтрягіна, що з'явилося в кінці 50-х років минулого століття, що дало потужний поштовх розвитку цього напряму. Ряд авторів в нашій країні Р. Габасов, Г.Л. Харатішвілі, А.С. Матвеєв, М.М. Красовський та ін, а також за кордоном Галану, Чанг, Лі внесли великий вклад у цю справу.

У 1961 р. Г.Л. Харатішвілі узагальнив принцип максимуму Понтрягіна у випадку постійного запізнення фазової змінної. У своїй роботі він розглядав автономних систему диференціальних рівнянь без запізнення в управлінні.

Його сучасники Чанг і Лі в 1966 р. отримали принцип максимуму для неавтономної системи диференціальних рівнянь в лінійно-квадратичній задачі оптимального управління з кратним запізненням в фазової змінної, але без запізнення в управлінні. Під лінійно-квадратичної завданням приймається та, в якій система диференціальних рівнянь є лінійною за фазовою змінною і управлінням, а функція, для якої вирішується екстремальна задача, квадратично залежить від цих же змінних.

Тим часом Галану в 1968 р. довів необхідні умови оптимальності для більш загальної задачі оптимального управління з запізненням як у фазової змінної, так і в управлінні. Він розглянув специфічну систему диференціальних рівнянь в інтегральній формі. Його доведення основане на абстрактному методі множників Хестенса.

Гунн в 1976 р. дав необхідні умови оптимальності у формі існування сполученої. А його сучасник Бакка в 1981 р. отримав принцип максимуму в проблемі оптимального управління з кратним запізненням за допомогою теорії оптимальних полів.

У 1988 р. наш співвітчизник А.С. Матвєєв розглянув більш загальну задачу оптимального управління з запізненням, в якої параметр запізнювання представлений як функція часу. Причому узагальнене запізнювання входить як в фазову змінну, так і в управління. Його результати, як і результати Галанея, мають достатньо абстрактний характер, що ускладнює їх практичне застосування.

Метою даної роботи є розглянути принцип максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами.

1. Теоретична частина

.1 Постановка задачі оптимального керування

Нехай модель системи керування має вигляд

Функції - неперервні по всім аргументам i мають частиннi похiднi по x; функцii , - кусково-неперервнi по t, T - нефiксоване додатне число xT - фіксований вектор iз Rn.

Керування - кусково-неперервнi по t функцiї, для яких виконуються умови

де - заданi додатнi числа.кi функцiї утворюють множину допустимих керувань, яку будемо позначати через U.

Потрiбно знайти вектор допустимих керувань та число Т, які б мінімізували критерій якості

де f(.) - невiд'ємна неперервна функцiя.

.2 Принцип максимуму Понтрягіна

Для початку дамо декілька означень.

Означення 1. Функція x(t) називається кусково-неперервною на відрізку [t0, t1], якщо вона неперервна усюди на [t0, t1], за винятком кінцевого числа точок розриву першого роду.

Означення 2. Функція x(t) називається кусково-гладкою на відрізку [t0, t1], якщо вона неперервна, а її похідна x'(t) кусково-неперервна на [t0, t1].

Множина всіх кусочно-неперервних і кусочно-гладких функцій на відрізку [t0, t1], що приймають значення з деякої множини M, позначимо відповідно через KC ([t0, t1], M) і KC1 ([t0, t1], M).

Розглянемо задачу:

(1)

де - стан системи, або фазова змінна; - управління системою, або управляюча змінна; - множина усіх можливих значень управління; ?1 = const - параметр запізнення фазової змінної; ?2 = const - параметр запізнення управління.

Зміна станів системи описується таким диференціальним рівнянням із запізненням:

. (2)

Щоб гарантувати існування рішення цього рівняння, необхідно задати безперервну функцію x0(?) таку, що

(3)

та кусово-неперервну функцію u0(?) таку, що

(4)

Будемо вважати, що функції

визначені у (1), (2) і такі, що

задовольняють наступним умовам: самі вони і їхні часткові похідні по змінним xi, yj (i, j = 1, ..., n) неперервні за сукупністю аргументів в G × U × U. Де G - відкрита множина в просторі R × Rn × Rn.

Моменти часу t0 і t1 будемо вважати фіксованими. Значення верхньої межі t1 може бути як кінцевим, так і нескінченним, але в другому випадку може статися так, що інтеграл в (1) розходиться.

Означення 3.

Назвемо пару (x(?), u(?)) керованим процесом в задачі (1), (2), (3), (4), якщо:

а) управління u(?): [t0, t1] ? U - кусково-неперервна функція. Для визначеності будемо вважати, що u(?) неперервна справа для t0 ? t <t1 і зліва в точці t1;

б) фазова траєкторія x(?): [t0, t1] ? ?n кусково-гладка функція і її графік ? лежить в G

;

в) для всіх t [t0, t1], крім, можливо, точок розриву управління u(?), функція x(?) задовольняє диференціальному рівнянню (2).

Керований процес називається допустимим, якщо, крім того, виконуються початкові умови (3) і (4).

Допустимий керований процес називається оптимальним, якщо знайдеться таке ? > 0, що для всякого допустимого керованого процесу (x(?), u(?)) такого, що

виконується нерівність

Введемо деякі позначення

(5)

Має місце наступна теорема, яку ми назвемо принципом максимуму Понтрягіна в задачі з запізненням.

Теорема 1. Якщо - оптимальний допустимий процес для задачі (1), (2), (3), (4), то існують множники Лагранжа , не дорівнюють одночасно нулю і такі, що виконано

. Рівняння Ейлера

(6)

. Принцип максимуму Понтрягіна

(7)

3. Умова трансверсальності:

(8)

Де

Для простоти будемо розглядати випадок, коли n = 1. Це ніскільки не применшує загального випадку, коли n ? довільно, так як в даному випадку збільшується тільки громіздкість виразів, а їхня суть залишається тією ж.

Визначення голчастою варіації. Почнемо з визначення елементарної - вейєрштрасівської - голчастої варіації. Позначимо через

Зафіксуємо точку , елемент і число настільки мале, що

Управління

(9)

назвемо елементарно. голчастою варіацією управління . Розглянемо диференціальне рівняння з запізненням

з початковою умовою для фазової змінної (3) і початковою умовою для керування (4). Позначимо за x?(t) = x?(t; ?, ?) розвязок цього рівняння. Назвемо x?(t) елементарною голчастою варіацією траєкторії , а пару (x?(t), u?(t)) елементарною варіацією процесу . Пару (?, ?), яка визначає цю варіацію, будемо називати елементарною голкою.

Лемма 1. (Про властивості елементарної варіації). Нехай елементарна голка (?, ?) фіксована. Тоді існує таке , що, при , виконується:

. траєкторія x?(t) визначена на всьому відрізку [t0, t1] і при ? ? 0 + 01 рівномірно на [t0, t1];

. при , , існує і неперервна по ? похідна , яка при ? = 0 визначена як похідна справа;

. Функція на інтервалі задовольняє диференціальному рівнянню

(10)

з початковою умовою

(11)

а на відрізку задовольняє тому ж диференціальному рівнянню, але з початковою умовою

(12)

де - значення розвязку системи рівнянь диференціальних рівнянь (10) з початковими умовами (11) у точці продовжене за неперервністю.

Доведення леми будемо проводити по частинам. Спочатку доведемо для випадку, коли функція неперервна. Тоді з (2) і в силу умов, накладених на функцію ?, отримуємо, що траєкторія неперервно диференційована на [t0, t1]. Розглянемо диференціальні рівняння

(13)

(14)

Згідно (9) праві частини цих рівнянь співпадають, при t < ? - ?, а так як , при , то за теоремою існування та єдиності розв'язку для рівняння із запізненням, для t < ? - ?, і за неперервністю рішення:

(15)

Зокрема, неперервно-диференційована по ?, як композиція неперервно-диференційовних функцій, і

(16)

Позначимо розвязок наступної задачі Коші:

(17)

Можна вважати настільки малим, що Тоді для , диференціальне рівняння з запізненням

еквівалентно звичайному диференційному рівнянню (17).

Відповідно до локальної теореми існування і єдиності можна підібрати такі ?1 > 0 і ?1 > 0, що визначена при

а в силу теореми про диференціальної залежності рішень від початкових даних функція v1 є неперервно-диференційованою по сукупності змінних.

Згідно (9) і (15), для визначення x?(t) на відрізку ми повинні в (17) покласти і . Якщо вибрано так, що , то при маємо

Зокрема функція

будучи суперпозицією неперервно-диференційовних функцій, сама є неперервно-диференційованою по ? і, крім того, виконується співвідношення:

Далі, функція v1 неперервна у точці , причому , а функція неперервна в точці ?. Тому для будь-якого ? > 0 існує таке ? > 0, що при

виконуються нерівності

(18)

Візьмемо додатне настільки малим, щоб при виконувалася нерівність |. Тоді для будь-якого , і буде мати місце нерівність

Враховуючи, що , для , отримуємо

Оскільки , при , то для будь-якого ? > 0 знайдеться таке , , маємо

(19)

Отже, для ми отримали

(20)

Тепер розглянемо відрізок . Без обмеження можна вважати, що , тоді з слідує, що , звідки за (9) і , звідки за (20) . Тому, для , рівняння (13) з урахуванням (9) набуде вигляду:

(21)

Позначимо через рішення цього рівняння з початковою умовою .

По теоремі про диференціальної залежності розвязків ний звичайних диференціальних рівнянь від початкових даних отримаємо, що існує ?2 > 0 таке, що функція визначена при і є неперервно диференційованою за сукупністю аргументів. Тоді, для визначення x?(t) на відрізку , покладемо . Якщо вибрано так, що при виконується нерівність , то при тих же значеннях ? маємо:

Зокрема ця функція, як суперпозиція неперервно-диференційованих функцій, сама є неперервно-диференційованою по і . Отже, при і , існує і неперервна по (t, ?) похідна . Позначимо , де , тоді для і маємо:

Візьмемо додатне настільки малим, що , тоді

. (22)

Перейдемо від рівняння (21), з початковою умовою , до еквівалентного інтегрального рівняння:

(23)

Диференціюючи це рівняння по ? і вважаючи ? = 0, знаходимо, що на інтервалі функція z(t) задовольняє диференціальному рівнянню

(24)

і початковій умові

. (25)

Покладемо

тоді функції неперервно диференційованою по ? і, в силу того, що виконується співвідношення:

Де

значення розвязку рівняння (24) з початковою умовою (25) у точці , яке продовжене по неперервності.

Переходячи до відрізку і враховуючи, що і ? мале, отримаємо, що рівняння (13) з урахуванням (9) прийме вигляд:

Позначимо розвязок наступної задачі Коші:

(26)

Знову, відповідно до локальної теоремою існування і єдиності можна підібрати такі ?3 > 0 і ?3 > 0, що визначена при

а в силу теореми про диференціальної залежності рішень від початкових даних функція v3 є неперервно-диференційованою по сукупності змінних.

Покладемо і . Якщо вибрано так, що , то при маємо

Зокрема функція

Зокрема функція x?(t), як суперпозиція неперервно диференційованих функцій, сама є неперервно диференційованою по (t,?) при , .

Так як функція неперервна у точці , причому , а функція неперервна у точці , то, виходячи з аналогії, переконуємося, що для достатньо малого значення при , виконується нерівність

Оскільки для виконується нерівність (19), а для виконується нерівність (22), то для будь-якого ? > 0 знайдеться таке , (), що для будь-якого , маємо

(27)

Перейдемо від рівняння (26), з початковою умовою , до еквівалентного інтегрального рівняння:

(28)

Диференціюючи це рівняння по ? і вважаючи ? = 0, знаходимо

де визначено вище. Покладемо

, (29)

Ця функція, будучи суперпозицією неперервно-диференціюючих функцій, сама неперервно диференційована по ?, і виконані співвідношення:

(30)

Отже, для ми отримали

(31)

Отже, ми отримали всі твердження леми для неперервного управління . Залишилося розглянути випадок, коли управління є кусочно-неперервною функцією. Для цього поступимо наступним чином. Для простоти нехай точок розриву буде дві, скажемо ?1 та ?2. Також припустимо, що точка ?, у якій повинно бути неперервним, розташована між ними: . На відрізку [t0, ?1] диференціальні рівняння (13) і (14), в яких при t = ?1 потрібно вважати управління рівним його граничному значенню , збігаються і за теоремою єдиності , при .

Тепер перейдемо до відрізка [?1; ?2], знову вважаючи на його границях управління рівним граничним значенням при t = ?1 та при t = ?2. Тут ми вирішуємо диференціальні рівняння (13) і (14) з початковою умовою . Щодо точки можливі три ситуації:

)

) .

Розбираючи окремо ці ситуації, переконуємося, що в кожній з них вірні всі твердження леми. Отже, лема повністю доведена і для загального випадку, коли керування є кусочно-неперервною функцією.

.3 Моделювання оптимального економічного зростання

Опишемо модель національної економіки, яка була запропонована в 1956 році Р. Солоу, Нобелівським лауреатом 1987 р. в області економіки.

У замкнутій односекторній економічній системі виробляється один універсальний продукт, який може як споживатися, так і інвестуватися. Основні припущення моделі Солоу складаються в сталості темпу приросту числа зайнятих, зносу основних виробничих фондів і норми накопичення, відсутності лага (тобто запізнення) капіталовкладень.

Стан економіки в момент часу t визначається наступними показниками:

·валовим випуском X (t);

·капіталом (основними фондами) K(t) ;

·числом зайнятих у виробничій сфері L (t);

·валовими інвестиціями I (t);

·фондом невиробничого споживання C(t) .

Нехай річний темп приросту кількості зайнятих становить n, тоді за проміжок часу dt чисельність зайнятих змінюється на величину dL = nL(t)dt, значить, для L(t) можна записати диференціальне рівняння

Розвязком якого є функція

Де- кількість зайнятих в початковий момент часу.

Нехай за рік вибуває (зношується і приходить в непридатність) частина ? основних виробничих фондів, норма накопичення становить ?, а річний валовий внутрішній продукт визначається лінійно-однорідною неокласичною виробничою функцією X = F(K, L).

Тоді знос та інвестиції в розрахунку на рік дорівнюють ?K(t) та I(t) = ?X(t) = ?F(K(t), L(t)) відповідно, лаг капіталовкладень відсутній, це означає, приріст фондів за проміжок часу dt складає dK =- ?K(t)dt + I(t)dt або

Перепишемо це рівняння у вигляді

де ми врахували, що F(K, L) = LF(K / L,1), оскільки похідна функція F(K, L) є лінійно-однорідною.

Перейдемо тепер до відносним показників:

фондоозброєнності k(t) = K(t)/L(t);

середньої продуктивності праці x(t) = X (t) / L(t);

питомим інвестиціям i(t) = I (t) / L(t);

середньодушове споживання c(t) = C(t) / L(t).

Знайдемо

При цьому

Тому

тобто для фондоозброєності k(t) справедливо диференціальне рівняння

Розглянемо у якості виробничої функції функцію Кобба-Дугласа F(K, L) = AK?L1-?, при цьому F(k, 1) = AK?.

Ввівши позначення , f (k) = F(k, 1) = AK?, одержуємо модель Солоу у відносних показниках:

Кажуть, що економіка знаходиться на стаціонарній траєкторії, якщо відносні показники не змінюються в часі.

Оскільки x(t), i(t), і c(t) є функціями від k(t), то для того, щоб економіка знаходилась на стаціонарній траєкторії, необхідно і достатньо сталості в часі фондоозброєності k(t), тобто

або

Підставимо сюди f (k) = Ak? та винесемо k? за дужки, отримаємо умову стаціонарності траєкторії:

З останнього рівняння видно, що можливі дві стаціонарні траєкторії економіки: вироджена [коли k = 0, при цьому x = Ak? = 0, i = ?Ak? = 0, та c = (1-?)Ak? = 0] і не вироджена [коли .]

З умови випливає, що на невиродженій стаціонарної траєкторії постійні значення відносних показників дорівнюють

Дослідимо, що станеться, якщо економіка відхилиться від стаціонарної траєкторії. Зобразимо на рис. 1 графіки функцій ?k та [тут ].

Розглянемо спочатку вироджену стаціонарну траєкторію (на ній k(t) = 0). Якщо k(t) дорівнюватиме трохи більше нуля, то, як видно з рис. 1, , тому похідна

звідки випливає, що фондоозброєність k(t) буде зростати.

При цьому dk/dt залишається додатною при всіх k(t)(0, kº), тому вироджена стаціонарна траєкторія є нестійкою: досить найменшого обурення, і k (t) починає зростати в сторону k = kº; При k(t) = kº похідна dk/dt стає рівною нулю, тобто k(t)kt перестає змінюватися.

Рис. 1. Дослідження стійкості стаціонарних траєкторій економіки в моделі Солоу

Якщо економіка знаходиться на невиродженій стаціонарній траєкторії k(t) = kº, і відбулося незначне відхилення фондоозброєності вліво від стаціонарного значення kº, то k(t) починає зростати до тих пір, поки знову не повернеться до значення kº. Якщо ж k(t) відхилиться від kº вправо, то, як показує рис. 1, , тому похідна

значить, k(t) буде спадати до тих пір, поки не стане рівною kº. Таким чином, не вироджена стаціонарна траєкторія

є стійкою: при будь-якому відхиленні від цієї траєкторії економіка прагне до неї повернутися.

Дана не вироджена стаціонарна траєкторія носить назву траєкторії збалансованого сталого економічного зростання: чисельність зайнятих на ній зростає експоненціально: L0 (t) = L0evt (звичайно, при позитивному темпі приросту зайнятих v), а всі відносні показники постійні, значить, всі абсолютні показники зростають пропорційно чисельності зайнятих L(t).

Розглянемо тепер найпростішу задачу управління економікою, яка описується моделлю Солоу: спробуємо підібрати таку норму накопичення ?, щоб питоме споживання на стаціонарній траєкторії збалансованого сталого економічного зростання було максимальним.

Золоте правило накопичення.

Щоб питоме споживання на стаціонарної траєкторії збалансованого економічного зростання було максимальним, норма накопичення ? повинна дорівнювати еластичності випуску по фондам ?.

Доведення.

Розглянемо питоме споживання на стаціонарної траєкторії cº як функцію норми накопичення:

і поставимо задачу визначення такої норми накопичення ?, щоб

У точці максимуму перша похідна має дорівнювати нулю (або не існувати), а друга похідна повинна бути відємною. В даному випадку маємо:

Бачимо, що dcº(?)/d? = 0 при ? = 0 і при ? = ?. В точці ?* = 0 друга похідна , тобто точка ?* = 0 є точкою мінімуму питомого споживання на стаціонарній траєкторії, а в точці ?* = ? друга похідна , тобто точка ?* = ? є точкою максимуму питомого споживання, що й потрібно було довести.

Цей результат отриманий в 1966 р. Е. Фелпсом.

Приклад. Дано значення параметрів A = 103 і ? = 0,5 виробничих функції Кобба-Дугласа. У моделі Солоу з цієї виробничої функції потрібно розрахувати значення фондоозброєності, продуктивності праці і питомого споживання на стаціонарній траєкторії збалансованого сталого економічного зростання, на якій норма накопичення дорівнює ? = 0,2, коефіцієнт вибуття основних виробничих фондів за рік становить ? = 0,2, а річний темп приросту чисельності зайнятих дорівнює v = 0,05. Порівняти отримане значення питомого споживання з оптимальним.

Рішення. На стаціонарній траєкторії, яка відповідає нормі накопичення ? = 0,2, фондоозброєність

Середня продуктивність праці

Питоме споживання

Згідно золотому правилу накопичення, для того щоб на стаціонарній траєкторії збалансованого сталого економічного зростання питоме споживання було максимальним, потрібно вибрати норму накопичення ? рівною еластичності випуску по фондам ?, тобто в даному прикладі максимум питомого споживання на стаціонарній траєкторії досягається при ?* = ? = 0,5. При цьому

Бачимо, що оптимальний вибір норми накопичення призводить до суттєвого збільшення питомої споживання на стаціонарній траєкторії - більш ніж у півтора рази.

Будемо тепер вважати, що норма накопичення не є константою, а змінюється в часі.

Для цього найзручніше представити інвестиції в основні виробничі фонди у вигляді різниці валового продукту і валового споживання. Рівняння капіталу в такому випадку перетворюється в наступне:

Перепишемо останнє рівняння враховуючи відносні показники

Модель оптимального економічного зростання передбачає максимізацію інтегрального дисконтованого (за неперервною ставкою ?) питомого споживання

при умовах

Горизонт планування T в даній задачі може бути кінцевим або нескінченним.

У разі планування на кінцевий період в максиміваний цільової функціонал доцільно додати доданок, який накладає умову на мінімальну фондоозброєність до кінця періоду [0, T].

Модель являє собою задачу оптимального управління, фазової змінної в якій виступає фондоозброєність k(t), а керуючої змінної - питоме споживання c(t). На управління накладається очевидне обмеження:

(тут - мінімально допустиме питоме споживання).

Введемо одну зв'язану перемінну y(t), яка відповідає єдиній фазовій змінній k(t), і побудуємо гамільтоніан

Рівняння для сполученої змінної має вигляд

Спряжену змінну зручно представити у вигляді і підставити

Тоді

Або

Загальне рішення даного рівняння має вигляд тому, очевидно, m(t)> 0.

Гамільтоніан

при m(t) ? 1 лінійно залежить від управління c(t), тому максимум гамільтоніана по керуючій змінній c(t) може досягатися тільки на кінцях відрізка . Таким чином, оптимальне управління при m(t) ? 1 визначається так:

При m(t) = 1 гамільтоніан

і його максимум по фазової змінної k(t) досягається при . Якщо покласти c(t) = f(k(t)) - ?k(t), то траєкторія, яка відповідає такому управлінню, буде стаціонарною, так як на ній

Звідси випливає, що на такій траєкторії .

Таким чином, при m(t) = 1 оптимальне управління визначається як c*(t) = f(k*(t)) - ?k*(t).

Остаточно отримуємо:

У випадку виробничої функції Кобба-Дугласа

Тому умова визначає

Правила оптимального управління економіки. Поки фондоозброєність менше k*, слід обмежити питоме споживання на мінімально допустимому рівні c. Як тільки фондоозброєність досягне стаціонарного значення k*, необхідно стрибком збільшити питоме споживання з до f(k*) - ?k*. Якщо ж фондоозброєність більше стаціонарного значення, то на споживання слід відправляти весь випуск: c* = f(k*), і коли за рахунок проїдання фондів економіка вийде на стаціонарну траєкторію k(t) = k*, слід зменшити питоме споживання до f(k*) - ?k*.

На стаціонарній траєкторії при цьому забезпечується підтримання фондоозброєнності і питомого споживання на постійному рівні: k(t) = k*, c(t) = f(k*) - ?k*.

2. Практична частина

Задача. Витрати x1 першого основного цеху заводу від циклу до циклу описуються різницевим рівнянням першого порядку виду:

, (1)

а витрати x2 другого (допоміжного) цеху описуються різницевим рівнянням виду:

(2)

Задані початковий і кінцевий стани системи і та інтервал управління системою n = 0 ¸ N.

Ставиться завдання: так змінити управління цехами u1 і u2 (змінити витрати), щоб на інтервалі управління n = 0 ¸ N виконувалася умова мінімуму інтегральної цільової функції

(3)

Ця функція враховує витрати цехів x1 і x2 на кожному циклі, а також зміна витрат, викликаних величинами u1 і u2. Відомо, що вимірювання обсягу виробництва в ту або іншу сторону тягне збільшення витрат, пов'язаних з перебудовою виробництва. Термінальна функція F в цій задачі дорівнює нулю.

Рішення. Спочатку запишемо вираз для функції Гамільтона з урахуванням (1-3)

Різницеві рівняння, за якими обчислюються приєднані функції pi, визначаються з приєднаних функції, які визначаються з різницевих рівнянь першого порядку

Застосуємо це вираз при i = 1 і i = 2 для функції H і одержимо шукані вирази для приєднаних функцій:

(4)

(5)

Оптимальне управління цехами u1 і u2 визначається з принципу максимуму

звідки випливає формула

що встановлює зв'язок між елементами u1оп і u2оп оптимального вектора керування та змінними xi і pi

Застосуємо це вираз при i = 1 і i = 2 для функції H і одержимо

Із цих рівнянь отримаємо співвідношення:

(6)

(7)

Підставимо їх в (1), (2) і отримаємо:

(8)

(9)

Ці рівняння спільно з (4) і (5) описують дискретну динамічну систему при оптимальному керуванні.

Недоліком рівнянь (4), (5), (8) і (9) є те, що перші два рівняння описують процес від кінця до початку (номер циклу n спадає), а другі два рівняння - від початку до кінця.

Перетворимо їх до одного виду, наприклад, від кінця до початку. У данної задачі напрямок не має значення, так як граничні умови змінних стану xi задані і на початку і в кінці процесу управління.

З (9) маємо:

. (10)

Віднімаємо (9) із (8) і отримаємо:

.(11)

Підставимо в (8) значення x1(n) із (10) і отримаємо:

.(12)

Підставимо в (9) значення x2(n) із (11) і отримаємо:

.(13)

Рівняння (10-13) описують динамічних систему від кінця до початку при оптимальному рівнянні. У даній задачі термінальна функція F не задана, і умовою трансверсальності для визначення граничних значень приєднаних функцій pi(N) скористатися не можна.

Тому в даній задачі необхідно знайти такі значення pi(N), при яких від заданого кінцевого стану системи треба перейти до заданого початкового стану системи по рівняннях (10) - (13).

Для цього необхідно провести перетворення над зазначеними рівняннями на всіх циклах процесу управління від n = N - 1 до n = 0 і виразити значення pi(N) через відомі значення елементів векторів і .

Зробимо ці перетворення при конкретних чисельних значеннях N, .

Нехай .

Тоді при n = 3 з урахуванням граничних умов на кінці x1(4) = 4 і x2(4) = 0 з рівнянь (10) - (13).

Отримаємо:

(3) = - 0,5p2(4)(3) = 4 - 0,5p1(4) + 0,5p2(4)(3) = p1(4) + 2p2(4)(3) = 2p1(4) - 8 - p2(4)

При n = 2 з рівнянь (10) ¸ (13) отримаємо:

(2) = x2(3) - 0,5p2(3)(2) = x1(3) - x2(3) - 0,5p1(3) + 0,5p2(3)(2) = p1(3) + 2p2(3) - 2x2(3)(2) = 2p1(3) - 2x1(3) + 2x2(3) - p2(3)

Підставимо в ці рівняння значення x1(3), x2(3), p1(3) та p2(3), отримані при n =3 і, зробивши необхідні арифметичні обчислення.

Отримаємо:

(2) = 8 - 1,5p1(4) + p2(4)(2) = p1(4) - 2,5p2(4) - 8(2) = 6p1(4) - p2(4) - 24(2) = - p1(4) + 7p2(4) + 16

При n = 1 з рівнянь (10) ¸ (13) отримаємо:

(1) = x2(2) - 0,5p2(2)(1) = x1(2) - x2(2) - 0,5p1(2) + 0,5p2(2)(1) = p1(2) + 2p2(2) - 2x2(2)(1) = 2p1(2) - 2x1(2) + 2x2(2) - p2(2)

Підставимо в ці рівняння значення x1(2), x2(2), p1(2) та p2(2), отримані при n =2 і, зробивши необхідні арифметичні обчислення, отримаємо:

(1) = - 1,5p1(4) - 6p2(4) - 16(1) = - 6p1(4) + 7,5p2(4) + 36(1) = 2p1(4) + 18p2(4) + 24(1) = 18p1(4) - 16p2(4) - 96

При n = 0 обчислювати значення p1 і p2 немає змісту, тому визначимо тільки вираз для x1(0) та x2(0) по (10) і (11) при n = 0 з урахуванням результатів отриманих раніше:

(0) = - 15p1(4) + 15,5p2(4) + 84(0) = 15,5p1(4) - 30,5p2(4) - 112

Так як початкові граничні умови задані: x1(0) = -1, x2(0) = 1, то після підстановки в ці вирази значень x1(0) і x2(0) отримаємо систему із двох рівнянь:

p1(4) - 15,5p2(4) = 85

,5p1(4) - 30,5p2(4) = 113

Розвязавши цю систему, отримаємо невідомі значення приєднаних функцій на кінці процесу p1(4) та p2(4).

Розв'язок цієї системи дає наступні результати:

p1(4) = 3,872(4) = - 1,737

Підставивши ці значення в рівняння (10) ¸ (13) при відомих x1(4) = 4 та x2(4) = 0, визначимо значення x1(3), x2(3), p1(3) та p2(3). Знову підставимо ці значення в (10) ¸ (13) і визначимо значення x1(2), x2(2), p1(2) та p2(2). Проробивши цю процедуру до n = 0, визначимо всі значення x1(n), x2(n), p1(n) і p2(n) на всьому інтервалі управлення. Відмітимо, що значення x1(0) та x2(0) повинні співпадати із заданими значеннями вектора с допустимою похибкою. Елементи вектора оптимального управлення визначаються із співвідношення (6) та (7).

В таблиці 1 приведені результати обчислень по описаній процедурі. Тут же приведені значення підінтегральної функції f0 та значення цільової функції J, яка обчислюється за формулою (3).

Таблиця П.8.1

n01234x1-1,00350,230,4550,86854x20,9945-0,2595-0,9231,19550p1-0,4780,9690,3983,872p2-1,488-0,0311,481-1,7370,744-0,01550,7405-0,8685-0,2390,48450,1991,936-f02,6100,3551,6476,686J=11,2979

За табл. 1 можна побудувати траєкторії процесів .

Постановка задачі оптимального управлення заводом, який випуск бетон, при відомому початковому стані та попиті на бетон на кожному циклі.

Необхідно на заданому інтервалі управлення заводомn = 0 ¸ N так спланувати випуск бетону при відомому на нього попиті, щоб сумарні витрати виробника і споживачів бетону (будівельних організацій) від неспівпадіння попиту і пропозиції були мінімальні.

Функція попиту бетону (в тис. тонн) r(n) задана таблицею 2.

Таблиця 2

n012345r(n)121548

де n - номер циклу, наприклад, номер дня тижня, r(n) - необхідний розчин бетону, (тис. тонн) по днях тижня.

Процес виробництва бетону описується різницевим рівнянням виду:

(n + 1) = x(n) + u(n), (14)

де u(n) - управління зміною обєму виробленого продукту. У цьому завданні число m = 1.

Початкова умова x(0) = 1. Кінцева умова x(N) не задано, N = 5.

Математично критерій оптимального керування заводом запишемо у вигляді цільової функції, що є інтегральною функцією втрат виробника і споживачів продукції:

, (15)

де функція

(16)

відображає сумарні втрати виробника та споживачів продукції від розбіжності попиту і пропозиції, коли різниця x(n) - r(n) = 0, причому при x(n) < r(n) ці втрати більше, ніж при x(n) > r(n), тому простої будівельників обходяться дорожче.

Функція

(n) = bu2(n) (17)

описує втрати виробника, пов'язані зі зміною обсягу виробництва.

Рішення задачі оптимального керування бетонним заводом здійснюється наступним чином. Нехай a = 2, b = 3.

Функція Гамільтона на з урахуванням (17) і (15) має вигляд:

= p(x + u) - y2 - y1,

а з урахуванням (16) и (17) отримаємо:

Вираз для приєднаної функції визначимо за формулою

(18)

Вираз для оптимального управлення заводом

р(n + 1) - 6uоп(n) = 0, звідки

. (19)

Підставимо цей вираз в (14) і отримаємо:

Звідки

. (20)

Щоб зробити розрахунки по цьому рівнянню, треба знати x(N) і p(N).

Для визначення p (N) скористаємося умовою трансверсальності

Із (15) на основі (17) слідує, що в даному випадку термінальний член:

Тоді

(21)

Так як значення x(N) невідомо, то визначити значення p(N) аналітично не представляється можливим.

У ситуаціях, подібних даної, коли число граничних умов менше числа різницевих рівнянь, а умовою трансверсальності використовувати не можна, вирішити задачу можна методом перебору. Суть методу в наступному. Спочатку задамо навмання значення x(N). По здоровому глузду воно не повинно сильно відрізнятися від r(N) = r(5) = 8. Потім за виразом (21) визначимо величину p(N) = p(5). Далі за виразом (20) визначимо величину x(4), а за виразом (18) визначимо p (4).

Далі повторимо цей процес обчислень за формулами (20) і (18) при n = 3 і визначимо x(3) і p(3).

Далі повторимо процес обчислень за формулами (20) і (18) при n = 2, n = 1 і n = 0. В результаті визначимо значення x(0).

Тепер порівняємо його з заданим початковим умовою x(0). Якщо різниця між розрахованим і заданим значенням x(0) по модулю менше числа e ® 0, то ми вгадали величину x(N). В іншому випадку знову повернемося до початку обчислень, задамося іншим значенням x(N) і повторимо процес обчислень знову. І так до тих пір, поки не вийде задана величина x (0) з похибкою e . Після цього по (20) і (18) розрахувавши весь процес від n = 5 до n = 0.

Результати розвязку задачі оптимального управлення бетонним заводом приведені в таблиці 3.

Таблиця 3

n012345x11,90252,74024,15785,01426,2085uоп0,90250,83761,41760,85621,1943-f02,44352,12379,0573,61785,30766,4189J=28,9686

На рис. 1 приведені залежності x(n) та r(n), які побудовані по табл. 2 і табл. 3.

Рис. 1. Залежності x (n) і r (n)

З цього рисунку видно, що функція оптимального пропозиції товару x(n) являє собою згладжений процес від функції попиту r(n).

Висновки

Задачі оптимального керування відносяться до найскладніших екстремальних задач. Найбільш ефективним методом дослідження цих завдань є принцип максимуму Понтрягіна, що представляє собою необхідні умови оптимальності. Це одне з великих досягнень сучасної математики, яке узагальнює і розвиває основні результати класичного варіаційного числення. Принцип максимуму був сформульований академіком Л.С. Понтрягіним в 1953 р. і в подальшому був доведений і розвинений ним разом з колективом учнів і співробітників.

В даній роботі було досліджено принцип максимуму Понтрягiна для систем диференціальних рiвнянъ з запізненням по аргументу та з нефіксованим часом i фіксованими крайовими умовами.

Описана модель національної економіки, яка була запропонована в 1956 році Нобелівським лауреатом в області економіки Р. Солоу.

Для виробничих функції Кобба-Дугласа розраховано значення фондоозброєності, продуктивності праці і питомого споживання на стаціонарній траєкторії збалансованого сталого економічного зростання, на якій норма накопичення дорівнює ? = 0,2, коефіцієнт вибуття основних виробничих фондів за рік становить ? = 0,2, а річний темп приросту чисельності зайнятих дорівнює v = 0,05. З отриманих значень видно, що оптимальний вибір норми накопичення призводить до суттєвого збільшення питомого споживання на стаціонарній траєкторії - більш ніж у півтора рази.

Список використаної літератури

1.Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. / 2-е изд. М.: ФИЗМАТЛИТ, 2005.

.Архипов Г.И., Садовничий В.А., Чубариков В.Н. Лекции по математическому анализу. М.: Дрофа, 2003.

.Матвеев А.С. Задачи оптимального управления с запаздыванием общего вида и фазовыми ограничениями // Изв. АН СССР. Сер. матем. 1988. 52: 6. С. 1200-1229.

.Мышкис А.Д. Дифференциальные уравнения с запаздывающим аргументом. / Диссертация на соискание ученой степени доктора физико-математических наук. Р., 1949.

.Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976.

.Харатишвили Г.Л. Оптимальные процессы с запаздыванием. Т., 1966.

.Эльсгольц Л.Э., Норкин С.Б. Введение в теорию дифференциальных уравнений с отклоняющимся аргументом. М., 1971.

.Bakke V.L. Optimal fields of problems with delays // J. Optimiz. Theory Appl. 1981.

.Chyung D.H., Lee E.B. Linear optimal systems with time delays //SIAM J. Control. 1966.

.Guinn T. Reduction of delayed optimal control problems to nondelayed problems // J. Optimiz. Theory Appl. 1976.

.Halanay A. Optimal controls for systems with time lag // SIAM J. Control. 1968.

.Hestenes M.R. On variational theory and optimal control theory // SIAM J. Control. 1965.

Теги: Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами Курсовая работа (теория) Математика
Просмотров: 6393
Найти в Wikkipedia статьи с фразой: Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами

Каталог научных работ

Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами

Репетиторство