Динамическая оптимизация и кусочно постоянные функции на множестве состояний
Автор(ы):
Евгений Николаевич Орёл
Финансовый университет при Правительстве Российской Федерации, профессор
(Департамент анализа данных, принятия решений и финансовых технологий),
Москва, Ленинградский проспект, д. 49; доктор физико-математических наук, профессор;
enorel@fa.ru
Ольга Евгеньевна Орёл
Московский физико-технический институт, доцент кафедры высшей математики,
г. Долгопрудный; кандидат физико-математических наук, доцент
Olga_Orel72@mail.ru
Аннотация:
Рассмотрен прямой метод динамической оптимизации для построения приближений
к глобальному экстремуму. Метод основан на
разбиении множества состояний на классы (ячейки) и
построении кусочно-постоянных функций на заданном разбиении.
Такой подход приводит к обобщению метода ломаных Эйлера и использованию
алгоритмов поиска кратчайшего пути на графе.
В предложенном алгоритме для каждого класса формируется маршрут,
ведущий из начальной точки в этот класс.
При этом запоминаются только конечная точка маршрута,
функционал на маршруте и номер предыдущего класса. Если находится
другой маршрут с теми же граничными условиями, но с меньшим
(для задачи на минимум) значением функционала, то он становится
текущим приближением.
Доказывается, что если разбиение достаточно мелкое,
то метод находит оптимальную ломаную. Предложенный подход может быть применен
к задачам динамической оптимизации с неполной информацией
(диффференциальные игры, управление при неизвестной динамике).
Приводятся результаты численного решения некоторых задач
оптимального управления и дифференциальных игр.
Ключевые слова
- глобальный экстремум
- дифференциальные игры
- кусочно-постоянные функции
- ломаные Эйлера
- неизвестная динамика
- оптимальное управление
- разбиение на классы
Ссылки:
- Орёл Е. Н. Аппроксимация функции Беллмана кусочно-постоянными функциями, Ж. вычисл. матем. и матем. физ., 1978, т. 18, № 4, с. 916-927
- Орёл Е. Н. Метод решения задач оптимального управления, ДАН СССР, 1989, № 6, с. 1301-1304
- Орёл Е. Н. Алгоритмы поиска квазиоптимального управления, использующие разбиение проcтранства состояний, Ж. вычисл. матем. и матем. физ., 1990, № 9, с. 1283-1294
- Орёл Е. Н., Орёл О. Е. Условия оптимальности центральных полей траекторий, Дифференциальные уравнения и процессы управления, 2017, № 1, с. 53-77, diffjournal. spbu. ru/pdf/orel. pdf
- Моисеев Н. Н. Элементы теории оптимальных систем, М., Наука, 1975, 528 с
- Эльсгольц Л. Э. Дифференциальные уравнения и вариационное исчисление, М., Наука, 1965, 424 с
- Орёл Е. Н. Построение кратчайшего пути на графе по миноранте функции Беллмана, Автоматика и телемеханика, 1977, № 2, с. 88-91
- Орёл Е. Н. Коррекция эвристической функции в процессе поиска и принятия решений, ДАН СССР, 1991, № 4, с. 853-855
- Орёл Е. Н. Эвристика обучения в задачах поиска, Техническая кибернетика, 1992, № 5, с. 69-81
- Орёл Е. Н., Орёл О. Е. Центральные поля оптимальных траекторий, Доклады Академии Наук, 2014, № 4, с. 402-405
- Орёл Е. Н., Орёл О. Е. Центральное поле траекторий в задачах оптимального управления и вариационного исчисления. Учёт. Анализ. Аудит, 2015, № 3, с. 35-42
- Орёл Е. Н., Орёл О. Е. Оптимальное управление процессом производства при выполнении заказа к заданному сроку, Экономика и математические методы, 2016, № 2, с. 65-77
- Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов, М., Наука, 1969, 391 с
- Зеликин М. И. Оптимальное управление и вариационное исчисление, М., Едиториал УРСС, 2004, 160 с
- Айзекс Р. Дифференциальные игры, М., Мир 1967, 480 с
- Breakwell J. V., Speyer J. L., Bryson A. E. Optimization and control of nonlinear systems using the second variations, SIAM J. Control 1963, № 1, с. 193-223
- Неймарк Ю. И., Коган Н. Я., Савельев В. П. Динамические модели теории управления, М, Наука, 1985, 400 с
- Мичи Д., Чемберс Р. Компьютер-творец, М., Мир, 1987, 225 с
- Орёл Е. Н. Дискретные краевые задачи и процессы оптимизации на графах, Искусственный интеллект в технических системах, М. РАН, ГосИФТП, 1998, с. 3-33