Similar presentations:
Системы принятия решений. Оценки экстремума
1.
НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМ. Н.И.ЛОБАЧЕВСКОГОНАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МАТЕМАТИКИ И МЕХАНИКИ
Системы принятия решений
VLADIMIR GRISHAGIN
2.
Оценки экстремумаРассмотрим следующий простой пример. Пусть класс - класс непрерывных
функций, т.е. априорно известно, что минимизируемая функция ( y ) непрерывна
в области Q . Предположим, что вычислены значения функции в конечном числе
точек y1 , y 2 ,..., y k . Что после этого можно сказать о координате глобального
минимума? Каковы бы ни были точки y1 , y 2 ,..., y k и значения z 1 , z 2 ,..., z k , для
любой точки y * Q ( y * { y1 ,..., y k })
всегда можно построить непрерывную
i
i
функцию, проходящую через точки ( y , z ), 1 i k ,
т.е. принадлежащую классу
( k ) из (1.11), которая имеет глобальный минимум в точке y * с любым наперед
заданным значением
* min z i .
1 i k
Например, в качестве такой функции можно взять интерполяционный
полином k -й степени, проходящий через точки ( y i , z i ), 1 i k , и точку ( y * , * ) .
3.
Оценки экстремумаВсе сказанное означает, что по результатам конечного числа испытаний
никаких выводов о расположении координаты глобального минимума сделать
нельзя. Точно так же о величине * глобального минимума можно лишь
сказать, что
* k*
(1.17)
где k* из (1.15), однако оценить величину
k * k*
(1.18)
т.е. погрешность решения задачи, невозможно.
Возможность получения оценок экстремума по конечному числу испытаний
зависит от свойств класса функций, которому принадлежит минимизируемая
функция, или, другими словами, от априорной информации о функции .
Фактически известны лишь два широких класса функций, допускающих
построение таких оценок: класс одномерных унимодальных функций и класс
функций, удовлетворяющих условию Липшица (в общем случае многомерных и
многоэкстремальных).
4.
Оценки экстремума для унимодальных функцийФункция ( y ) является строго унимодальной на отрезке [a, b] , если
существует точка y * [a, b] такая, что для всех a y y y * выполняется
( y ) ( y ) ( y * ) , а для всех y * y y b справедливо неравенство
( y * ) ( y ) ( y ).
Пример. Унимодальная функция на отрезке [0,8].
5.
Оценки экстремума для унимодальных функцийПусть теперь в общем случае проведено k испытаний в точках y1 , y 2 ,..., y k (a, b)
1
2
k
и получены значения z , z ,..., z . Перенумеруем точки испытаний нижним
индексом в порядке возрастания координаты, добавив к ним также концы
отрезка поиска a и b, т.е.
a y0 y1 y2 ... yk yk 1 b
(1.19)
Тогда интервалом неопределенности будет интервал ( yi 1 , yi 1 ) , где номер i
*
*
определяется из условия yi yk , где yk из (1.16) (в случаях i=1 и i=k
интервалами неопределенности будут полуинтервалы [a, y2 ) и ( yk 1 , b]
соответственно). Иными словами, для строго унимодальной функции можно
построить оценку координаты глобального минимума в виде интервала
неопределенности и тем самым оценить погрешность решения задачи (по
координате) величиной max{yi 1 yi , yi yi 1 } , ибо
y k* y * max{yi 1 yi , yi yi 1 }
Что касается величины глобального минимума, то строгой унимодальности
для получения оценки (1.18) недостаточно и требуются более жесткие условия
для ее реализуемости.
6.
Оценки экстремума для липшицевых функцийДругим важным классом функций, допускающим построение оценок
экстремума по конечному числу испытаний, является класс функций,
удовлетворяющих условию Липшица
( y ) ( y ) L y y , y , y Q R N
(1.20)
где L 0 - постоянная величина, называемая константой Липшица.
Что означает неравенство (1.20)? Перепишем его в одномерном случае в виде
( y ) ( y )
y y
L, y , y Q R N
Левая часть в последнем неравенстве – это наклон секущей, проходящей через
точки ( y , ( y )) и ( y , ( y )) . Таким образом, класс липшицевых функций (1.20)
– это класс функций с ограниченными (константой L ) наклонами.
Является ли липшицева функция непрерывной?
Ответ положительный, поскольку согласно (1.20) малому приращению
аргумента соответствует малое приращение функции.
7.
Оценки экстремума для липшицевых функцийЯвляется ли непрерывная функция липшицевой?
Не всегда. Пример: y , y [0, 1] . У нее неограниченный наклон около нуля.
Является ли липшицева функция дифференцируемой?
Не всегда. Пример: y , y [ 1, 1]. Она не дифференцируема в нуле.
Является ли дифференцируемая функция липшицевой?
Да, является с константой L max ( y ) .
y Q
Очевидно, что если функция является липшицевой с константой L , она будет
липшицевой для любой константы M L .
Неравенство (1.20) позволяет построить по результатам испытаний кусочнолинейную функцию, называемую нижней огибающей, или минорантой, которая
в точках испытаний совпадает с вычисленными значениями функции ( y ) , а в
остальных точках ограничивает ( y ) снизу.
Рассмотрим одномерную задачу
( y ) min, y Q [a, b] R1
(1.21)
Предположим, что мы провели k испытаний в точках y1 , y 2 ,..., y k (a, b) , получили
значения функции z 1 , z 2 ,..., z k в этих точках и перенумеровали точки испытаний
вместе с концами отрезка поиска a и b в соответствии с (1.19).
8.
Оценки экстремума для липшицевых функцийВозьмем некоторую точку yi , 1 i k , из множества (1.19). Тогда для
липшицевой функции, удовлетворяющей (1.20), для любого y [a, b]
справедливо неравенство
( yi ) ( y ) L yi y ,
или
( y ) ( yi ) L yi y ,
(1.22)
Последнее неравенство при y yi , т.е. слева от yi , имеет вид
( y ) ( yi ) Lyi Ly ,
где в правой части стоит возрастающая линейная функция
li ( y ) ( yi ) Lyi Ly , y yi ,
(1.23)
значение которой в точке yi совпадает со значением ( yi ) .
Аналогично при y yi (справа от yi )
( y ) ( yi ) Lyi Ly ,
т.е. функция ( y ) лежит над
убывающей линейной функцией
lˆi ( y ) ( yi ) Lyi Ly , y yi .
yi
(1.24)
9.
Оценки экстремума для липшицевых функцийЕсли мы обозначим как
i ( y ) ( yi ) L yi y
правую часть неравенства (1.22), то в общем случае
( y ) k ( y ) max{ i ( y ), 1 i k}, y [a, b],
(1.25)
где функция k ( y ) - кусочно-линейная миноранта, построенная по
результатам испытаний (1.19).
Рассмотрим величину k* min k ( y ) . Тогда очевидно, что величина
y [ a ,b ]
глобального минимума находится между величинами k* - минимальным
вычисленным значением (1.15) целевой функции – и k* - минимальным
значением миноранты. Это значит, что
( y)
мы можем оценить погрешность
решения (1.18) – погрешность по
значению – величиной
( y)
(1.26)
k k* k*
а погрешность по координатам
оценивается величиной области, в
*
которой k ( y ) k .
*
k
10.
Оценки экстремума для липшицевых функцийРассмотрим пример построения миноранты для конкретной функции
на отрезке [1, 7] .
( y 4) 2
( y)
5
2
Это квадратичная функция с минимумом * 5 в точке y * 4 и значениями
на концах отрезка – в точках 1 и 7 , равными 9.5.
11.
Оценки экстремума для липшицевых функцийПроизводная этой функции ( y ) y 4
Поскольку функция ( y ) дифференцируема, ее константа Липшица L может
быть посчитана как максимум на отрезке модуля производной, равный 3.
y 4
Построим последовательно миноранту по 4 точкам:
y1 1, y 2 7, y 3 2, y 4 5.
Значения функции ( y ) в них равны
z1 (1) 9.5, z 2 (7) 9.5, z 3 (2) 7, z 4 (5) 5.5.
12.
Оценки экстремума для липшицевых функций1
Начнем с точки y 1 . Поскольку весь отрезок лежит справа от этой точки, то
из двух минорирующих линейных функций (1.23), (1.24) возьмем только
последнюю, которая имеет вид
lˆ1 ( y ) ( y1 ) Ly1 Ly 12.5 3 y, y 1.
Следующая точка y 2 7. Отрезок целиком слева от точки, поэтому берем
только линейную миноранту (1.23):
l 2 ( y ) ( y 2 ) Ly 2 Ly 3 y 11.5, y 7.
Теперь миноранта (1.25)
2 ( y ) max{lˆ1 ( y ), l 2 ( y )}, y [a, b].
( y1 )
( y2 )
lˆ1 ( y )
l 2 ( y)
13.
Оценки экстремума для липшицевых функцийБерем точку y 3 2 . Для нее функция (1.23) имеет вид
l 3 ( y ) ( y 3 ) Ly 3 Ly 1 3 y, y 2,
а функция (1.24) -
lˆ 3 ( y ) ( y 3 ) Ly 3 Ly 13 3 y, y 2.
Теперь строим миноранту 3 ( y ) max{lˆ1 ( y ), l 2 ( y ), l 3 ( y ), lˆ 3 ( y )}, y [a, b].
y1
y2
lˆ1 ( y )
y3
l 2 ( y)
14.
Оценки экстремума для липшицевых функцийПоследняя точка y 4 5. Функция (1.23) для нее
l 4 ( y ) ( y 4 ) Ly 4 Ly 3 y 9.5, y 5,
а функция (1.24)
lˆ 4 ( y ) ( y 4 ) Ly 4 Ly 20.5 3 y, y 5.
Конструируем миноранту
( y ) max{lˆ1 ( y ), l 2 ( y ), l 3 ( y ), lˆ 3 ( y ), l 4 ( y ), lˆ 4 ( y )}, y [a, b].
4
*
Для глобального минимума имеем ограничение 4* * 4* , т.е. погрешность
k k* k* 3.75
lˆ1 ( y )
l 2 ( y)
4* 5.5
l 3 ( y)
l 4 ( y)
y1
y3
lˆ 4 ( y )
lˆ 3 ( y )
y4
y2
4* 1.75
15.
Estimates of extremum for Lipschitzian functionsМы строили миноранту, постепенно уточняя по мере поступления значений.
Можно ее строить после того, как все значения получены . С этой целью
1
2
3
4
упорядочим все координаты y , y , y , y по возрастанию, перенумеровав их
нижним индексом: y1 1, y2 2, y3 5, y4 7 , и сопоставим им значения
функции z1 (1) 9.5, z 2 (2) 7, z3 (5) 5.5, z 4 (7) 9.5.
Тогда для точки y1 , как и ранее, строится только функция из (1.24)
lˆ1 ( y ) z1 Ly1 Ly lˆ1 ( y ) 12.5 3 y
Для точки y2 2 получаем функцию (1.23)
l2 ( y ) z 2 Ly2 Ly l 3 ( y ) 1 3 y, y 2,
Функция 1, 2 ( y ) max {lˆ1 ( y ), l2 ( y )}
y1 y y 2
lˆ1 ( y )
описывает часть миноранты на
отрезке [ y1 , y2 ].
l2 ( y )
y1
y2
y3
y4
16.
Оценки экстремума для липшицевых функцийДля точки y2 2 получаем функцию (1.24)
lˆ2 ( y ) z2 Ly2 Ly lˆ3 ( y ) 13 3 y, y 2.
Для точки y3 5 получаем функцию (1.23)
l3 ( y ) z3 Ly3 Ly l 4 ( y ) 3 y 9.5, y 5,
Функция 2,3 ( y ) max {lˆ2 ( y ), l3 ( y )} описывает «зубец» миноранты
y 2 y y3
на отрезке [ y2 , y3 ].
l1 ( y)
l2 ( y )
l3 ( y )
y1
y2
lˆ2 ( y )
y3
y4
17.
Оценки экстремума для липшицевых функцийНаконец, строим функцию (1.24) для точки y3 5
lˆ3 ( y ) z3 Ly3 Ly lˆ 4 ( y ) 20.5 3 y, y 5,
и функцию (1.23)
l4 ( y ) z 4 Ly 4 Ly l 2 ( y ) 3 y 11.5, y 7.
для точки y4 7 чтобы получить последнюю часть миноранты на отрезке [ y3 , y4 ].
( y ) max {lˆ ( y ), l ( y )}
3, 4
y3 y y 4
3
4
l1 ( y)
l4 ( y )
l2 ( y )
l3 ( y )
y1
y2
lˆ3 ( y )
lˆ2 ( y )
y3
y4
18.
Оценки экстремума для липшицевых функцийРассмотрим две соседних точки yi 1 yi из ряда (1.19) со значениями
zi 1 ( yi 1 ), zi ( yi ). Зубец миноранты между ними описывается функцией
( y ) max {lˆ ( y ), l ( y )}
i 1,i
yi 1 y yi
i 1
i
где
lˆi 1 ( y ) zi 1 Lyi 1 Ly , y yi 1 ,
li ( y ) zi Lyi Ly , y yi ,
y пересечения этих двух функций является точкой минимума функции
Точка ~
i
i 1,i ( y ) на отрезке [ yi 1 , yi ].
Ее легко найти из равенства
zi 1 Lyi 1 Ly zi Lyi Ly ,
откуда
z zi 1
1
~
yi ( yi 1 yi ) i
.
(1.26)
2
2L
yi является величина li ( ~
Значением миноранты в точке ~
yi ) , равная
1
L
~
zi ( zi 1 zi ) ( yi yi 1 ).
(1.27)
2
2
19.
Построение минорантыЗадание
Построить для константы Липшица L 15 миноранту функции
y 3 5 y 2 6 y 2 на интервале [0,4] по точкам испытаний
y1 0, y2 1, y3 2, y4 4
и указать оценку величины глобального минимума
k k* k*