Раздел 1. Простейшая задача вариационного исчисления

634.50K

Category:

physics

Простейшая задача вариационного исчисления

1. Раздел 1. Простейшая задача вариационного исчисления

1.1. Введение
В этом разделе мы рассмотрим важнейшие понятия вариационного
исчисления: введем понятие функционала и рассмотрим такие важные
понятия, как вариации кривых и функционалов. При этом мы будем двигаться
примерно тем же путем, которым развивалось вариационное исчисление со
времен Л.Эйлера во второй половине XVIII - начале XIX веков. Сначала мы
построим уравнение Эйлера - Лагранжа – важнейшее необходимое условие
экстремума функционала, позволяющее определить подозрительную на
экстремум функцию, затем получим необходимые условия А.-М.Лежандра и
К.Вейерштрасса, которые разрабатывались с конца XVIII по вторую половину
XIX века.
1

2.

1.2. Функционалы. Постановка простейшей задачи вариационного
исчисления
Введем понятие функционала и рассмотрим его характерные примеры.
О1. Функционалом назовем отображение из некоторого множества в
числовую ось.
Пример 1. Скалярное произведение 2-х векторов:
n
( A, B ) ai bi
i 1
есть типичный функционал: отображение из n-мерного пространства Rn в
числовую ось R.
Пример 2. Задача о кратчайшем расстоянии между точками а и b,
соединенными кривыми в плоскости (x,y). Это расстояние выражается таким
функционалом:
b
J ( y ) 1 y 2 dx
a
2

3.

Таким
образом,
здесь
функционал
есть
отображение
из
множества
непрерывных кривых, соединяющих две точки в числовую ось R.
Пример 3. Задача о брахистохроне: среди всех кривых в плоскости (x,y),
соединяющих точки а и b, найти ту, двигаясь по которой тяжелая точка
попадет из а в b за кратчайшее время.
Поставим задачу строго. Примем за ось Ox горизонтальную прямую, а ось Oy
направим вниз. При движении с нулевой начальной скоростью из точки (а,0) в
точку b с координатами (xb,yb) имеем:
v 2gy
.
Пусть уравнение искомой кривой есть y(x). Тогда скорость движения точки
есть
1 y 2
ds
v
dx
dt
dt
Откуда
1 y 2
1 y 2
dt
dx
dx
v
2 gy
3

4.

Интегрируя последнее соотношение, найдем выражение для полного времени:
b
1 y 2
T
dx .
2 gy
a
Очевидно, что от выбора той или кривой зависит величина времени движения
T, то есть имеем типичный функционал. Исторически это первая задача
вариационного исчисления, сформулированная Г.Галилеем в 1638 г. и
решенная И. Бернулли в 1696 г.
Рассмотрим
еще
один
пример
постановки
вариационных
задач
с
дифференциальными связями. Он относится к характерной задаче авиации,
поставленной в первой четверти XX века, когда скорости самолетов были
сравнимы со скоростью ветра.
4

5.

Пример 4. Задача Цермело. Определить ту траекторию, по которой должен
лететь самолет при наличии ветра, так, чтобы попасть из точки A в точку B за
кратчайшее время.
Рис.1.1. Параметры траектории полета
Пусть A и B - заданные на плоскости (x,y) точки начала и конца полета
(Рис.1.1). Предположим, что скорость ветра w(x,y) - заданная функция и пусть
y(x) - искомая траектория полета самолета, который движется с постоянной
скоростью u относительно воздуха.
5

6.

Тогда абсолютная скорость самолета есть
V=w+u.
Обозначим через φ и ψ углы между векторами w и u и вектором направления
полета V:
|w| sin φ = |u| cos ψ,
ds
|V| = |w|cosφ + |u|cosφ = |w|cosφ + | u |2 | w |2 sin2
dt
,
где ds – дифференциал дуги. Но отсюда имеем:
dt ds / | w | cos | u |2 | w |2 sin 2 ;
B
или
ds
T
.
2
2
2
A | w | cos | u | | w | sin
Таким образом, вновь видим, что время полета определяется характером
функции-траектории y(x), поскольку подынтегральное выражение хотя и не
содержит y(x) в явном виде, но без особого труда к такому виду приводится
6

7.

(для этого напомним, что ds dx dy 1 y dx,
а cosφ вычисляется по
wx dx wy dy
формуле: cos
). Тогда окончательно имеем:
w ds w ds
B
1 | y |2 dx
T
.
2
2
2
A wx wy y | u | (1 | y | ) (wy wx y )
2
Проиллюстрируем
теперь
2
современную
2
формально-строгую
постановку
простейшей задачи вариационного исчисления.
Пример 5. Простейшая задача вариационного исчисления:
b
J f ( x, y ( x), y ( x ))dx inf (sup) ,
при
a
y(а)=ya, y(b)=yb,
где f: R R R → R – основная функция. Здесь, следуя классическому подходу,
полагаем, что функция f дифференцируема по всем аргументам требуемое
число раз. Возникает важный вопрос. Откуда или из какого класса
(пространства) функций наша искомая функция y(x)?
7

8.

Поскольку мы полагаем, что у нее существуют y', то естественно считать, что
она, как минимум, из С1[a,b]. Иногда, памятуя о том, что функционал J зависит
от функции y(x), будем писать:
b
J ( y ( x)) f ( x, y, y )dx
a
Пример 5. Естественно обобщает пример
4 на случай n функций:
b
J f ( x, y1 ( x),..., yn ( x), y1 ( x),..., yn ( x))dx inf (sup)
a
yi (a) yi( a ) ,
Здесь f: R
yi (b) yi(b )
i = 1,2,...,n
Rn Rn→R и yi С1[a,b], i=1,2,…,n, а f также дифференцируема
требуемое число раз.
8

9.

1.3. Вариации кривых и функционалов
Сейчас мы поступим примерно так, как поступили Л.Эйлер и Ж.Лагранж,
рассматривая простейшую задачу.
Метод вариаций – подход Эйлера - Лагранжа в простейшей задаче. Итак,
пусть
разыскивается
экстремум
функционала
в
простейшей
задаче
вариационного исчисления. Далее всегда будем искать inf, помня, что в нашем
случае он отличается от sup только знаком
b
J f ( x, y ( x), y ( x))dx inf
a
y(a) = ya y(b) = yb .
,
(1.1)
(1.2)
Будем считать, что y(x) С1 ([a, b]).
О2. Семейство функций y(x) из С1([a, b]) назовем допустимым, если оно
удовлетворяют
условию
(1.2),
а
сами
функции
семейства
назовем
допустимыми.
9

10.

О3. Будем говорить, что кривая
y (x) из допустимого семейства сообщает
функционалу (1.1) относительный минимум, если
0 : { y(x) C 1 ([a,b] ), y(a)=ya , y(b) yb ,
max ( y(x) - y* (x) , y (x) - y *(x) ) } J ( y ) J ( y ) 0
xa x xb
y(x)
y*(x)
x1, y1
x2, y2
δy(x)
Рис. 1.2. Пример слабой вариации
Подчеркнем, что мы говорим об относительном минимуме как о минимуме на
множестве допустимых кривых, лежащих в некоторой малой окрестности y*(x),
тогда как под абсолютным минимумом понимаем тот, который достигается
среди всего множества допустимых кривых.
10

11.

Такой min принято называть слабым. Здесь близки как функции, так и
производные, как это показывает рисунок 1.2. В этом подходе явно
просматривается идея метода вариаций. В окрестности минимизирующей
функции y (x) находится множество мало отличающихся от нее функций y(x):
y(x) = y (x) +δy(x)
(1.3)
где δy(x) – вариация функции, которую определим таким образом.
О4. Назовем функцию δy(x) допустимой вариацией, если: δy(x) С1([a,b]) и
δy(a) = 0, δy(b) = 0
(1.4)
Таким образом, под вариацией функции мы понимаем семейство функций вида
δy(x) = θu(x), заданных на [a, b], удовлетворяющих (1.4), причем u(x)
С1([a,b]), а параметр 0 <θ <1 играет роль малого параметра.
Рассмотрим поведение функционала в окрестности минимизирующей кривой
y (x).
11

12.

Для этого изучим так называемую полную вариацию
ΔJ =J ( y*+ δy) – J(y*)
где
(1.5)
b
J ( y y ) f ( x, y ( x) y ( x), y ( x) y ( x))dx
(1.6)
a
Полагая, что f(x) сколь угодно гладкая (или, как сегодня принято, f С∞[a,b]),
Эйлер и Лагранж поступали примерно так. Разложив подынтегральную
функцию f в ряд по y и y , в первом интеграле в (1.5) с учетом вида функции
(1.6) будем иметь:
1
J J 2 J ...
(1.7)
2
где
b
J fdx,
a
b
f
y
b
J fdx,
J fdx;
a
a
2
2
(1.8)
1
f f 2 f ...,
2
f y y f y y , 2 f f yy 2 y 2 f yy y y f y y 2 y , ...
y
12

13.

Здесь ΔJ, δJ, δ2J, … - полная, 1-я, 2-я и последующие вариации
функционала J, а Δf, δf, δ2f - полная, 1-я, 2-я… вариации основной функции
f, вычисленные на кривой.
Как видим, δJ и δ2J, соответственно, главная линейная и квадратичная части
приращения функционала J. Также говорят, что
J ( y , y , y, y ) 1-я вариация по Лагранжу функционала J. На современном языке
функционального анализа 1-я вариация определяется так. Предварительно
дадим определение дифференцируемого функционала.
О5. Функционал Φ называется дифференцируемым, если
Φ(y + h) - Φ(y) = F(y,h) + R(h,y),
где F(y,h) зависит от h линейно, т.е. при фиксированном элементе y (в
вариационном исчислении это некоторая кривая y(x)) имеет место:
13

14.

F(y,h1+h2)= F(y,h1) +F(y,h2),
F(y,ch) = kF(y,h),
а R(h,y)= 0(h2) в том смысле, что из |h| < ε и |dh/dx| < ε, вытекает |R| < Cε2, где С
и k - некоторые постоянные.
В таком случае
О6. Линейная часть приращения, т.е. F(y,h), называется дифференциалом
функционала Φ на элементе y в направлении h.
Определения 5 и 6 связаны с именами Р.Гато и М. Фреше. Как видим,
дифференциал F( y ,δy) ≡ J ( y , y , y, y )
в вариационном исчислении
называют первой вариацией функционала J, а «малый» элемент h(x) ≡ δy(x)
называют вариацией кривой.
14

15.

На пространстве допустимых функций y(x) рассмотрим параметрическое
семейство θ > 0 (семейство вариаций δy(x) = θu(x) при фиксированной функции
u(x) и малом переменном параметре θ):
y(x) = ŷ(x)+ θ u(x),
0 < θ < 1,
тогда, совершив предельный переход при θ → 0 и предположив существование
предела, получим такое выражение для приращения функционала (1.1) в
простейшей задаче:
x
J ( yˆ u ) J ( yˆ ) 2
[ f y ( x, yˆ u ( x), yˆ u ( x))u ( x) f y ( x, yˆ u ( x)
x1
yˆ u ( x))u ( x)]dx.
Рекомендуем проделать соответствующие выкладки.
Это в «чистом виде» дифференциал Гато:
x2
J ( yˆ ( x), u ( x)) 0 J ( yˆ , u ) ( f yu f y u )dx
x1
Отметим, что он линеен по u и u'. Также мы предполагаем его непрерывность
по этим аргументам.
15

16.

1.4. Уравнение Эйлера - Лагранжа в дифференциальной форме
Итак, будем оставаться в условиях гладкости по всем аргументам функции
f(x,y,y'). Имеет место
Теорема 1. Функционал
b
J f ( x, y ( x), y ( x))dx
a
дифференцируем, и его дифференциал дается формулой
b
f d f
f
F ( h) [
]hdx ( h)
y dx y
y a
a
b
(1.9)
Заметим, что F(h) есть по нашим предыдущим обозначениям δJ, то есть
δJ = F(h) (в соответствующих обозначениях).
Для доказательства теоремы 1 дадим еще одно определение экстремали и
рассмотрим вспомогательную теорему 2 и лемму.
16

17.

О7. Экстремалью дифференцируемого функционала J(y) назовем такую
кривую y(x), на которой F(h,y) = 0 при любом h. (Точно так же, как в
стационарной точке x функции y(x), если в этой точке дифференциал равен
нулю).
Теорема 2. Чтобы кривая y(x) была экстремалью функционала
b
J f ( x, y ( x), y ( x))dx
a
на пространстве кривых, проходящих через точки y(a) = ya и y(b) = yb ,
необходимо и достаточно, чтобы вдоль кривой y(x) выполнялось условие:
f d f
0 .
y dx y
Доказательство построим на основе леммы.
Лемма Лагранжа. Если непрерывная функция f(x), a ≤ x ≤ b такова, что
b
f ( x)h( x)dx 0
a
для любой непрерывной функции h(x), для которой h(a) = h(b) = 0, то f(x) ≡ 0.
17

18.

Док-во леммы. Пусть f(x*) > 0, a < x* < b (рис. 1.3).
h
x*-d
x1
x*
∆/2
x*+d
x2
Рис. 1.3 Вид функции h(x)
В силу непрерывности f(x) > сonst в некоторой окрестности ∆ точки x*:
a < x* - d < x < x* + d < b. Пусть при этом h(x) = 1 в промежутке длиной d:
(x*d/2) < x < (x*+d/2), и h(x) > 0 в остальной части ∆, а вне ∆ h(x) = 0. Тогда
очевидно, что
b
x* d
f ( x)h( x)dx
a
x* d
x* d /2
f ( x)h( x)dx
f ( x)dx d const 0
x* d /2
Полученное противоречие доказывает, что f(x*) = 0 для всех a < x* < b, ч.т.д.
Теперь перейдем к доказательству теоремы 1.
18

19.

Начнем с того, что по теореме 2:
b
f d f
f
F ( h) [
]hdx ( h)
y dx y
y a
a
b
Внеинтегральный член равен нулю, т.к. h(a) = h(b) = 0. Если y – экстремаль, то
F(h) = 0 при всех h, для которых h(a) = h(b) = 0. Поэтому при всех таких h(x)
имеем
b
f ( x)h( x)dx 0
,
a
где
f ( x)
f d f
0
y dx y
По лемме f(x) ≡ 0. Обратно, если f(x) ≡ 0, то, очевидно, F(h) ≡ 0, ч.т.д. Итак, на
экстремали первая вариация функционала обращается в 0:
b
J ( yˆ ( x), u ( x)) 0 J ( yˆ , u ) ( f y u f y u )dx = F(h) = 0.
(1.10)
a
19

20.

О7. Уравнение
f d f
0
y dx y
(1.11)
называется уравнением Эйлера - Лагранжа для функционала
b
J f ( x, y ( x), y ( x))dx .
a
Замечание 1. Пусть имеется
функционал, зависящий от n функций:
b
J f ( x, y1 ( x),..., yn ( x), y1 ( x),..., yn ( x))dx,
a
yi (a) yi( a ) , yi (b) yi(b ) i = 1,2,...,n
Тогда аналогично доказывается, что искомая система функций yi , i=1,2,…,n
удовлетворяет системе уравнений Эйлера - Лагранжа
f
d f
0, i 1,2,..., n
yi dx yi
Это система n уравнений второго порядка, и её решение зависит от 2n
произвольных постоянных. Для нахождения их служат 2n условий:
yi (a) yi( a ) ,
yi (b) yi(b )
i = 1,2,...,n
20

21.

Замечание 2. Свойство кривой y(x) быть экстремалью функционала не
зависит от выбора системы координат.
Преобразование и лемма Дюбуа - Раймонда.
Наименование данного параграфа подразумевает, что имеется и другая
форма уравнения Эйлера - Лагранжа. Действительно, рассмотрим первую
вариацию (1.10) функционала, которую запишем в виде:
b
J ( f y y f y y )dx .
(1.12)
a
Интегрируя второй член по частям, с учетом краевых условий получаем
форму Лагранжа для первой вариации функционала
b
f d f
J (
) ydx .
y dx y
a
Заметим, что для проведенная операции интегрирования по частям нужна
дифференцируемость y‫(׳‬x), что подчас является избыточным требованием.
21

22.

Обойти требование существования y‫(׳׳‬x) можно, используя преобразование
Дюбуа - Раймонда, для построения которого введем функцию
x
N ( x) f y dx
Тогда
,
a
b
J (
a
dN
y f y y )dx.
dx
Интегрируя по частям первый член и учитывая краевые условия, найдем
вариацию функционала в форме Дюбуа - Раймонда:
b
J ( N f y ) y dx.
a
Лемма Дюбуа - Раймонда. Если непрерывная функция N(x), a ≤ x ≤ b такова,
что
b
N ( x) ( x)dx 0
a
для любой непрерывной функции θ(x), для которой θ(a) = θ(b) = 0, то N(x)
≡ const при a ≤ x ≤ b.
Доказательство
леммы
опускаем,
отметив,
что
оно
не
содержит
принципиально новых идей в сравнении с доказательством леммы Лагранжа.
22

23.

Записав необходимое условие экстремума функционала в форме Дюбуа Раймонда
b
J ( N f y ) y dx 0,
a
и используя одноименную лемму, получим интегральную форму уравнения
Эйлера - Лагранжа:
b
f y N f y f y dx C ,
где C – постоянная.
(1.13)
a
Частные случаи интегрируемости уравнения Эйлера-Лагранжа.
Уравнение Эйлера - Лагранжа
f d f
0
y dx y
играет фундаментальную роль в вариационном исчислении. В общем случае
это нелинейное дифференциальное уравнение второго порядка с краевыми
условиями вида (в простейшей задаче вариационного исчисления)
y(a) = ya,
y(b) = yb .
23

24.

Вместе с тем в ряде случаев оно допускает сведение к уравнению 1-го порядка
или даже может быть проинтегрировано.
1. Функция f(x,y,y') не зависит от y, т.е. f = f(x,y'). Здесь уравнение Эйлера Лагранжа имеет вид:
d f
0
dx y
и очевидно имеет первый интеграл
f
.
Const
y
Это уравнение первого порядка, которое, будучи разрешенным относительно
y', имеет вид (С- постоянная):
y‘ = f(x,C).
2. Функция f(x,y,y') не зависит от x , т.е. f = f(y,y'). Здесь уравнение Эйлера Лагранжа приобретает вид:
f d f f
f
f
,
y
y
y dx y y y y
y y
24

25.

3. Функция f(x,y,y') не зависит от y', т.е. f = f(x,y). Здесь уравнение Эйлера Лагранжа имеет «конечный» вид
f(x, y)
0 ,
y
то есть не является дифференциальным.
25

26.

1.5. Необходимое условие Лежандра слабого минимума функционала
Итак, предположим, что мы нашли решение уравнения Эйлера - Лагранжа некоторую функцию y( x) . В общем случае нет гарантии, что найденное
y( x) будет минимизирующей кривой. Действительно, как мы помним, уже при
поиске минимума функции одного переменного условие dy/dx=0 не
гарантирует, что мы находимся в точке минимума функции, т.к. это, например,
может быть точкой её перегиба.
Наш же случай более сложен, и нам необходимо убедиться, что решение
уравнения Эйлера - Лагранжа действительно дает минимум функционала. Для
этого нужно рассмотреть окрестность найденной кривой, т.е. рассмотреть
близкие к ней кривые, иначе говоря, рассмотреть допустимые вариации.
Сначала рассмотрим случай слабых вариаций, о которых упоминали выше в
связи с определением слабого минимума функционала (см. определение 3).
26

27.

Здесь δy и δy' малы, или, в терминах Чебышевской близости, все допустимые
кривые и их первые производные близки к экстремали y(x) и её производной,
то есть:
max( y(x) - y* (x) , y (x) - y *(x) ) малы.
a x b
Это близость 1-го порядка. Отметим, что исходя отсюда, можно определить и
близость k-порядка:
k
max( y(x) - y* (x) , y (x) - y *(x) ,..., y (x) - y k *(x) ) малы.
a x b
Ясно, что такая близость отвечает высокой гладкости как семейства функций
y(x) и их производных, так и функции y (x) и её производных.
Рассматривая полное приращение функционала ΔJ (1.8) в случае слабых
вариаций, мы можем ограничиться его первой J и второй 2J вариациями
включительно, т.к. входящие в старшие вариации δ3y, δ3y', δ4y, δ4y' и т.д. малы,
т.е.
1 2
J J J
2
27

28.

Но, так как, согласно теореме 2,
J = 0,
то нам нужно рассмотреть только вторую вариацию. Вновь обращаясь к
2
формулам (1.8) и избавляясь от вариации δy' во втором слагаемом в J ,
запишем вторую вариацию в виде:
b
d
J f yy 2 y f yy 2 y f y y 2 y dx
(1.14)
dx
a
Предполагая требуемую гладкость (т.е. непрерывность y, y' и f yy ), интегрируем
2
по частям 2-й член:
b
f
b
yy
a
df
b
d 2
ydx = f yy ( 2 y) a - yy 2 y dx
dx
dx
a
и учитывая краевые условия для допустимых вариаций (1.4), запишем
выражение (1.14) для в виде:
b
df
J ( f yy yy ) 2 y f y y 2 y dx
dx
a
2
(1.15)
28

29.

Исследуем эту квадратичную функцию при δy → 0 и δy‘→ 0, выделяя главную
часть при предельном переходе с учетом того, что вариации слабые. Для этого
рассмотрим допустимые вариации специального вида (рис. 1.4), где δy = 0
всюду на [a,b] кроме сегмента [P,R], причем на x [P,Q] δׂy‘ > 0 и постоянно, а
на x [Q,R] δy‘ < 0 и убывает (по модулю).
δy
a
P
R
Q
c
d
b
x
Рис.1.4. Специальные вариации при выводе условий Лежандра
Положим,
Q - P=c → 0 ~ ε2,
R - Q=d → 0 ~ ε,
где ε – некоторый малый масштабный множитель.
29

30.

В согласии с (1.15) 2 J принимает вид:
Q
Q
d
2
2
J ( f yy f yy ' ) ydx. f y ' y ' ( y' ) 2 dx
dx
P
P
R
R
d
( f yy f yy ' ) 2 ydx f y ' y ' ( y' ) 2 dx
dx
Q
Q
Помня, что на [P,Q] δy' постоянна и мала, а на [Q,R] δy‘ ~ ε, и замечая, что при
указанном характере «сжатия» промежутка P - Q δy~ε2 на нем, оценим каждый
из четырех интегралов.
На [P,Q] имеем: y2 4, c 2, откуда:
Q
d
d
d
2
2
4 2
6
(f
f
)
ydx
(f
f
)
y
c
(f
f
)
~
,
yy
yy
yy
yy
P yy dx yy
cp
dx
dx
cp
cp
аналогично
Q
f y ' y ' ( y ') 2 dx f y ' y '
cp
( y ') 2
cp
c ~ 2.
P
На [Q,R] имеем: y2 4, d , откуда:
R
( f yy
Q
d
d
d
f yy ' ) 2 ydx ( f yy
f y ' y ) 2 y d (f yy f y ' y ) 4
cp
dx
dx
dx
cp
cp
5,
30

31.

и, наконец,
R
f y ' y ' ( y ' )2 dx f y ' y ' ( y ' )2
cp
cp
d 2
3
Q
Т.о. при ε → 0 главная часть выражения для определяется вторым интегралом
и принимает вид:
Q
2 J = f y'y' ( y ' )2 dx
P
и, с учетом произвольности точки
Q, в окрестности которой рассматривается
вариация, получаем:
(1.16)
f y' y' 0
Это неравенство A.M. Лежандра (1752-1833) слабого минимума функционала.
Таким образом, нами доказана
Теорема 3 (Лежандра). Для того, чтобы квадратичный функционал
b
df
J ( f yy yy ) 2 y f y y 2 y dx
dx
a
был неотрицателен, необходимо, чтобы на всюду на [a,b] выполнялось
2
неравенство f y ' y ' 0
31

32.

Таким образом, мы получили второе необходимое условие минимума
функционала.
Замечание 1. Для случая функционала, зависящего от n функций
b
J f ( x, y1 ( x),..., yn ( x), y1 ( x),..., yn ( x)) dx
a
неравенство Лежандра является следствием неотрицательности квадратичной
формы:
b
n
a
i , j 1
n
n
J ( f y y yi y j f y y yi y j f y y yi y )dx ,
2
i
j
i
i , j 1
j
i , j 1
i
j
которая, как и выше, на основе рассмотрения слабых вариаций сводится к
квадратичной форме
b
n
a
i , j 1
J ( f y y yi y j )dx,
2
i
j
с такой системой неравенств, необходимых для её неотрицательности:
32

33.

f y1 y1
f y1 y1
0,
f y2 y1
f y1 y2
f y2 y 2
f y1 y1
f y2 y1
0,...,
...
f y1 y2
f y2 y2
...
...
...
...
f y1 yn
f y2 yn
0.
...
f yn y1
f yn y2
...
f yn yn
на всем промежутке [a, b], на котором заданы экстремали.
1.6. Необходимое условие Вейерштрасса сильного минимума функционала
Неравенство Лежандра есть необходимое условие слабого минимума
функционала. Неравенство К.Вейерштрасса (1815–1897) отвечает сильным
вариациям, то есть здесь имеет место только близость функций, а производные
могут отличаться сколь угодно сильно, как это показано на рис. 1.5. И здесь
мы говорим уже о сильном экстремуме, где близки только варьируемые
функции, а вариации первых производных - нет, как это имеет место в точках c
и d на рис.1.6.
33

34.

y
y*
Рис.1.5. Близость функций 0-ого порядка.
a
с1
d1
b
Рис.1.6. Пояснение к понятию сильных вариаций
Обращаясь к разложению полной вариации функционала (1.8)
1 2
J J J ... ,
2
(1.17)
34

35.

напомним, что при построении условия Лежандра мы полагали, что можно
ограничиться только квадратичными членами, так как старшие вариации
функционала δ3J, δ4J,… содержат малые δy и δy' в степенях ≥ 3 и являются
пренебрежимо малыми. В рассматриваемом случае сильных вариаций (δy малы,
δy'
-
любые)
такое
представление
несправедливо,
и
нужно
рассматривать все члены в разложении (1.17).
При этом здесь удобно вернуться к исходной форме полной вариации
функционала (1.8), т.е.
a
J fdx
На экстремали J = 0, а на любойb близкой к экстремали кривой будет ΔJ > 0,
т.е. можно записать:
ΔJ - J > 0,
Введем так называемую избыточную функцию Вейерштрасса Е:
E=ΔJ - J
(1.18)
35

36.

Тогда имеем:
b
,
Edx
0
где
a
f f ( x, y y, y y ) f ( x, y, y ),
f f y ( x, y, y ) y f y ( x, y, y ) y .
Выясним структуру функции Вейерштрасса (1.18), для этого вновь
рассмотрим вариации специального вида (рис. 1.7). Как и ранее, введем малый
параметр ε, при этом вновь полагаем:
Q – P = c → 0 ~ ε2 ,
R – Q = d → 0 ~ ε.
На таком классе вариаций имеем:
b
Q
R
Edx Edx Edx 0
a
P
(1.19)
Q
Теперь полагаем, что δy' положительна и любая по величине на [P,Q], а на
[Q,R], как и при выводе условия Лежандра, δy‘ ~ ε, и вновь на промежутке P Q δy ~ ε2.
36

37.

δy
P
a
Q
c
R
b
d
x
δy'
P
a
Q
R
b
x
Рис.1.7. Специальные вариации при выводе условия Вейерштрасса
Оценим каждый из интегралов в (1.19):
- на [Q,R], разложив Δf в ряд Тейлора и учитывая малость δy и δy'
1
1
E f f f 2 f f 2 f
2
2
2
найдем, что E , тогда d ; что приводит к такой оценке:
R
2
3
Edx
~
Q
37

38.

- на [P,Q], в согласии условиями, что δy' - любое, а длина промежутка c 2,
что дает такую оценку .
Q
Edx E ср d
E ср 2
P
Т.о., (1.19) при ε → 0 принимает вид
Q
Edx 0
P
Откуда, по произвольности промежутка, имеем:
Е > 0.
При этом величины ∆f и δf с учетом того, что δy → 0, принимают вид:
f f ( x, y, y y ) f ( x, y, y ),
f f y ( x, y, y ) y ,
и выражение для функции Вейерштрасса (1.18) окончательно таково:
E f ( x, y, y y ) f ( x, y, y ) f y ( x, y, y ) y .
(1.20)
Таким образом, мы доказали
38

39.

Теорему 4. Для того, чтобы экстремаль (x) сообщала
y сильный относительный
минимум функционалу
J
x2
f ( x, y( x), y ( x))dx
,
x1
необходимо, чтобы на ней при любых значениях δy' функция Вейерштрасса
была неотрицательна, т.е.:
E( x, y( x), y ( x), y ) 0
при y , x [x1 ,x2 ] .
Замечания.
1. Часто соотношение (1.20) называют неравенством Вейерштрасса.
2. При малых δy' неравенство Вейерштрасса переходит в неравенство
Лежандра, т.к.:
f ( x, y, y ' y ') f y ' ( x, y, y ') y ' f y ' y ' ( x, y , y ')
и
E f y ' y ' 2 y ' 0 .
2y'
2
,
39

40.

4. Для случая функционала, зависящего от n функций
x2
J f ( x, y1 ( x ),..., yn ( x ), y1 ( x ),..., yn ( x ))dx
x1
неравенство Вейерштрасса имеет вид:
E f ( x, y1 , y2 ,... yn , y1 , + y1 , y2 y2 ,..., yn yn )
,
n
f ( x, y1 , y2 ,... yn , y1 , y2 ,..., yn ) f y ( x, y1 , y2 ,... yn , y1 , y2 ,..., yn ) yi
i 1
5. В чем смысл неравенства Вейерштрасса!? Здесь мы должны отметить
следующие обстоятельства:
- во-первых, мы расширили класс экстремалей до таких, которые не
принадлежат классу С1[x1,x2], т.е. предполагаем, что допустимые кривые могут
иметь изломы, т.е. точки разрыва
производных, иначе говоря, расширили
постановку вариационной задачи;
- во-вторых, и это обстоятельство как раз и подчеркивается тем, что вектор -
параметр r - может быть любым, именно он и характеризует величины скачков
производных у допустимых кривых уi(x).
40

41.

Далее мы увидим и другие стороны роли неравенства Вейерштрасса в
вариационном исчислении, но для этого нам нужно будет ввести понятие поля
экстремалей (разделы 2 и 5).
6. Вариации, рассмотренные в доказательстве, носят название игольчатых
(рис. 1.8, при n = 1).
a x0 x0+e
b
x2
Рис. 1.8. «Иголки» Вейерштрасса
41

42.

Т.е.
J
x2
( f
x1
1 2
f ...)dx
2
т.е. можно ограничиться квадратичными членами в разложении ∆f
1
f f 2 f
2
1.7. О некоторых проблемах классического вариационного исчисления
Уже Д.Гильберт обратил внимание на одну проблему в постановке
простейшей задачи
J ( y)
x2
f ( x, y, y )dx min
x1
y ( x1 ) y1 ,
y ( x2 ) y 2
Эйлер и Лагранж полагали, что f очень гладкая, а y С1[x1, x2], но Д. Гильберт
на следующем примере показал, что так сужать класс для f и y нет
необходимости:
b 1
J ( y)
2
x 3 y 2 dx min,
y(0)= 0, y(1)= 1;
a=0
42

43.

Т.к. f(x,y) = x2/3y‫׳‬2, то уравнение Эйлера - Лагранжа таково: fy‫ = ׳‬x2/3y‫ = ׳‬const,
откуда y‫ = ׳‬C/x2/3 и y*(x) =
1
x . Но y‫(׳‬0) не определено, а значит y( x) C [a,b] .
3
Однако именно кривая y ( x) 3 x дает минимум. Действительно, выберем
y(x) = y*(x) + u(x),
но тогда
1
1
u(0) = u(1) = 0,
1
1
J ( y ) x 3 (y* +u ) dx = x 3 y dx + 2x 3 y u dx + x 3u 2 dx
2
2
0
2
2
0
J ( y )
2
2
0
2
0
1
u dx + J(u) J ( y ).
3
0
Итак, решение за пределами класса С1[a,b].
Рассмотрим еще один1пример
J ( y ) y 2 ( x)dx,
y(0)= 0, y(1)= 1,
0
где, очевидно, минимум достигается на разрывной функции:
y* (x)
0, при 0 x < 1,
1, при x 1.
43

44.

Однако к этому минимуму можно сколько угодно хорошо приблизиться и
гладкими функциями. Укажите эти функции.
Но еще серьезней следующий пример
1
J ( y ) (1 y 2 ) 2 dx min,
y(0)= y(1)= 0.
0
Уравнение Эйлера - Лагранжа здесь имеет вид
f y 2(1 y 2 )2y const
или
y 3 y C 0
т.е. имеем кубическое уравнение: y 3 py q 0, где p -1, q C.
Его решение дается формулой Тартальи – Кардана:
2
p q
q
Q , A B 3 Q,
3 2
2
y1 A B или y Ax B x
Но это решение не удовлетворяет краевым условиям, тогда как y** = 0
удовлетворяет, но
J(y**)=1 (!)
44

45.

При этом условие Лежандра на функциях y*(x) и на y**(x) дает, во-первых,
2
f y y 4(1- 3y 2 ), и на y*(x) имеем: f y y 4(1- 3y ) 8 , и условие Лежандра не
выполняется, тогда как на y**(x): f y y 4(1- 3y 2 ) 4 0 и оно выполнено. Однако
функция, построенная на основе y*(x)
x, 0 x 1 2
y ( x)
1- x, 0 x 1
,
является подозрительной на минимум, хотя и y( x) C 1([0,1])
. При этом
заметим, что можно построить последовательность {yn(x)} такую, что yn(x) → 0
равномерно (рис. 1.9), тогда как y'n(x) не сходится ни к чему!
y
y1(x)
y3(x)
y2(x)
x
Рис. 1.9. Последовательность yn(x)
45

46.

Т.е. «решений» бесконечное множество! Каждое {yn(x)} – решение. Вместе с
тем к «негладкому» минимуму можно сколь угодно хорошо приблизиться
гладкими функциями J(y1(·)) > J(y2(·)) > … .
1.8. Заключение к 1 разделу
Итак, важнейшим результатом данного раздела является совокупность
необходимых условий, определяющих экстремаль (уравнение Эйлера Лагранжа) и уточняющих то, каков характер экстремума - слабый (выполнение
условия Лежандра) или сильный (выполнение неравенства Вейерштрасса).
Подчеркнем, что необходимые условия не гарантируют существование
решения.
46

47.

Также важным результатом является полученное нами выражение для
дифференциала функционала J в виде (1.9), которое удобно записать в виде
первой вариации функционала:
b
f d f
f
J [
] ydx ( y )
y
dx
y
y
a
a
b
,
(1.21)
и которая будет служить основой важных дальнейших построений.
45

English Русский Rules