Глава 19 ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ
Глава 19
ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ
Добавление, сделанное после лекции
Когда я учился в школе, наш учитель физики, по фамилии Бадер, однажды зазвал меня к себе после урока и сказал: «У тебя вид такой, как будто тебе все страшно надоело; послушай-ка об одной интересной вещи». И он рассказал мне нечто, что мне показалось поистине захватывающим. Даже сейчас, хотя с тех пор прошла уже уйма времени, это продолжает меня увлекать. И всякий раз, когда я вспоминаю о сказанном, я вновь принимаюсь за работу. И на этот раз, готовясь к лекции, я поймал себя на том, что вновь анализирую все то же самое. И, вместо того чтобы готовиться к лекции, я взялся за решение новой задачи. Предмет, о котором я говорю,— это принцип наименьшего действия.
Вот что сказал мне тогда мой учитель Бадер: «Пусть, к примеру, у тебя имеется частица в поле тяжести; эта частица, выйдя откуда-то, свободно движется куда-то в другую точку. Ты подбросил ее, скажем, кверху, а она взлетела, а потом упала.
От исходного места к конечному она прошла за какое-то время. Попробуй теперь какое-то другое движение. Пусть для того, чтобы перейти «отсюда сюда», она двигалась уже не так, как раньше, а вот так:
но все равно очутилась на нужном месте в тот же самый момент времени, что и раньше».
«И вот,— продолжал учитель,— если ты подсчитаешь кинетическую энергию в каждый момент времени на пути частицы, вычтешь из нее потенциальную энергию и проинтегрируешь разность по всему тому времени, когда происходило движение, то увидишь, что число, которое получится, будет больше, чем при истинном движении частицы.
Иными словами, законы Ньютона можно сформулировать не в виде F=ma, а вот как: средняя кинетическая энергия минус средняя потенциальная энергия достигает своего самого наименьшего значения на той траектории, по которой предмет двигается в действительности от одного места к другому.
Попробую пояснить тебе это чуть понятнее.
Если взять поле тяготения и обозначить траекторию частицы x(t), где х — высота над землей (обойдемся пока одним измерением; пусть траектория пролегает только вверх и вниз, а не в стороны), то кинетическая энергия будет 1/zm(dx/dt)2, а потенциальная энергия в произвольный момент времени будет равна mgx.
Теперь я для какого-то момента движения по траектории беру разность кинетической и потенциальной энергий и интегрирую по всему времени от начала до конца. Пусть в начальный момент времени ttдвижение началось на какой-то высоте, а кончилосъ в момент t2 на другой определенной высоте.
Тогда интеграл равен
Можно подсчитать разность потенциальной и кинетической энергий на таком пути... или на любом другом. И самое поразительное — что настоящий путь это тот, по которому этот интеграл наименьший.
Давай проверим это. Для начала разберем такой случай: у свободной частицы вовсе нет потенциальной энергии. Тогда правило говорит, что при переходе от одной точки к другой за заданное время интеграл от кинетической энергии должен оказаться наименьшим. А это значит, что частица обязана двигаться равномерно. (И это правильно, мы же с тобой знаем, что скорость в таком движении постоянна.) А почему равномерно? Разберемся в этом. Если бы было иначе, то временами скорость частицы превысила бы среднюю, а временами была бы ниже ее, а средняя скорость была бы одинаковой, потому что частице надо было бы дойти «отсюда сюда» за условленное время. Например, если тебе нужно попасть из дому в школу на своей машине за определенное время, то сделать это можно по-разному: ты можешь сперва гнать, как сумасшедший, а в конце притормозить, или ехать с одинаковой скоростью, или сначала можешь даже отправиться в обратную сторону, а уж потом повернуть к школе, и т. д. Во всех случаях средняя скорость, конечно, должна быть одной и той же — частное от деления расстояния от дома до школы на время. Но и при данной средней скорости ты иногда двигался слишком быстро, а иногда чересчур медленно. А средний квадрат чего-то, что отклоняется от среднего, как известно, всегда больше квадрата среднего; значит, интеграл от кинетической энергии при колебаниях скорости движения всегда будет больше, нежели при движении с постоянной скоростью. Ты видишь, что интеграл достигнет минимума, когда скорость будет постоянной (при отсутствии сил). Правильный путь таков.
Предмет же, подброшенный в поле тяжести вверх, сперва поднимается быстро, а потом все медленнее. Происходит это потому, что он обладает и потенциальной энергией, а наименьшего значения должна достигать разность между кинетической и потенциальной энергиями.
Раз потенциальная энергия возрастает по мере подъема, то меньшая разность получится, если как можно быстрее достичь тех высот, где потенциальная энергия велика. Тогда, вычтя из кинетической энергии этот высокий потенциал, мы добьемся уменьшения среднего. Так что выгоднее такой путь, который идет вверх и поставляет добрый отрицательный кусок за счет потенциальной энергии.
Но, с другой стороны, нельзя ни двигаться слишком быстро, ни подняться слишком высоко, потому что на это потребуется чересчур много кинетической энергии. Надо двигаться достаточно быстро, чтобы подняться и спуститься за определенное время, имеющееся в твоем распоряжении. Так что не следует стараться взлететь слишком высоко, а просто надо достичь какого-то разумного уровня. В итоге оказывается, что решение есть своего рода равновесие между желанием раздобыть как можно больше потенциальной энергии и желанием как можно сильней уменьшить количество кинетической энергии — это стремление добиться максимального уменьшения разности кинетической и потенциальной энергий».
Вот и все, что сказал мне мой учитель, потому что он был очень хороший учитель и знал, когда пора остановиться. Сам я, увы, не таков. Мне трудно остановиться вовремя. И поэтому вместо того, чтобы просто разжечь в вас интерес своим рассказом, я хочу запугать вас, хочу, чтобы вам стало тошно от сложности жизни,— попробую доказать то, о чем я рассказал. Математическая задача, которую мы будем решать, очень трудна и своеобразна. Имеется некоторая величина S, называемая действием. Она равна кинетической энергии минус потенциальная, проинтегрированная по времени:
Не забудьте, что и п. э. и к. э.— обе функции времени. Для любого нового мыслимого пути это действие принимает свое определенное значение. Математическая задача состоит в том, чтобы определить, для какой кривой это число меньше, чем для других.
Вы скажете: «О, это просто обычный пример на максимум и минимум. Надо подсчитать действие, продифференцировать его и найти минимум».
Но погодите. Обычно у нас бывает функция какой-то переменной и нужно найти значение переменной, при котором функция становится наименьшей или наибольшей. Скажем, имеется стержень, нагретый посредине. По нему растекается тепло и в каждой точке стержня устанавливается своя температура. Нужно найти точку, где она выше всего. Но у нас речь идет совсем об ином — каждому пути в пространстве отвечает свое число, и предполагается найти тот путь, для которого это число минимально. Это совсем другая область математики. Это не обычное исчисление, а вариационное (так его называют).
В этой области математики имеется много своих задач. Скажем, окружность обычно определяют как геометрическое место точек, расстояния которых от данной точки одинаковы, но окружность можно определить и иначе: это та из кривых данной длины, которая ограничивает собою наибольшую площадь. Любая другая кривая такого же периметра ограничивает площадь меньшую, чем окружность. Так что если поставить задачу: найти кривую данного периметра, ограничивающую наибольшую площадь, то перед нами будет задача из вариационного исчисления, а не из того исчисления, к которому вы привыкли.
Итак, мы хотим взять интеграл по пути, пройденному телом. Сделаем это так. Все дело в том, чтобы вообразить себе, что существует истинный путь и что любая другая кривая, которую мы проведем,— не настоящий путь, так что если подсчитать
для нее действие, то получится число, превышающее то, которое мы получим для действия, соответствующего настоящему пути.
Итак, задача: найти истинный путь. Где он пролегает? Один из способов, конечно, мог бы состоять в том, чтобы подсчитать действие для миллионов и миллионов путей и потом посмотреть, при каком пути это действие наименьшее. Вот тот путь, при котором действие минимально, и будет настоящим.
Такой способ вполне возможен. Однако можно сделать проще. Если имеется величина, обладающая минимумом (из обычных функций, скажем, температура), то одно из свойств минимума состоит в том, что при удалении от него на расстояние первого порядка малости функция отклоняется от минимального своего значения только на величину второго порядка. А в любом другом месте кривой сдвиг на малое расстояние изменяет значение функции тоже на величину первого порядка малости. Но в минимуме легкие уходы в сторону в первом приближении не приводят к изменению функции.
Это-то свойство мы и собираемся использовать для расчета настоящего пути.
Если путь правильный, то кривая, чуть-чуть отличная от него, не приведет в первом приближении к изменению в величине действия. Все изменения, если это был действительно минимум, возникнут только во втором приближении.
Это легко доказать. Если при каком-то отклонении от кривой возникают изменения в первом порядке, то эти изменения в действии пропорциональны отклонению. Они, по всей вероятности, увеличат действие; иначе это не был бы минимум. Но раз изменения пропорциональны отклонению, то перемена знака отклонения уменьшит действие. Выходит, что при отклонении и одну сторону действие возрастает, а при отклонении в обратную сторону — убывает. Единственная возможность того, чтобы это действительно был минимум,— это чтобы в первом приближении никаких изменений не происходило и изменения были бы пропорциональны квадрату отклонения от настоящего пути.
Итак, мы пойдем по следующему пути: обозначим через x(t) (с чертой внизу) истинный путь — тот, который мы хотим найти. Возьмем некоторый пробный путь x(t), отличающийся от искомого на небольшую величину, которую мы обозначим h(t).
Идея состоит в том, что если мы подсчитаем действие S на пути x(t), то разность между этим S и тем действием, которое мы вычислили для пути x(t) (для простоты
оно будет обозначено S), или разность между S и S, должна быть в первом приближении по hнулем. Они могут отличаться во втором порядке, но в первом разность обязана быть нулем.
И это должно соблюдаться для любой h. Впрочем, не совсем для любой. Метод требует принимать во внимание только те пути, которые все начинаются и кончаются в одной и той же паре точек, т. е. всякий путь должен начинаться в определенной точке в момент t1 и кончаться в другой определенной точке в момент t2. Эти точки и моменты фиксируются. Так что наша функция h(отклонение) должна быть равна нулю на обоих концах: h(t1)=0 и h(t2)=0. При этом условии наша математическая задача становится полностью определенной.
Если бы вы не знали дифференциального исчисления, вы могли бы проделать такую же вещь для отыскания минимума обычной функции f(x). Вы бы задумались над тем, что случится, если взять f(x) и прибавить к х малую величину h, и доказывали бы, что поправка к f(x) в первом порядке по h должна в минимуме быть равна нулю. Вы бы подставили x+h вместо х и разложили бы f(x+h) с точностью до первой степени h. . ., словом, повторили бы все то, что мы намерены
Итак, идея наша заключается в том, что мы подставляем x(t)=x(t)+- h(t) в формулу для действия
где через V(x) обозначена потенциальная энергия. Производная dx/dt — это, естественно, производная от x(t) плюс производная от h(t), так что для действия я получаю такое выражение:
Теперь это нужно расписать подетальней. Для квадратичного слагаемого я получу
Но постойте-ка! Ведь мне не нужно заботиться о порядках выше первого. Я могу убрать все слагаемые, в которых есть h2 и высшие степени, и ссыпать их в ящик под названием «второй и высшие порядки». Из этого выражения туда попадет только одна вторая степень, но из чего-то другого могут войти и высшие. Итак, часть, связанная с кинетической энергией, такова:
Дальше нам нужен потенциал V в точках x+h. Я считаю т) малой и могу разложить V(x) в ряд Тэйлора. Приближенно это будет V(x); в следующем приближении (из-за того, что здесь стоят обычные производные) поправка равна h, умноженной на скорость изменения V по отношению к x; и т. д.:
Для экономии места я обозначил через V производную F по х. Слагаемое с h2 и все, стоящие за ним, попадают в категорию «второй и высшие порядки». И о них больше нечего беспокоиться. Объединим все, что осталось:
Если мы теперь внимательно взглянем на это, то увидим, что два первых написанных здесь члена отвечают тому действию S, которое я написал бы для искомого истинного пути х. Я хочу сосредоточить ваше внимание на изменении S, т. е. на разности между S и тем S, которое получилось бы для истинного пути. Эту разность мы будем записывать как dS и назовем ее вариацией S. Отбрасывая «второй и высшие порядки», получаем для dS
Теперь задача выглядит так. Вот передо мной некоторый интеграл. Я не знаю еще, каково это х, но я твердо знаю, что, какую h я ни возьму, этот интеграл должен быть равен нулю. «Ну что ж,— подумаете вы,— единственная возможность для этого — это чтобы множитель при h был равен нулю». Но как быть с первым слагаемым, где есть dh/dt? Вы скажете: «Если h обращается в ничто, то и ее производная такое же ничто; значит, коэффициент при dh/dt должен тоже быть нулем». Ну это не совсем верно. Это не совсем верно потому, что между отклонением h и его производной имеется связь; они не полностью независимы, потому что h (t) должно быть нулем и при ttи при t2.
При решении всех задач вариационного исчисления всегда пользуются одним и тем же общим принципом. Вы чуть сдвигаете то, что хотите варьировать (подобно тому, как это сделали мы, добавляя h), бросаете взгляд на члены первого порядка, затем расставляете все так, чтобы получился интеграл в таком виде: «сдвиг (h), умноженный на что получится», но чтобы в нем не было никаких производных от h(никаких dh/dt). Непременно нужно так все преобразовать, чтобы осталось «нечто», умноженное на h. Сейчас вы поймете, отчего это так важно. (Существуют формулы, которые подскажут вам, как в некоторых случаях можно это проделать без каких-либо выкладок; но они не так уж общи, чтобы стоило заучивать их; лучше всего проделывать выкладки так, как это делаем мы.)
Как же я могу переделать член dh/dt, чтобы в нем появилось h? Я могу добиться этого, интегрируя по частям. Оказывается, что в вариационном исчислении весь фокус в том и состоит, чтобы расписать вариацию S и затем проинтегрировать по частям так, чтобы производные от h исчезли. Во всех задачах, в которых появляются производные, проделывается такой же фокус.
Припомните общий принцип интегрирования по частям. Если у вас есть произвольная функция f, умноженная на dh/dt и проинтегрированная по t, то вы расписываете производную от hf:
В интересующем вас интеграле стоит как раз последнее слагаемое, так что
В нашей формуле для dS за функцию f принимается произведение т на dx/dt; поэтому я получаю для dS выражение
В первый член должны быть подставлены пределы интегрирования t1и t2. Тогда я получу под интегралом член от интегрирования по частям и последний член, оставшийся при преобразовании неизменным.
А теперь происходит то, что бывает всегда,— проинтегрированная часть исчезает. (А если не исчезает, то нужно переформулировать принцип, добавив условия, обеспечивающие такое исчезновение!) Мы уже говорили, что hна концах пути должна быть равна нулю. Ведь в чем состоит наш принцип? В том, что действие минимально при условии, что варьируемая кривая начинается и кончается в избранных точках. Это значит, что h(t1)=0 и h(t2)=0. Поэтому проинтегрированный член получается равным нулю. Мы собираем воедино остальные члены и пишем
Вариация S теперь приобрела такой вид, какой мы хотели ей придать: что-то стоит в скобках (обозначим его F), и все это умножено на h(t)и проинтегрировано от t1до t2.
У нас вышло, что интеграл от какого-то выражения, умноженного на h(t), всегда равен нулю:
Стоит какая-то функция от t; умножаю ее на h(t) и интегрирую ее от начала до конца. И какова бы ни была h, я получаю нуль. Это означает, что функция F(t)равна нулю. В общем-то это очевидно, но я на всякий случай покажу вам один из способов доказательства.
Пусть в качестве h (t) я выберу нечто, что равно нулю всюду, при всех t, кроме одного, заранее выбранного значения t. Оно
остается нулем, пока я не
дойду до этого t,
затем оно подскакивает на мгновение и сразу же осаживает назад. Если вы берете интеграл от этой h, умноженной на какую-то функцию F, то единственное место, в котором вы получите что-то ненулевое,— это там, где h (t) подскакивало; и у вас получится значение F в этом месте на интеграл по скачку. Сам по себе интеграл по скачку не равен нулю, но после умножения на F он должен дать нуль. Значит, функция в том месте, где был скачок, должна оказаться нулем. Но ведь скачок можно было сделать в любом месте; значит, F должна быть нулем всюду.
Мы видим, что если наш интеграл равен нулю при какой угодно h, то коэффициент при hдолжен обратиться в нуль. Интеграл действия достигает минимума на том пути, который будет удовлетворять такому сложному дифференциальному уравнению:
На самом деле оно не так уж сложно; вы его уже встречали прежде. Это просто F=ma. Первый член — это масса, умноженная на ускорение; второй — это производная от потенциальной энергии, т. е. сила.
Итак, мы показали (по крайней мере для консервативной системы), что принцип наименьшего действия приводит к правильному ответу; он утверждает, что путь, "обладающий минимумом действия,— это путь, удовлетворяющий закону Ньютона.
Нужно сделать еще одно замечание. Я не доказал, что это минимум. Может быть, это максимум. На самом деле это и не обязательно должен быть минимум. Здесь все так же, как в «принципе кратчайшего времени», который мы обсуждали, изучая оптику. Там тоже мы сперва говорили о «кратчайшем» времени. Однако выяснилось, что бывают положения, в которых это время не обязательно «кратчайшее». Фундаментальный принцип заключается в том, чтобы для любых отклонений первого порядка от оптического пути изменения во времени были бы равны нулю; здесь та же самая история. Под «минимумом» мы на самом деде подразумеваем, что в первом порядке малости изменения величины S при отклонениях от пути должны быть равны нулю. И это не обязательно «минимум».
Теперь я хочу перейти к некоторым обобщениям. В первую очередь всю эту историю можно было бы проделать и в трех измерениях. Вместо простого x я тогда имел бы x, у и z как функции t, и действие выглядело бы посложнее. При трехмерном движении вы должны использовать полную кинетическую энергию: (m/2), умноженное на квадрат всей скорости. Иначе говоря
Кроме того, потенциальная энергия теперь является функцией x, у и z. А что можно сказать о пути? Путь есть некоторая кривая общего вида в пространстве; ее не так легко начертить, но идея остается прежней. А как обстоит дело с h? Что ж, и h имеет три компоненты. Путь можно сдвигать и по x, и по у, и по z, или во всех трех направлениях одновременно. Так что hтеперь вектор. От этого сильных усложнений не получается. Раз нулю должны быть равны лишь вариации первого порядка, то можно провести расчет последовательно с тремя сдвигами. Сперва можно сдвинуть h только в направлении xи сказать, что коэффициент должен обратиться в нуль. Получится одно уравнение. Потом мы сдвинем h в направлении у и получим второе. Затем сдвинем в направлении z и получим третье. Можно все, если угодно, проделать в другом порядке. Как бы то ни было, возникает тройка уравнений. Но ведь закон Ньютона — это тоже три уравнения в трех измерениях, по одному для каждой компоненты. Вам предоставляется самим убедиться, что это все действует и в трех измерениях (работы здесь не так много). Между прочим, можно взять какую угодно систему координат, полярную, любую, и сразу получить законы Ньютона применительно к этой системе, рассматривая, что получится, когда произойдет сдвиг h вдоль радиуса или по углу, и т. д.
Метод может быть обобщен и на произвольное число частиц. Если, скажем, у вас есть две частицы и между ними действуют какие-то силы и имеется взаимная потенциальная энергия, то вы просто складываете их кинетические энергии и вычитаете из суммы потенциальную энергию взаимодействия. А что вы варьируете? Пути обеих частиц. Тогда для двух частиц, движущихся в трех измерениях, возникает шесть уравнений. Вы можете варьировать положение частицы 1 в направлении x, в направлении у и в направлении z, и то же самое проделать с частицей 2, так что существует шесть уравнений. И так и должно быть. Три уравнения определяют ускорение частицы 1 через силу, действующую на нее, а три других — ускорение частицы 2 из-за силы, действующей на нее. Следуйте всегда тем же правилам игры, и вы получите закон Ньютона для произвольного числа частиц.
Я сказал, что мы получим закон Ньютона. Это не совсем верно, потому что в закон Ньютона входят и неконсервативные силы, например трение. Ньютон утверждал, что та равно всякой F. Принцип же наименьшего действия справедлив только для консервативных систем, таких, где все силы могут быть получены из потенциальной функции. Но ведь вы знаете, что на микроскопическом уровне, т. е. на самом глубинном физическом уровне, неконсервативных сил не существует. Неконсервативные силы (такие, как трение) появляются только от того, что мы пренебрегаем микроскопическими сложными эффектами: просто слишком много частиц приходится анализировать. Фундаментальные же законы могут быть выражены в виде принципа наименьшего действия.
Позвольте перейти к дальнейшим обобщениям. Положим, нас интересует, что будет, когда частица движется релятивистски. Пока мы не получили правильного релятивистского уравнения движения; F=ma верно только в нерелятивистских движениях. Встает вопрос: существует ли в релятивистском случае соответствующий принцип наименьшего действия? Да, существует. Формула в релятивистском случае такова:
Первая часть интеграла действия — это произведение массы покоя m0 на с2 и на интеграл от функции скорости Ц(1-v2/c2). Затем вместо того, чтобы вычитать потенциальную энергию, мы имеем интегралы от скалярного потенциала j и от векторного потенциала А, умноженного на v, Конечно, здесь приняты во внимание только электромагнитные силы. Все электрические и магнитные поля выражены в терминах j и А. Такая функция действия дает полную теорию релятивистского движения отдельной частицы в электромагнитном поле.
Конечно, вы должны понимать, что всюду, где я написал v, прежде чем делать выкладки, следует подставить dx/dt вместо vxи т. д. Кроме того, там, где я писал просто х, у, z, вы должны представить себе точки в момент t: x(t), y(t), z(t). Собственно, только после таких подстановок и замен v у вас получится формула для действия релятивистской частицы. Пусть самые умелые из вас попытаются доказать, что эта формула для действия действительно дает правильные уравнения движения теории относительности. Позвольте лишь посоветовать для начала отбросить А, т. е. обойтись пока без магнитных полей. Тогда вы должны будете получить компоненты уравнения движения dp/dt=-qСj, где, как вы, вероятно, помните, p=mv/Ц(l-v2/с2).
Включить в рассмотрение векторный потенциал А намного труднее. Вариации тогда становятся несравненно более сложными. Но в конце сила оказывается равной тому, чему следует: q(E+vXB). Но позабавьтесь с этим сами.
Мне хотелось бы подчеркнуть, что в общем случае (к примеру, в релятивистской формуле) под интегралом в действии уже не стоит разность кинетической и потенциальной энергий. Это годилось только в нерелятивистском приближении. Например, член m0c2Ц(1-v2/с2) — это не то, что называют кинетической энергией. Вопрос о том, каким должно быть действие для произвольного частного случая, может быть решен после некоторого числа проб и ошибок. Это задача того же типа, что и определение, каковы должны быть уравнения движения. Вы просто должны поиграть с известными вам уравнениями и посмотреть, можно ли их написать в виде принципа наименьшего действия.
Еще одно замечание по поводу терминологии. Ту функцию, которую интегрируют по времени, чтобы получить действие S, называют лагранжианом ж. Это функция, зависящая только от скоростей и положений частиц. Так что принцип наименьшего действия записывается также в виде
где под xiи viподразумеваются все компоненты координат и скоростей. Если вы когда-нибудь услышите, что кто-то говорит о «лагранжиане», знайте, что речь идет о функции, применяемой для получения S. Для релятивистского движения в электромагнитном поле
Кроме того, я должен отметить, что самые дотошные и педантичные люди не называют S действием. Его именуют «первой главной функцией Гамильтона». Но читать лекцию о «принципе наименьшей первой главной функции Гамильтона» было свыше моих сил. Я назвал это «действием». Да к тому же все больше и больше людей называют это «действием». Видите ли, исторически действием было названо нечто другое, не столь полезное для науки, но я думаю, что разумнее изменить определение. Теперь и вы начнете именовать новую функцию действием, а вскоре и все вообще станут называть ее этим простым именем.
Теперь я хочу сообщить вам по поводу нашей темы кое-что, похожее на те рассуждения, которые я вел по поводу принципа кратчайшего времени. Существует разница в самом существе закона, утверждающего, что некоторый интеграл, взятый от одной точки до другой, имеет минимум,— закона, который сообщает нам что-то обо всем пути сразу, и закона, который говорит, что когда вы двигаетесь, то, значит, есть сила, приводящая к ускорению. Второй подход докладывает вам о каждом вашем шаге, он прослеживает ваш путь пядь за пядью, а первый выдает сразу какое-то общее утверждение обо всем пройденном пути. Толкуя о свете, мы говорили о связи этих двух подходов. Теперь я хочу объяснить вам, отчего должны существовать дифференциальные законы, если имеется такой принцип — принцип наименьшего действия. Причина вот в чем: рассмотрим действительно пройденный в пространстве и времени путь. Как и прежде, обойдемся одним измерением, так что можно будет начертить график зависимости xот t. Вдоль истинного пути S достигает минимума. Положим, что у нас есть этот путь и что он проходит через некоторую точку а пространства и времени и через другую соседнюю точку b.
Теперь, если весь интеграл от t1 до t2 достиг минимума, необходимо, чтобы интеграл вдоль маленького участочка от а до b тоже был минимальным. Не может быть, чтобы часть от а до b хоть чуточку превосходила минимум. Иначе вы могли бы подвигать туда-сюда кривую на этом участочке и снизить немного значение всего интеграла.
Значит, любая часть пути тоже должна давать минимум. И это справедливо для каких угодно маленьких долек пути. Поэтому тот принцип, что весь путь должен давать минимум, можно сформулировать, сказав, что бесконечно малая долька пути — это тоже такая кривая, на которой действие минимально. И если мы возьмем достаточно короткий отрезок пути — между очень близкими друг к другу точками а и b,— то уже неважно, как меняется потенциал от точки к точке вдали от этого места, потому что, проходя весь ваш коротенький отрезочек, вы почти не сходите с места. Единственное, что вам нужно учитывать,— это изменение первого порядка малости в потенциале. Ответ может зависеть только от производной потенциала, а не от потенциала в других местах. Так, утверждение о свойстве всего пути в целом становится утверждением о том, что происходит на коротком участке пути, т. е. дифференциальным утверждением. И эта дифференциальная формулировка включает производные от потенциала, т. е. силу в данной точке. Таково качественное объяснение связи между законом в целом и дифференциальным законом.
Когда мы говорили о свете, то обсуждали также вопрос: как все-таки частица находит правильный путь? С дифференциальной точки зрения это понять легко. В каждый момент частица испытывает ускорение и знает только то, что ей положено делать в это мгновение. Но все ваши инстинкты причин и следствий встают на дыбы, когда вы слышите, что частица «решает», какой ей выбрать путь, стремясь к минимуму действия. Уж не «обнюхивает» ли она соседние пути, прикидывая, к чему они приведут — к большему или к меньшему действию? Когда мы на пути света ставили экран так, чтобы фотоны не могли перепробовать все пути, мы выяснили, что они не могут решить, каким путем идти, и получили явление дифракции.
Но верно ли это и для механики? Правда ли, что частица не просто «идет верным путем», а пересматривает все другие мыслимые траектории? И что если, ставя преграды на ее пути, мы не дадим ей заглядывать вперед, то мы получим некий аналог явления дифракции? Самое чудесное во всем этом — то, что все действительно обстоит так. Именно это утверждают законы квантовой механики. Так что наш принцип наименьшего действия сформулирован не полностью. Он состоит не в том, что частица избирает путь наименьшего действия, а в том, что она «чует» все соседние пути и выбирает тот, вдоль которого действие минимально, и способ этого выбора сходен с тем, каким свет отбирает кратчайшее время. Вы помните, что способ, каким свет отбирает кратчайшее время, таков: если свет пойдет по пути, требующему другого времени, то придет он с другой фазой. А полная амплитуда в некоторой точке есть сумма вкладов амплитуд для всех путей, по которым свет может ее достичь. Все те пути, у которых фазы резко различаются, ничего после сложения не дают. Но если вам удалось найти всю последовательность путей, фазы которых почти одинаковы, то мелкие вклады сложатся, и в точке прибытия полная амплитуда получит заметное значение. Важнейшим путем становится тот, возле которого имеется множество близких путей, дающих ту же фазу.
В точности то же происходит и в квантовой механике. Законченная квантовая механика (нерелятивистская и пренебрегающая спином электрона) работает так: вероятность того, что частица, выйдя из точки 1 в момент t1, достигнет точки 2 в момент t2, равна квадрату амплитуды вероятности. Полная амплитуда может быть записана в виде суммы амплитуд для всех возможных путей — для любого пути прибытия. Для любого x(t), которое могло бы возникнуть для любой мыслимой воображаемой траектории, нужно подсчитать амплитуду. Затем их все нужно сложить. Что же мы примем за амплитуду вероятности некоторого пути? Наш интеграл действия говорит нам, какой обязана быть амплитуда отдельного пути. Амплитуда пропорциональна eiS/h, где S — действие на этом пути. Это значит, что если мы представим фазу амплитуды в виде комплексного числа, то фазовый угол будет равен S/h,. Действие S имеет размерность энергии на время, и у постоянной Планка размерность такая же. Это постоянная, которая определяет, когда нужна квантовая механика.
И вот как все это срабатывает. Пусть для всех путей действие S будет весьма большим по сравнению с числом h. Пусть какой-то путь привел к некоторой величине амплитуды. Фаза рядом проложенного пути окажется совершенно другой, потому что при огромном S даже незначительные изменения S резко меняют фазу (ведь hчрезвычайно мало). Значит, рядом лежащие пути при сложении обычно гасят свои вклады. И только в одной области это не так — в той, где и путь и его сосед— оба в первом приближении обладают одной и той же фазой (или, точнее, почти одним и тем же действием, меняющимся в пределах h). Только такие пути и принимаются в расчет. А в предельном случае, когда постоянная Планка hстремится к нулю, правильные квантовомеханические законы можно подытожить, сказав: «Забудьте обо всех этих амплитудах вероятностей. Частица и впрямь движется по особому пути — именно по тому, по которому S в первом приближении не меняется». Такова связь между принципом наименьшего действия и квантовой механикой. То обстоятельство, что таким способом можно сформулировать квантовую механику, было открыто в 1942 г. учеником того же самого учителя, мистера Бадера, о котором я вам рассказывал. [Первоначально квантовая механика была сформулирована при помощи дифференциального уравнения для амплитуды (Шредингер), а также при помощи некоторой матричной математики (Гейзенберг).]
Теперь я хочу потолковать о других принципах минимума в физике. Есть очень много интересных принципов такого рода. Я не буду их все перечислять, а назову еще только один. Позже, когда мы доберемся до одного физического явления, для которого существует превосходный принцип минимума, я расскажу вам о нем. А сейчас я хочу показать, что необязательно описывать электростатику при помощи дифференциального уравнения для поля; можно вместо этого потребовать, чтобы некоторый интеграл обладал максимумом или минимумом. Для начала возьмем случай, когда плотность зарядов известна повсюду, а нужно найти потенциал j в любой точке пространства. Вы уже знаете, что ответ должен быть такой:
Другой способ утверждать то же самое заключается в следующем: надо вычислить интеграл U*
это объемный интеграл. Он берется по всему пространству. При правильном распределении потенциала j(x, у, z) это выражение достигает минимума.
Мы можем показать, что оба эти утверждения относительно электростатики эквивалентны. Предположим, что мы выбрали произвольную функцию j. Мы хотим показать, что когда в качестве j мы возьмем правильное значение потенциала j плюс малое отклонение f, то в первом порядке малости изменение в U* будет равно нулю. Так что мы пишем
здесь j — это то, что мы ищем; но мы проварьируем j, чтобы увидеть, каким он должен быть для того, чтобы вариация U* оказалась первого порядка малости. В первом члене U* нам нужно написать
Единственный член первого порядка, который будет меняться, таков:
Во втором члене U* подынтегральное выражение примет вид
изменяющаяся часть здесь равна rf. Оставляя только меняющиеся члены, получим интеграл
Дальше, руководствуясь нашим старым общим правилом, мы должны очистить интеграл от всех производных по f. Посмотрим, что это за производные. Скалярное произведение равно
Это нужно проинтегрировать по x, у и по z. И здесь напрашивается тот же фокус: чтобы избавиться от df/dx, мы проинтегрируем по х по частям. Это приведет к добавочному дифференцированию j по х. Это та же основная идея, с помощью которой мы избавились от производных по t. Мы пользуемся равенством
Другой способ утверждать то же самое заключается в следующем: надо вычислить интеграл U*
это объемный интеграл. Он берется по всему пространству. При правильном распределении потенциала j(x, у, z) это выражение достигает минимума.
Мы можем показать, что оба эти утверждения относительно электростатики эквивалентны. Предположим, что мы выбрали произвольную функцию j. Мы хотим показать, что когда в качестве j мы возьмем правильное значение потенциала j плюс малое отклонение f, то в первом порядке малости изменение в U* будет равно нулю. Так что мы пишем
здесь j — это то, что мы ищем; но мы проварьируем j, чтобы увидеть, каким он должен быть для того, чтобы вариация U* оказалась первого порядка малости. В первом члене U* нам нужно написать
Единственный член первого порядка, который будет меняться, таков:
Во втором члене U* подынтегральное выражение примет вид
изменяющаяся часть здесь равна rf. Оставляя только меняющиеся члены, получим интеграл
Дальше, руководствуясь нашим старым общим правилом, мы должны очистить интеграл от всех производных по f. Посмотрим, что это за производные. Скалярное произведение равно
Это нужно проинтегрировать по x, у и по z. И здесь напрашивается тот же фокус: чтобы избавиться от df/dx, мы проинтегрируем по xпо частям. Это приведет к добавочному дифференцированию j по x. Это та же основная идея, с помощью которой мы избавились от производных по t. Мы пользуемся равенством
Проинтегрированный член равен нулю, так как мы считаем f равным нулю на бесконечности. (Это отвечает обращению h в нуль при t1и t2. Так что наш принцип более точно формулируется следующим образом: U* для правильного j меньше, чем для любого другого
j(х, у, z), обладающего теми же значениями на бесконечности.) Затем мы проделаем то же с у и с z. Наш интеграл DU* обратится в
Чтобы эта вариация была равна нулю при любом произвольном f, коэффициент при f должен быть равен нулю. Значит,
Мы вернулись к нашему старому уравнению. Значит, наше «минимальное» предложение верно. Его можно обобщить, если слегка изменить выкладки. Вернемся назад и проинтегрируем по частям, не расписывая все покомпонентно. Начнем с того, что напишем следующее равенство:
Продифференцировав левую часть, я могу показать, что она в точности равна правой. Это уравнение подходит для того, чтобы провести интегрирование но частям. В нашем интеграле DU* мы заменяем Сj·Сf на —fС2j+С·(fС j) и затем интегрируем это по объему. Член с дивергенцией после интегрирования по объему заменяется интегралом по поверхности:
А поскольку мы интегрируем по всему пространству, то поверхность в этом интеграле лежит на бесконечности. Значит, f=0, и мы получаем прежний результат.
Только теперь мы начинаем понимать, как решать задачи, в которых мы не знаем, где расположены все заряды. Пусть мы имеем проводники, на которых как-то распределены заряды. Если потенциалы на всех проводниках зафиксированы, то наш принцип минимума все еще разрешается применять. Интегрирование в U* мы проведем только по области, лежащей снаружи всех проводников. Но раз мы не можем на проводниках менять j, то на их поверхности f=0, и поверхностный интеграл
тоже равен нулю. Остающееся объемное интегрирование нужно проделывать только в промежутках между проводниками.
И мы, конечно, снова получаем уравнение Пуассона
Мы, стало быть, показали, что наш первоначальный интеграл U* достигает минимума и тогда, когда он вычисляется в пространстве между проводниками, каждый из которых находится при фиксированном потенциале [это значит, что каждая пробная функция j(х, у, z) должна равняться заданному потенциалу проводника, когда (х, у, z) — точки поверхности проводника]. Существует интересный частный случай, когда заряды расположены только на проводниках. Тогда
и наш принцип минимума говорит нам, что в случае, когда у каждого проводника есть свой заранее заданный потенциал, потенциалы в промежутках между ними пригоняются так, что интеграл U* оказывается как можно меньше. А что это за интеграл? Член Сj — это электрическое поле. Значит, интеграл — это электростатическая энергия. Правильное поле и есть то единственное, которое из всех полей, получаемых как градиент потенциала, отличается наименьшей полной энергией.
Я хотел бы воспользоваться этим результатом, чтобы решить какую-нибудь частную задачу и показать вам, что все эти вещи имеют реальное практическое значение. Предположим, что я взял два проводника в форме цилиндрического конденсатора.
У внутреннего проводника потенциал равен, скажем, V, а у внешнего— нулю. Пусть радиус внутреннего проводника будет равен а, а внешнего — b. Теперь мы можем предположить, что распределение потенциалов между ними — любое.
Но если мы возьмем правильное значение j и вычислим
, то должна получиться энергия системы 1/2CV2.
Так что с помощью нашего принципа можно подсчитать и емкость С. Если же мы возьмем неправильное распределение потенциала и попытаемся этим методом прикинуть емкость конденсатора, то придем к чересчур большому значению емкости при фиксированном V. Любой предполагаемый потенциал j, не точно совпадающий с истинным его значением, приведет и к неверной величине С, большей, чем нужно. Но если неверно выбранный потенциал j является еще грубым приближением, то емкость С получится уже с хорошей точностью, потому что погрешность в С — величина второго порядка по сравнению с погрешностью в j.
Предположим, что мне неизвестна емкость цилиндрического конденсатора. Тогда, чтобы узнать ее, я могу воспользоваться этим принципом. Я просто буду испытывать в качестве потенциала разные функции j до тех пор, пока не добьюсь наинизшего значения С. Допустим, к примеру, что я выбрал потенциал, отвечающий постоянному полю. (Вы, конечно, знаете, что на самом деле поле здесь не постоянно; оно меняется как 1/r.) Если поле постоянно, то это означает, что потенциал линейно зависит от расстояния. Чтобы напряжение на проводниках было каким нужно, функция j должна иметь вид
Эта функция равна V при r=а, нулю при r=b, а между ними имеется постоянный наклон, равный —V/(b-а). Значит, чтобы определить интеграл U*, надо только помножить квадрат этого градиента на e0/2 и проинтегрировать по всему объему. Проведем этот расчет для цилиндра единичной длины. Элемент объема при радиусе r равен 2prdr. Проводя интегрирование, я нахожу, что моя первая проба дает такую емкость:
Интеграл здесь просто равен
Так я получаю формулу для емкости, которая хотя и неправильна, но является каким-то приближением:
Конечно, она отличается от правильного ответа C=2pe0/ln(b/a), но в общем-то, она не так уж плоха. Давайте попробуем сравнить ее с правильным ответом для нескольких значений b/а. Вычисленные мною числа приведены в следующей таблице
Даже когда b/a=2 (а это приводит уже к довольно большим отличиям между постоянным и линейным полем), я все еще получаю довольно сносное приближение. Ответ, конечно, как и ожидалось, чуть завышен. Но если тонкую проволочку поместить внутри большого цилиндра, то все выглядит уже гораздо хуже. Тогда поле изменяется очень сильно и замена его постоянным полем ни к чему хорошему не приводит. При b/а=100мы завышаем ответ почти вдвое. Для малых b/а положение выглядит намного лучше. В противоположном пределе, когда промежуток между проводниками не очень широк (скажем, при b/а=1,1), постоянное поле оказывается весьма хорошим приближением, оно дает значение С с точностью до десятых процента.
А теперь я расскажу вам, как усовершенствовать этот расчет. (Ответ для цилиндра вам, разумеется, известен, но тот же способ годится и для некоторых других необычных форм конденсаторов, для которых правильный ответ вам может быть и не известен.) Следующим шагом будет подыскание лучшего приближения для неизвестного нам истинного потенциала j. Скажем, можно испытать константу плюс экспоненту j и т. д. Но как вы узнаете, что у вас получилось лучшее приближение, если вы не знаете истинного j? Ответ: Подсчитайте С; чем оно ниже, тем к истине ближе. Давайте проверим эту идею. Пусть потенциал будет не линейным, а, скажем, квадратичным по r, а электрическое поле не постоянным, а линейным. Самая общая квадратичная
форма, которая обращается в j =0 при r=b и в j =V при r=а, такова:
где a — постоянное число. Эта формула чуть сложнее прежней. В нее входит и квадратичный член, и линейный. Из нее очень легко получить поле. Оно равно просто
Теперь это нужно возвести в квадрат и проинтегрировать по объему. Но погодите минутку. Что же мне принять за a? За j я могу принять параболу, но какую? Вот что я сделаю: подсчитаю емкость при произвольном a. Я получу
Это выглядит малость запутанно, но так уж выходит после интегрирования квадрата поля. Теперь я могу выбирать себе а. Я знаю, что истина лежит ниже, чем все, что я собираюсь вычислить. Что бы я ни поставил вместо a, ответ все равно получится слишком большим. Но если я продолжу свою игру с а и постараюсь добиться наинизшего возможного значения С, то это наинизшее значение будет ближе к правде, чем любое другое значение. Следовательно, мне теперь надо подобрать а так, чтобы значение С достигло своего минимума. Обращаясь к обычному дифференциальному исчислению, я убеждаюсь, что минимум С будет тогда, когда a=-2b/(b+а). Подставляя это значение в формулу, я получаю для наименьшей емкости
Я прикинул, что дает эта формула для С при различных значениях b/а. Эти числа я назвал С (квадратичные). Привожу таблицу, в которой сравниваются С (квадратичные) с С (истинными).
Например, когда отношение радиусов равно 2:1, я получаю 1,444. Это очень хорошее приближение к правильному ответу, 1,4423. Даже при больших b/а приближение остается довольно хорошим — оно намного лучше первого приближения. Оно остается сносным (завышение только на 10%) даже при b/а=10:1. Большое расхождение наступает только при отношении 100:1. Я получаю С равным 0,346 вместо 0,267. С другой стороны, для отношения радиусов 1,5 совпадение превосходное, а при b/a=1,1 ответ получается 10,492065 вместо положенного 10,492070. Там, где следует ожидать хорошего ответа, он оказывается очень и очень хорошим.
Я привел все эти примеры, во-первых, чтобы продемонстрировать теоретическую ценность принципа минимального действия и вообще всяких принципов минимума, и, во-вторых, чтобы показать вам их практическую полезность, а вовсе не для того, чтобы подсчитать емкость, которую мы и так великолепно знаем. Для любой другой формы вы можете испробовать приближенное поле с несколькими неизвестными параметрами (наподобие а) и подогнать их под минимум. Вы получите превосходные численные результаты в задачах, которые другим способом не решаются.
Добавление, сделанное после лекции