最小作用量原理

维基百科,自由的百科全书
跳转至: 导航搜索

物理學裏,最小作用量原理英语least action principle),或更精確地,平穩作用量原理英语stationary action principle),是一種變分原理,當應用於一個機械系統作用量時,可以得到此機械系統的運動方程式。這原理的研究引導出經典力學拉格朗日表述哈密頓表述的發展。卡爾·雅可比特稱最小作用量原理為分析力學之母[1]

在現代物理學裏,這原理非常重要,在相對論量子力學量子場論裏,都有廣泛的用途。在現代數學裏,這原理是莫爾斯理論的研究焦點。本篇文章主要是在闡述最小作用量原理的歷史發展。關於數學描述、推導和實用方法,請參閱條目作用量。最小作用量原理有很多種例子,主要的例子是莫佩爾蒂原理Maupertuis' principle)和哈密頓原理

在最小作用量原理之前,有很多類似的點子出現於測量學光學古埃及拉繩測量者rope stretcher)在測量兩點之間的距離時,會將固定於這兩點的繩索拉緊,這樣,可以使間隔距離減少至最低值[2]托勒密在他的著作《地理學指南》(Geographia)第一册第二章裏強調,測量者必須對於直線路線的誤差做出適當的修正。古希臘數學家歐幾里得在《反射光學》(Catoptrica)裏表明,將光線照射於鏡子,則光線的反射路徑的入射角等於反射角。稍後,亞歷山卓的希羅證明這路徑的長度是最短的[3]

費馬的表述[编辑]

光線從點Q傳播至點O時,會被半圓形鏡子反射,最終抵達點P。
光線從點Q傳播至點O時,會被混合形狀鏡子反射,最終抵達點P。
光線從點Q傳播至點O時,會被半圓形或混合形鏡子反射,最終抵達點P。

1662年,皮埃爾·德·費馬提出費馬原理,又稱為「最短時間原理」:光線移動的路徑是需時最少的路徑[4]

費馬原理更正確的版本應是「平穩時間原理」。對於某些狀況,光線移動的路徑所需的時間可能不是最小值,而是最大值,或甚至是拐值。例如,對於平面鏡,任意兩點的反射路徑光程是最小值;對於半橢圓形鏡子,其兩個焦點的光線反射路徑不是唯一的,光程都一樣,是最大值,也是最小值;對於半圓形鏡子,其兩個端點Q、P的反射路徑光程是最大值;又如最右圖所示,對於由四分之一圓形鏡與平面鏡組合而成的鏡子,同樣這兩個點Q、P的反射路徑的光程是拐值。[5]

假設,介質1、介質2的折射率分別為 n_1n_2 ,光線從介質1在點O移動進入介質2,則司乃耳定律以方程式表達為

n_1\sin\theta_1=n_2\sin\theta_2

其中,\theta_1 為入射角,\theta_2 為折射角。

光線從介質1的點Q,在點O移動進入介質2,發生折射,最後抵達介質2的點P。

從費馬原理,可以推導出司乃耳定律。通過設定光程對於時間的導數為零,可以找到「平穩路徑」,這就是光線移動的路徑。光線在介質1與介質2的速度分別為

v_1=c/n_1
v_2=c/n_2

其中,c真空光速。

由於介質會減緩光線的速度,折射率 n_1n_2 都大於 1

如右圖所示,從點Q到點P的移動時間 T

T=\frac{\sqrt{x^2 + a^2}}{v_1} + \frac{\sqrt{b^2 + (l - x)^2}}{v_2}

根據費馬原理,光線移動的路徑是所需時間為極值的路徑,取移動時間 T 對變數 x 的導數,設定其為零:

\frac{dT}{dx}=\frac{x}{v_1\sqrt{x^2 + a^2}} + \frac{ - (l - x)}{v_2\sqrt{(l-x)^2 + b^2}}=0

由圖中的邊角關係,可以得到移動速度與折射角的關係式:

\frac{dT}{dx}=\frac{\sin\theta_1}{v_1} - \frac{\sin\theta_2}{v_2}=0

將移動速度與折射率的關係式代入,就會得到司乃耳定律:

n_1\sin\theta_1=n_2\sin\theta_2

費馬原理引發了極大的爭議。假若介質的密度越小,光線的移動速度越快,則費馬原理是正確的;但是,艾薩克·牛頓勒內·笛卡兒都認為介質的密度越大,光線的移動速度就越快。1802年,托馬斯·楊做實驗發現,當光波從較低密度介質移動進入較高密度介质之後,光波的波長會變短,他因此推論光波的運動速度會降低。[5]

莫佩爾蒂的表述[编辑]

最小作用量原理應用於作用量的最初始表述,時常歸功於皮埃爾·莫佩爾蒂。於1744年和1746年,他寫出一些關於這方面的論文[6][7]。但是,史學專家指出,這優先聲明並不明確。萊昂哈德·歐拉在他的1744年論文裏就已談到這原理[8]。還有一些考據顯示出,在1705年,戈特弗里德·萊布尼茨就已經發現這原理了[9]

莫佩爾蒂發表的最小作用量原理闡明,對於所有的自然現象,作用量趨向於最小值。他定義一個運動中的物體的作用量為 A ,物體質量 m 、移動速度 v 與移動距離 s 的乘積[4]

A=mvs

莫佩爾蒂又從宇宙論的觀點來論述,最小作用量好像是一種經濟原理。在經濟學裏,大概就是精省資源的意思。這論述的瑕疵是,並沒有任何理由,能夠解釋,為什麼作用量趨向最小值,而不是最大值。假若,我們解釋最小作用量為大自然的精省資源,那麼,我們又怎樣解釋最大作用量呢?

折射理論[编辑]

於1744年,在巴黎科學院發表的一篇論文《幾種以前互不相容的自然定律的合一論》(Accord de plusieurs lois naturelles qui avaient paru jusqu'ici incompatibles)中,莫佩爾蒂提出,光折射的路徑,從一種介質到另一種介質,是作用量的最小值。按照這論點,如前圖,假設光線從折射率n_1 的介質1折射於折射率為 n_2 介質2,則作用量為

A=m\left( v_1 \sqrt{x^2 + a^2}+v_2\sqrt{b^2 + (l-x)^2}\right)

其中,m 是光線的質量。雖然光線並沒有質量,這變量對於結果沒有任何影響,可以被忽略。

取作用量對於變數 x 的導數,設定為零,經過一些運算,可以得到

v_1\sin\theta_1=v_2\sin\theta_2

請注意,這結果與牛頓的光粒子理論相符合;但是,與費馬得到的結果南轅北轍,大不相同。

非彈性碰撞[编辑]

1747年,莫佩爾蒂在伯林科學院Academy of Berlin)發表了論文《運動與靜止定律》(Loix du mouvement et du repos)。在這篇論文裏,他將碰撞分為兩種,彈性碰撞非彈性碰撞。彈性碰撞遵守動量守恆能量守恆;非彈性碰撞只遵守動量守恆。莫佩爾蒂可以將最小作用量原理應用於彈性碰撞與非彈性碰撞,正確地計算出碰撞後的物體的速度。

思考一個一維非彈性碰撞,假設兩個質量分別為 m_1m_2 的物體O1和物體O2,分別以初始速度 v_1v_2 朝著同一方向移動,而且,v_1>v_2 ,物體O1緊追著物體O2。當兩物體發生非彈性碰撞後,結合成為物體O3,以終結速度 v_3 移動。從固定於物體O3的參考系觀察,物體O1和物體O2的速度分別為 v_1 - v_3v_2 - v_3 。所以,作用量為

A=m_1 (v_1 - v_3)^2 t+m_2 (v_2 - v_3)^2 t

其中,t 是時間。

取作用量對於變數 v_3 的導數,設定為零,經過一些運算,可以得到

m_1 (v_1 - v_3)+m_2 (v_2 - v_3)=0

所以,最終速度為

v_3=\frac{m_1 v_1+m_2 v_2}{m_1+m_2}

請注意,按照這種設定參考系的方法,前面折射問題的光折射作用量應該是

A=m (v_1 - v_2) \sqrt{x^2 + a^2}

還有,前面光折射作用量的距離參數是任意值,但是,非彈性碰撞作用量的碰撞前距離參數與碰撞後距離參數被設定為相等。

由於這些不一致之處,促使恩斯特·馬赫嚴厲批評,莫佩爾蒂的最小作用量原理只是一個模糊不清的概念,勉強地被用來解釋各種不同的物理現象[10]

歐拉的表述[编辑]

1744年,萊昂哈德·歐拉在論文《尋找具有極大值或極小值性質的曲線,等周問題的最廣義解答》(Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimetrici lattissimo sensu accepti)裏,以非常清楚的字句,給出最小作用量原理的定義[11]

設定一個質量為 M ,速度為 v 的粒子移動無窮小距離 ds 。這粒子的動量為 M v ,當乘以無窮小距離 \mathrm{d}s 時,會給出 M v \,\mathrm{d}s ,粒子的動量積分於無窮小距離 \mathrm{d}s 。現在,我宣明,這移動粒子的真實軌道(在所有連結兩個端點的可能軌道之中)是 \int M v \mathrm{d}s 為最小值的軌道,或者,假定質量是個常數,是 \int  v \,\mathrm{d}s 為最小值的軌道。

如同歐拉所寫,\int Mv\,\mathrm{d}s 是動量積分於移動路徑。採用現代術語,這積分等於簡略作用量 \int \mathbf{p}\cdot\,\mathrm{d}\mathbf{q} ;其中, \mathbf{p}廣義動量\mathbf{q}廣義坐標。因此,在同一年,稍微比莫佩爾蒂晚一點,歐拉獨立地發表了,與莫佩爾蒂的理論等同的,關於變分原理的理論。歐拉並沒有爭奪優先榮譽。

直線運動[编辑]

假設沒有任何作用力施加於這粒子,則這粒子以均勻速度移動:

A=\int Mv\,\mathrm{d}s=Mvs

只有在軌道長度 s 為最小值時,才能得到作用量最小值。這軌道是一條直線。

拋物線運動[编辑]

假設這移動於二維空間的粒子感受到均勻重力 \mathbf{F}=Mg\hat{\mathbf{y}} ,則根據活力定律principle of vis viva),

\frac{1}{2}Mv^2=\frac{1}{2}Mv_0^2+Mgy

其中,v 是瞬時速度,v_0 是最初速度,y 是粒子朝著y-軸移動的距離,g 是加速度常數。

將這方程式代入作用量:

A=\int Mv\,\mathrm{d}s=\int M\sqrt{v_0^2+2gy}\,\mathrm{d}s
=\int M\sqrt{v_0^2+2gy}\,\sqrt{1+\left(\frac{dx}{dy}\right)^2}\ dy

\delta A=0 ,求作用量的穩定值,應用變分法,可以得到歐拉-拉格朗日方程式

\cfrac{\sqrt{v_0^2+2gy}\left(\frac{dx}{dy}\right)}{\sqrt{1+\left(\frac{dx}{dy}\right)^2}}=k_1

其中,k_1 是積分常數。

重新編排,可以得到

\frac{dx}{dy}=\cfrac{k_1}{\sqrt{v_0^2+2gy - k_1^2}}

將這方程式積分,

x=\frac{k_1}{g}\sqrt{v_0^2+2gy - k_1^2}+k_2

其中,k_2 是積分常數。

假設粒子的初始位置為 (0,0) ,初始速度為 (0,v_0) ,則

k_1=v_0
k_2=0
x=\sqrt{\frac{2v_0^2 y }{g}}

重新編排,可以看出這是拋物線方程式:

y=\frac{g}{2v_0^2}\ x^2

歐拉又將這結果推廣至一群粒子。他認為最小作用原理所以正確,是因為粒子的慣性試著阻抗任何關於狀態的改變,自由粒子會選擇遵循影響最小的作用力[4]

拉格朗日的表述[编辑]

約瑟夫·拉格朗日對於變分法貢獻良多。拉格朗日在論文《分析力學》(Mecanique Analytique)裏,從能量守恆定律理論推導出歐拉表述的最小作用量原理是正確的[4]。能量守恆定律以方程式表達為

E=T+V

其中,E 是總能量T動能V勢能

勢能的變分為

\delta V=\nabla V \cdot \delta\mathbf{r} ;

其中,\mathbf{r} 是粒子的位置,\delta\mathbf{r}虛位移

粒子感受到的作用力 \mathbf{F} 為勢能的負梯度。將牛頓第二定律帶入方程式,

\delta V= - \mathbf{F}\cdot \delta\mathbf{r}
= - M\ddot{\mathbf{r}} \cdot \delta\mathbf{r}
= - M\frac{\mathrm{d}}{\mathrm{d}t}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})+M\dot{\mathbf{r}} \cdot \frac{\mathrm{d}}{\mathrm{d}t}(\delta\mathbf{r})

微分運算可以和變分運算對易:

 \dot{\mathbf{r}} \cdot \frac{\mathrm{d}}{\mathrm{d}t}(\delta\mathbf{r})= \dot{\mathbf{r}} \cdot \delta\dot{\mathbf{r}}
=\mathbf{v} \cdot \delta\mathbf{v}=\frac{1}{2}\delta v^2

其中,\mathbf{v} 是粒子的速度。

所以,勢能的變分為

\delta V= - M\frac{\mathrm{d}}{\mathrm{d}t}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})+\frac{M}{2}\delta v^2

動能的變分為

\delta T=\frac{M}{2}\delta v^2

總能量的變分為:

\delta E=\delta T+\delta V=M\delta v^2 - M\frac{\mathrm{d}}{\mathrm{d}t}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})

總能量的積分的變分為

\delta\int E\ \mathrm{d}t 
=\int M\delta (v^2)\ \mathrm{d}t - \int M\frac{\mathrm{d}}{\mathrm{d}t}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})\ \mathrm{d}t
=\delta \int Mv^2\ \mathrm{d}t - M\int \mathrm{d}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})
=\delta \int Mv\ \mathrm{d}s - M\int \mathrm{d}(\dot{\mathbf{r}} \cdot \delta\mathbf{r})

其中,\mathrm{d}s 是路徑長度。

設定路徑的兩個端點為固定不變,能量也守恆不變,則粒子移動的路徑的作用量是穩定值:

\delta A=\delta \int Mv\ \mathrm{d}s=0

拉格朗日最小作用量原理[编辑]

推廣至位形空間,拉格朗日最小作用量原理闡明,

\delta A=\delta \int \sum_i p_i \mathrm{d}q_i=0

其中,p_i廣義動量q_i廣義坐標

歐拉-拉格朗日最小作用量原理[编辑]

拉格朗日又注意到在作用量的方程式 A=\int Mv\,\mathrm{d}s 中,

\mathrm{d}s=v\,\mathrm{d}t

將這方程式代入作用量,可以看見被積分項目是動能項目:

A=\int Mv^2\,\mathrm{d}t=\int 2T\,\mathrm{d}t

因此,作用量也可以表達為(忽略常數乘法因子)

A=\int_{t_i}^{t_f} 2T\,\mathrm{d}t

歐拉-拉格朗日最小作用量原理表明,描述粒子運動的作用量必定是穩定值[12]

\delta A=\delta \int_{t_i}^{t_f} 2T\,\mathrm{d}t=0

請特別注意,這方程式看起來簡易精緻,然而,隱藏在使用方面有很大的問題。歐拉的作用量積分於路徑;而這作用量積分於時間。變分法要求積分域兩端固定不變。雖然路徑兩端是固定值,轉換至時間,為了要滿足能量守恆,時間間隔的兩端可能不是固定值。亞可比因此批評拉格朗日的方法有瑕疵[12]。後來,於1816年,奧淩迪·若立格Olinde Rodrigues)想出新點子,將這時間作用量的變分詳細計算出來[1]

表觀目的論[编辑]

微分運動方程式數學等價於其對應的積分運動方程式,這具有很重要的哲學意義。微分方程式描述局部於空間的一點或單獨時間的片刻。舉例而言,牛頓第二定律 \mathbf{F}=m\mathbf{a} 解釋為瞬時作用力 \mathbf{F} 施加於質量為 m 的粒子會造成瞬時加速度為 \mathbf{a} 的運動。明顯對比地,作用量原理不會局部於一點,而牽涉到積分於一段時間間隔或一個空間的局域。更重要地,通常在經典作用量原理的表述裏,系統的初始狀態和終結狀態是固定不變的,也就是說,

設定一個移動粒子開始於位置 x_1 、時間 t_1 ,結束於位置 x_2 、時間 t_2 ,連接這兩個端點的物理軌道是作用量積分的平穩值。

特別地針對這程序,終結狀態的固定動作似乎額外地賦予了作用量原理一些目的論的特色。[來源請求]物理學史裏,這特色不經意地製造出很多激烈的爭論。

參閱[编辑]

參考文獻[编辑]

  1. ^ 1.0 1.1 Jourdain, Philip, The principle of least action, Open Court Publishing Company. 1913:  pp. 1, 54 
  2. ^ Wilson, Alistair Macintosh, The Infinite in the Finite, Oxford University Press. 1995:  38, ISBN 9780198539506 
  3. ^ Kline, Morris. Mathematical Thought from Ancient to Modern Times. New York: Oxford University Press. 1972: pp. 167–168. ISBN 0-19-501496-0. 
  4. ^ 4.0 4.1 4.2 4.3 Dugas, R., A History Of Mechanics, New York: Dover Publications, Inc.. 1988:  pp. 255ff, 274, 345-346, ISBN 0-486-65632-2 
  5. ^ 5.0 5.1 Hecht, Eugene, Optics. 4th, United States of America: Addison Wesley. 2002:  pp. 106-111, 141, ISBN 0-8053-8566-5 (英文) 
  6. ^ P.L.M. de Maupertuis, Accord de différentes lois de la nature qui avaient jusqu'ici paru incompatibles. (1744) Mém. As. Sc. Paris p. 417. (英文翻譯)
  7. ^ P.L.M. de Maupertuis, Le lois de mouvement et du repos, déduites d'un principe de métaphysique. (1746) Mém. Ac. Berlin, p. 267.(英文翻譯)
  8. ^ Euler, Leonhard, Methodus Inveniendi Lineas Curvas Maximi Minive Proprietate Gaudentes, Geneva: Bousquet, Lausanne &amp 
  9. ^ The MacTutor History of Mathematics 網頁:O'Connor, J. J.; Robertson, R. F., The Berlin Academy and forgery 
  10. ^ 馬赫, 恩斯特, The science of mechanics; a critical and historical account of its development, Watchmaker Publishing. 2010 [1919]:  pp. 364-368, 380, ISBN 978-1603863254 
  11. ^ Euler, Leonhard, Additamentum II (external link), ibid. (英文翻譯
  12. ^ 12.0 12.1 Lanczos, Cornelius, The Variational Principles of Mechanics, Dovers Publications, Inc. 1970:  pp. 132-138, ISBN 978-0-486-65067-8