梯度

維基百科,自由的百科全書
前往: 導覽搜尋
微積分學
\text{e} = \lim_{n\to\infty} \left(1+\frac{1}{n}\right)^n
函數 · 導數 · 微分 · 積分
上面兩個圖中,純量場是黑白的,黑色表示大的數值,而其相應的梯度用藍色箭頭表示。

向量微積分中,純量場梯度是一個向量場。純量場中某一點上的梯度指向純量場增長最快的方向,梯度的長度是這個最大的變化率。更嚴格的說,從歐幾里得空間RnR函數的梯度是在Rn某一點最佳的線性近似。在這個意義上,梯度是雅可比矩陣的一個特殊情況。

在單變數的實值函數的情況,梯度只是導數,或者,對於一個線性函數,也就是線的斜率

梯度一詞有時用於斜度,也就是一個曲面沿著給定方向的傾斜程度。可以通過取向量梯度和所研究的方向的點積來得到斜度。梯度的數值有時也被稱為梯度。

梯度的解釋[編輯]

假設有一個房間,房間內所有點的溫度由一個純量場\phi給出的,即點(x,y,z)的溫度是\phi(x,y,z)。假設溫度不隨時間改變。然後,在房間的每一點,該點的梯度將顯示變熱最快的方向。梯度的大小將表示在該方向上變熱的速度。

考慮一座高度在(x, y)點是H(x, y)的山。H這一點的梯度是在該點坡度(或者說斜度)最陡的方向。梯度的大小告訴我們坡度到底有多陡。

梯度也可以告訴我們一個數量在不是最快變化方向的其他方向的變化速度。再次考慮山坡的例子。可以有條直接上山的路其坡度是最大的,則其坡度是梯度的大小。也可以有一條和上坡方向成一個角度的路,例如投影在水平面上是60°角。則,若最陡的坡度是40%,這條路的坡度小一點,是20%,也就是40%乘以60°的餘弦。

這個現象可以如下數學的表示。山的高度函數H的梯度點積一個單位向量給出了表面在該向量的方向上的斜率。這稱為方向導數

形式化定義[編輯]

一個純量函數 \varphi 的梯度記為:

\nabla \varphi\operatorname{grad} \varphi

其中\nablanabla)表示向量微分算子

\nabla \varphi 在3D直角坐標中表示為

\nabla \varphi =\begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix}

參看偏導數向量

雖然使用坐標表達,但結果是在正交變換下不變,從幾何的觀點來看,這是應該的。

範例[編輯]

函數 \varphi=2x+3y^2-\sin(z) 的梯度為:

\nabla \varphi = \begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix} = 
\begin{pmatrix}
{2}, 
 {6y},
 {-\cos(z)}
\end{pmatrix}.

實純量函數的梯度[來源請求][編輯]

相對於n×1向量x的梯度算子記作\nabla_{\boldsymbol{x}}[來源請求],定義為

\nabla_{\boldsymbol{x}} \overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial }{\partial x_1}, \frac{\partial }{\partial x_2},\cdots,\frac{\partial }{\partial x_n} \right]^T=\frac{\partial }{\partial \boldsymbol{x}}[來源請求]

對向量的梯度[編輯]

以n×1實向量x為變元的實純量函數f(x)相對於x的梯度為一n×1列向量x,定義為

\nabla_{\boldsymbol{x}} f(\boldsymbol{x}) \overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial f(\boldsymbol{x}) }{\partial x_1}, \frac{\partial f(\boldsymbol{x})}{\partial x_2},\cdots,\frac{\partial f(\boldsymbol{x})}{\partial x_n} \right]^T=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}

m維行向量函數\boldsymbol{f}(\boldsymbol{x})=[f_1(\boldsymbol{x}),f_2(\boldsymbol{x}),\cdots,f_m(\boldsymbol{x})]相對於n維實向量x的梯度為一n×m矩陣,定義為

\nabla_{\boldsymbol{x}} \boldsymbol{f}(\boldsymbol{x}) \overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f_1(\boldsymbol{x})}{\partial x_1} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_1} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_1}      \\
\frac{\partial f_1(\boldsymbol{x})}{\partial x_2} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_2} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_2}      \\
\vdots &\vdots & \ddots & \vdots \\
\frac{\partial f_1(\boldsymbol{x})}{\partial x_n} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_n} & \cdots &\frac{\partial f_m(\boldsymbol{x})}{\partial x_n}     \\
\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{x})}{\partial \boldsymbol{x}}

對矩陣的梯度[編輯]

實純量函數\boldsymbol{f}(\boldsymbol{A})相對於m×n實矩陣A的梯度為一m×n矩陣,簡稱梯度矩陣,定義為

\nabla_{\boldsymbol{A}} \boldsymbol f(\boldsymbol{A}) \overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f(\boldsymbol{A})}{\partial a_{11}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{12}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{1n}}      \\
\frac{\partial f(\boldsymbol{A})}{\partial a_{21}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{22}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{2n}}      \\
\vdots &\vdots & \ddots & \vdots \\
\frac{\partial f(\boldsymbol{A})}{\partial a_{m1}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{m2}} & \cdots &\frac{\partial f(\boldsymbol{A})}{\partial a_{mn}}     \\
\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{A})}{\partial \boldsymbol{A}}

法則[編輯]

以下法則適用於實純量函數對向量的梯度以及對矩陣的梯度。

  • 線性法則:若f(\boldsymbol{A})g(\boldsymbol{A})分別是矩陣A的實純量函數,c1和c2為實常數,則
\frac{\partial [c_1 f(\boldsymbol{A})+c_2 g(\boldsymbol{A})]}{\partial \boldsymbol{A}}=c_1\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+c_2 \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 乘積法則:若f(\boldsymbol{A})g(\boldsymbol{A})h(\boldsymbol{A})分別是矩陣A的實純量函數,則
\frac{\partial f(\boldsymbol{A}) g(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
\frac{\partial f(\boldsymbol{A}) g(\boldsymbol{A}) h(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A}) h(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A}) h(\boldsymbol{A})\frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A}) g(\boldsymbol{A})\frac{\partial h(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 商法則:若g(\boldsymbol{A})\neq 0,則
\frac{\partial f(\boldsymbol{A})/ g(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{1}{g(\boldsymbol{A})^2} \left[ g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}-f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}} \right]
  • 鏈式法則:若A為m×n矩陣,且y=f(\boldsymbol{A})g(y)分別是以矩陣A和純量y為變元的實純量函數,則
\frac{\partial g(f(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{d g(y)}{dy} \frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}

流形上的梯度[編輯]

一個黎曼流形 M上的對於任意可微函數 f 的梯度 \nabla f 是一個向量場,使得對於每個向量 \xi

\langle \nabla f, \xi \rangle := \xi f

其中 \langle \cdot, \cdot \rangle 代表 M 上的內積(度量)而 \xi f(p), p\in Mf 在點 p, 方向為 \xi(p)方向導數。換句話說,如果 \varphi :U\subseteq M\mapsto \mathbb{R}^np 附近的局部座標 ,在此座標下有 \xi(x)=\sum_j a_j(x)\frac{\partial}{\partial x_{j} }, 則 \xi f (p) 將成為:

\xi(f \mid_{p}) := \sum_j a_j (\frac{\partial}{\partial x_{j} }(f \circ \varphi^{-1}) \mid_{\varphi(p)}).

函數的梯度和外微分相關,因為 \xi f = df(\xi),實際上內積容許我們可以用一種標準的方式將1-形式 df 和向量場 \nabla f 建立聯繫。由 \nabla f 的定義, df(\xi)=\langle \nabla f, \xi \rangle,這樣 f 的梯度可以"等同"於 0-形式的外微分 df,這裡"等同"意味著:兩集合 \{df \}\{\nabla f \} 之間有 1對1的滿射


由定義可算 流形\nabla f 的局部座標表達式為:

 \nabla f=\sum_{ik} g^{ik}\frac{\partial f}{\partial x^{k}}\frac{\partial}{\partial x^{i}}.

請注意這是流形上的公式,跟一般 \mathbb{R}^n 的公式不同。常常我們寫時會省略求和 \sum 符號,不過為了避免混淆,在這裡的公式還是加上去了。

柱坐標下的梯度(\nabla)算符[編輯]


   \nabla f(\rho,\theta,z) = \frac{\partial f}{\partial\rho} \mathbf{e}_{\rho}
                            + \frac1{\rho}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac{\partial f}{\partial z} \mathbf{e}_{z}

球坐標下的梯度(\nabla)算符[編輯]


   \nabla f(r,\theta,\phi) = \frac{\partial f}{\partial r} \mathbf{e}_{r}
                            + \frac1{r}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac1{r\sin \theta}\frac{\partial f}{\partial \phi} \mathbf{e}_{\phi}

其中\theta為極角,\phi方位角。

參考[編輯]

書籍[編輯]

  • (中文)張賢達. 矩陣分析與應用. 清華大學出版社. 2004.9. ISBN 9787302092711. 

參看[編輯]