本页使用了标题或全文手工转换

梯度

维基百科,自由的百科全书
跳转至: 导航搜索
微积分学
\int_M \mathrm{d}\omega = \oint_{\partial M} \omega
函数 · 导数 · 微分 · 积分
上面两个图中,标量场是黑白的,黑色表示大的数值,而其相应的梯度用藍色箭头表示。

向量微积分中,标量场梯度是一个向量场。标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。更严格的说,从欧几里得空间RnR函数的梯度是在Rn某一点最佳的线性近似。在这个意义上,梯度是雅可比矩阵的一个特殊情况。

在单变量的实值函数的情况,梯度只是导数,或者,对于一个线性函数,也就是线的斜率

梯度一词有时用于斜度,也就是一个曲面沿着给定方向的倾斜程度。可以通过取向量梯度和所研究的方向的点积来得到斜度。梯度的数值有时也被称为梯度。

梯度的解释[编辑]

假設有一个房间,房间内所有点的温度由一个标量场\phi给出的,即点(x,y,z)的温度是\phi(x,y,z)。假设温度不随时间改变。然后,在房间的每一点,该点的梯度将显示变热最快的方向。梯度的大小将表示在该方向上变热的速度。

考虑一座高度在(x, y)点是H(x, y)的山。H这一点的梯度是在该点坡度(或者说斜度)最陡的方向。梯度的大小告诉我们坡度到底有多陡。

梯度也可以告诉我们一个数量在不是最快变化方向的其他方向的变化速度。再次考虑山坡的例子。可以有条直接上山的路其坡度是最大的,则其坡度是梯度的大小。也可以有一条和上坡方向成一个角度的路,例如投影在水平面上是60°角。则,若最陡的坡度是40%,这条路的坡度小一点,是20%,也就是40%乘以60°的余弦。

这个现象可以如下数学的表示。山的高度函数H的梯度点积一个单位向量给出了表面在该向量的方向上的斜率。这称为方向導數

形式化定义[编辑]

一个标量函数\varphi的梯度记为:

\nabla \varphi\operatorname{grad} \varphi

其中\nablanabla)表示向量微分算子

\nabla \varphi在三维直角坐标中表示为

\nabla \varphi =\begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix}

参看偏导数向量

虽然使用坐标表达,但结果是在正交变换下不变,从几何的观点来看,这是应该的。

范例[编辑]

函数\varphi=2x+3y^2-\sin (z)的梯度为:

\nabla \varphi = \begin{pmatrix}
{\frac{\partial \varphi}{\partial x}},  
{\frac{\partial \varphi}{\partial y}}, 
{\frac{\partial \varphi}{\partial z}}
\end{pmatrix} =
\begin{pmatrix}
{2}, 
 {6y},
 {-\cos (z)}
\end{pmatrix}

实标量函数的梯度[來源請求][编辑]

相对于n×1向量x的梯度算子记作\nabla_{\boldsymbol{x}}[來源請求],定义为

\nabla_{\boldsymbol{x}} \overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial }{\partial x_1}, \frac{\partial }{\partial x_2},\cdots,\frac{\partial }{\partial x_n} \right]^T=\frac{\partial }{\partial \boldsymbol{x}}[來源請求]

对向量的梯度[编辑]

以n×1实向量x为变元的实标量函数f(x)相对于x的梯度为一n×1列向量x,定义为

\nabla_{\boldsymbol{x}} f(\boldsymbol{x})\overset{\underset{\mathrm{def}}{}}{=} \left[ \frac{\partial f(\boldsymbol{x})}{\partial x_1}, \frac{\partial f(\boldsymbol{x})}{\partial x_2},\cdots,\frac{\partial f(\boldsymbol{x})}{\partial x_n} \right]^T=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}

m维行向量函数\boldsymbol{f}(\boldsymbol{x})=[f_1(\boldsymbol{x}),f_2(\boldsymbol{x}),\cdots,f_m(\boldsymbol{x})]相对于n维实向量x的梯度为一n×m矩阵,定义为

\nabla_{\boldsymbol{x}} \boldsymbol{f}(\boldsymbol{x})\overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f_1(\boldsymbol{x})}{\partial x_1} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_1} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_1}      \\
\frac{\partial f_1(\boldsymbol{x})}{\partial x_2} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_2} & \cdots & \frac{\partial f_m(\boldsymbol{x})}{\partial x_2}      \\
\vdots &\vdots & \ddots & \vdots \\
\frac{\partial f_1(\boldsymbol{x})}{\partial x_n} &\frac{\partial f_2(\boldsymbol{x})}{\partial x_n} & \cdots &\frac{\partial f_m(\boldsymbol{x})}{\partial x_n}     \\
\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{x})}{\partial \boldsymbol{x}}

对矩阵的梯度[编辑]

实标量函数\boldsymbol{f}(\boldsymbol{A})相对于m×n实矩阵A的梯度为一m×n矩阵,简称梯度矩阵,定义为

\nabla_{\boldsymbol{A}} \boldsymbol f(\boldsymbol{A})\overset{\underset{\mathrm{def}}{}}{=}
\begin{bmatrix}
\frac{\partial f(\boldsymbol{A})}{\partial a_{11}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{12}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{1n}}      \\
\frac{\partial f(\boldsymbol{A})}{\partial a_{21}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{22}} & \cdots & \frac{\partial f(\boldsymbol{A})}{\partial a_{2n}}      \\
\vdots &\vdots & \ddots & \vdots \\
\frac{\partial f(\boldsymbol{A})}{\partial a_{m1}} &\frac{\partial f(\boldsymbol{A})}{\partial a_{m2}} & \cdots &\frac{\partial f(\boldsymbol{A})}{\partial a_{mn}}     \\
\end{bmatrix}=\frac{\partial \boldsymbol{f}(\boldsymbol{A})}{\partial \boldsymbol{A}}

法则[编辑]

以下法则适用于实标量函数对向量的梯度以及对矩阵的梯度。

  • 线性法则:若f(\boldsymbol{A})g(\boldsymbol{A})分别是矩阵A的实标量函数,c1和c2为实常数,则
\frac{\partial [c_1 f(\boldsymbol{A})+c_2 g(\boldsymbol{A})]}{\partial \boldsymbol{A}}=c_1\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+c_2 \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 乘积法则:若f(\boldsymbol{A})g(\boldsymbol{A})h(\boldsymbol{A})分别是矩阵A的实标量函数,则
\frac{\partial f(\boldsymbol{A})g(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}
\frac{\partial f(\boldsymbol{A})g(\boldsymbol{A})h(\boldsymbol{A})}{\partial \boldsymbol{A}}=g(\boldsymbol{A})h(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A})h(\boldsymbol{A})\frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}}+f(\boldsymbol{A})g(\boldsymbol{A})\frac{\partial h(\boldsymbol{A})}{\partial \boldsymbol{A}}
  • 商法则:若g(\boldsymbol{A})\neq 0,则
\frac{\partial f(\boldsymbol{A})/ g(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{1}{g(\boldsymbol{A})^2} \left[ g(\boldsymbol{A})\frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}-f(\boldsymbol{A}) \frac{\partial g(\boldsymbol{A})}{\partial \boldsymbol{A}} \right]
  • 链式法则:若A为m×n矩阵,且y=f(\boldsymbol{A})g (y)分别是以矩阵A和标量y为变元的实标量函数,则
\frac{\partial g(f(\boldsymbol{A})}{\partial \boldsymbol{A}}=\frac{d g (y)}{dy} \frac{\partial f(\boldsymbol{A})}{\partial \boldsymbol{A}}

流形上的梯度[编辑]

一个黎曼流形M上的对于任意可微函数f的梯度\nabla f是一个向量场,使得对于每个向量 \xi

\langle \nabla f, \xi \rangle := \xi f

其中\langle \cdot, \cdot \rangle代表M上的内积(度量)而 \xi f (p), p\in Mf在點p,方向為\xi (p)方向導數。换句话说,如果\varphi :U\subseteq M\mapsto \mathbb{R}^np附近的局部座標,在此座標下有\xi (x)=\sum_j a_j (x)\frac{\partial}{\partial x_{j} },則\xi f (p)将成为:

\xi(f \mid_{p}) := \sum_j a_j(\frac{\partial}{\partial x_{j} }(f \circ \varphi^{-1}) \mid_{\varphi (p)})

函数的梯度和外微分相关,因为\xi f = df(\xi),实际上內積容许我们可以用一种标准的方式将1-形式df和向量场\nabla f建立联系。由\nabla f的定義,df(\xi)=\langle \nabla f, \xi \rangle,这样f的梯度可以"等同"于0-形式的外微分df,這裡"等同"意味著:兩集合\{df \}\{\nabla f \}之間有1對1的滿射

由定義可算流形\nabla f的局部座標表達式為:

 \nabla f=\sum_{ik} g^{ik}\frac{\partial f}{\partial x^{k}}\frac{\partial}{\partial x^{i}}

請注意這是流形上的公式,跟一般\mathbb{R}^n的公式不同。常常我們寫時會省略求和\sum符號,不過為了避免混淆,在這裡的公式還是加上去了。

柱坐标下的梯度(\nabla)算符[编辑]


   \nabla f(\rho,\theta,z) = \frac{\partial f}{\partial\rho} \mathbf{e}_{\rho}
                            + \frac1{\rho}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac{\partial f}{\partial z} \mathbf{e}_{z}

球坐标下的梯度(\nabla)算符[编辑]


   \nabla f(r,\theta,\phi) = \frac{\partial f}{\partial r} \mathbf{e}_{r}
                            + \frac1{r}\frac{\partial f}{\partial\theta} \mathbf{e}_{\theta}
                            + \frac1{r\sin \theta}\frac{\partial f}{\partial \phi} \mathbf{e}_{\phi}

其中\theta为极角,\phi方位角。

参考[编辑]

书籍[编辑]

  • (中文)张贤达. 矩阵分析与应用. 清华大学出版社. 2004.9. ISBN 9787302092711. 

参看[编辑]