链式法则

维基百科,自由的百科全书
跳转至: 导航搜索
微积分学
\text{e} = \lim_{n\to\infty} \left(1+\frac{1}{n}\right)^n
函数 · 导数 · 微分 · 积分

链式法则chain rule),是求复合函数导数的一个法则。设f g 为两个关于x 可导函数,则复合函数 (f \circ g)(x)的导数 (f \circ g)'(x)为:

 (f \circ g)'(x) = f'(g(x)) g'(x).

例子[编辑]

求函数 f(x) = (x^2 + 1)^3的导数。设 g(x) = x^2 + 1h(x) = g(x)^3.

h '(x) \, = h '(g(x)) g ' (x) \, = 3(g(x))^2(2x) \, = 3(x^2 + 1)^2(2x) \,
= 6x(x^2 + 1)^2. \,

求函数 \arctan\,\sin\, x的导数。

\frac{d}{dx}\arctan\,x\,=\,\frac{1}{1+x^2}
\frac{d}{dx}\arctan\,f(x)\,=\,\frac{f'(x)}{1+f^2(x)}
\frac{d}{dx}\arctan\,\sin\,x\,=\,\frac{\cos\,x}{1+\sin^2\,x}

证明[编辑]

fg为函数,x为常数,使得fg(x)可导,且gx可导。根据可导的定义,

 g(x+\delta)-g(x)= \delta g'(x) + \epsilon(\delta)\delta \,,其中当\delta\to 0时, \epsilon(\delta) \to 0 \,

同理,

 f(g(x)+\alpha) - f(g(x)) = \alpha f'(g(x)) + \eta(\alpha)\alpha \,,其中当\alpha\to 0. \,时,\eta(\alpha) \to 0 \,

现在

 f(g(x+\delta))-f(g(x))\, = f(g(x) + \delta g'(x)+\epsilon(\delta)\delta) - f(g(x)) \,
 = \alpha_\delta f'(g(x)) + \eta(\alpha_\delta)\alpha_\delta \,

其中\alpha_\delta = \delta g'(x) + \epsilon(\delta)\delta \,. 注意到当\delta\to 0时,\frac{\alpha_\delta}{\delta}\to g'(x)\alpha_\delta \to 0,因此 \eta(\alpha_\delta)\to 0。因此

 \frac{f(g(x+\delta))-f(g(x))}{\delta} \to g'(x)f'(g(x)).

多元复合函数求导法则[编辑]

考虑函数z = f(x, y),其中x = g(t),y = h(t),g(t)和h(t)是可微函数,那么:

{\ dz \over dt}={\partial z \over \partial x}{dx \over dt}+{\partial z \over \partial y}{dy \over dt}.

假设z = f(u, v)的每一个自变量都是二元函数,也就是说,u = h(x, y),v = g(x, y),且这些函数都是可微的。那么,z的偏导数为:

{\partial z \over \partial x}={\partial z \over \partial u}{\partial u \over \partial x}+{\partial z \over \partial v}{\partial v \over \partial x}
{\partial z \over \partial y}={\partial z \over \partial u}{\partial u \over \partial y}+{\partial z \over \partial v}{\partial v \over \partial y}.

如果我们考虑

\vec r = (u,v)

为一个向量函数,我们可以用向量的表示法把以上的公式写成f的梯度\vec r的偏导数的数量积

\frac{\partial f}{\partial x}=\vec \nabla f \cdot \frac{\partial \vec r}{\partial x}.

更一般地,对于从向量到向量的函数,求导法则为:

\frac{\partial(z_1,\ldots,z_m)}{\partial(x_1,\ldots,x_p)} = \frac{\partial(z_1,\ldots,z_m)}{\partial(y_1,\ldots,y_n)} \frac{\partial(y_1,\ldots,y_n)}{\partial(x_1,\ldots,x_p)}.

高阶导数[编辑]

复合函数的最初几个高阶导数为:

\frac{d (f \circ g) }{dx} = \frac{df}{dg}\frac{dg}{dx}

  \frac{d^2 (f \circ g) }{d x^2}
  = \frac{d^2 f}{d g^2}\left(\frac{dg}{dx}\right)^2 
    + \frac{df}{dg}\frac{d^2 g}{dx^2}

  \frac{d^3 (f \circ g) }{d x^3} 
  = \frac{d^3 f}{d g^3} \left(\frac{dg}{dx}\right)^3 
    + 3 \frac{d^2 f}{d g^2} \frac{dg}{dx} \frac{d^2 g}{d x^2}
    + \frac{df}{dg} \frac{d^3 g}{d x^3}

  \frac{d^4 (f \circ g) }{d x^4}
  =\frac{d^4 f}{dg^4} \left(\frac{dg}{dx}\right)^4 
    + 6 \frac{d^3 f}{d g^3} \left(\frac{dg}{dx}\right)^2 \frac{d^2 g}{d x^2} 
    + \frac{d^2 f}{d g^2} \left\{ 4 \frac{dg}{dx} \frac{d^3 g}{dx^3} + 3\left(\frac{d^2 g}{dx^2}\right)^2\right\}
      
    + \frac{df}{dg}\frac{d^4 g}{dx^4}.

参见[编辑]