海森矩阵
维基百科,自由的百科全书
在数学中,海森矩阵(Hessian matrix 或 Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵,此函数如下:
如果 f 所有的二阶导数都存在,那么 f 的海森矩阵即:
其中
,即
(也有人把海森定义为以上矩阵的行列式) 海森矩阵被应用于牛顿法解决的大规模优化问题。
目录 |
混合偏导数和海森矩阵的对称性[编辑]
海森矩阵的混合偏导数是海森矩阵非主对角线上的元素。假如他们是连续的,那么求导顺序没有区别,即
上式也可写为
在正式写法中,如果 f 函数在区域 D 内连续并处处存在二阶导数,那么 f的海森矩阵在 D 区域内为对称矩阵。
在
→
的函數的應用[编辑]
給定二階導數連續的函數
,海森矩陣的行列式,可用於分辨
的臨界點是屬於鞍點還是極值点。
對於
的臨界點
一點,有
,然而憑一階導數不能判斷它是鞍點、局部極大點還是局部極小點。海森矩陣可能解答這個問題。
- H > 0 :若
,則
是局部極小點;若
,則
是局部極大點。 - H < 0 :
是鞍點。 - H = 0 :二階導數無法判斷該臨界點的性質,得從更高階的導數以泰勒公式考慮。
在高维情况下的推广[编辑]
当函数
二阶连续可导时,Hessian矩阵H在临界点
上是一个
阶的对称矩阵。





→
的函數的應用
,則
,則