海森矩阵

维基百科,自由的百科全书
跳转至: 导航搜索

数学中,海森矩阵Hessian matrixHessian)是一个多变量实值函数的二阶偏导数组成的方块矩阵,假設有一實數函数 如果 所有的二阶偏导数都存在,那么 的海森矩阵的第 -項即:

其中,即

(也有人把海森定义为以上矩阵的行列式[1]。)

海森矩阵被应用于牛顿法解决的大规模优化问题。

混合偏导数和海森矩阵的对称性[编辑]

海森矩阵的混合偏导数是海森矩阵非主对角线上的元素。假如他们是连续的,那么求导顺序没有区别,即

上式也可写为

也就是說,如果f 函数在区域D 内的每個二阶导数都是連續函數,那么f的海森矩阵在D区域内为对称矩阵

在映射 的應用[编辑]

給定二階導數連續的映射,海森矩陣的行列式,可用於分辨的臨界點是屬於鞍點還是極值点

對於的臨界點一點,有,然而憑一階導數不能判斷它是鞍點、局部極大點還是局部極小點。海森矩陣可能解答這個問題。

  • H > 0:若,則是局部極小點;若,則是局部極大點。
  • H < 0:是鞍點。
  • H = 0:二階導數無法判斷該臨界點的性質,得從更高階的導數以泰勒公式考慮。

在高维情况下的推广[编辑]

函数二阶连续可导时,Hessian矩阵H在临界点上是一个阶的对称矩阵。

  • 当H是正定矩阵时,临界点是一个局部的极小值。
  • 当H是负定矩阵时,临界点是一个局部的极大值。
  • H=0,需要更高阶的导数来帮助判断。
  • 在其余情况下,临界点不是局部极值。

参看[编辑]

参考文献[编辑]

  1. ^ Binmore, Ken; Davies, Joan. Calculus Concepts and Methods. Cambridge University Press. 2007: 190. ISBN 9780521775410. OCLC 717598615.