黑塞矩陣

维基百科,自由的百科全书
(重定向自黑塞矩阵
跳到导航 跳到搜索

黑塞矩阵(德语:Hesse-Matrix;英语:Hessian matrixHessian),又译作海森矩阵海塞矩阵海瑟矩阵,是一个由德国数学家奥托·黑塞发展出来并以其命名的多变量实值函数的二阶偏导数组成的方块矩阵,假設有一實數函数 如果 所有的二阶偏导数都存在,那么 的黑塞矩阵的第 -項即:

其中,即

(也有人把黑塞定义为以上矩阵的行列式[1]。)

黑塞矩阵被应用于牛顿法解决的大规模优化问题。

黑塞矩阵及其对称性[编辑]

高等数学知识可知,若一元函数点的某个邻域内具有任意阶导数,则点处的泰勒展开式

其中,

同理,二元函数点处的泰勒展开式为

其中,

将上述展开式写成矩阵形式,则有

其中,转置(此处“转置”用上角标表示),是函数梯度,矩阵

即函数点处的二阶黑塞矩阵。它是由函数点处的二阶偏导数所组成的方阵。由函数的二次连续性,有

所以,黑塞矩阵对称矩阵

将二元函数的泰勒展开式推广到多元函数时,点处的泰勒展开式为

其中,
为函数点的梯度。
为函数点的阶黑塞矩阵。若函数有次连续性,则函数的阶黑塞矩阵也是对称矩阵。[2]

在映射 的應用[编辑]

給定二階導數連續的映射,黑塞矩陣的行列式,可用於分辨的臨界點是屬於鞍點還是極值点

對於的臨界點一點,有,然而憑一階導數不能判斷它是鞍點、局部極大點還是局部極小點。黑塞矩陣可能解答這個問題。

  • H > 0:若,則是局部極小點;若,則是局部極大點。
  • H < 0:是鞍點。
  • H = 0:二階導數無法判斷該臨界點的性質,得從更高階的導數以泰勒公式考慮。

在高维情况下的推广[编辑]

函数二阶连续可导时,Hessian矩阵H在临界点上是一个阶的对称矩阵。

  • 当H是正定矩阵时,临界点是一个局部的极小值。
  • 当H是负定矩阵时,临界点是一个局部的极大值。
  • H=0,需要更高阶的导数来帮助判断。
  • 在其余情况下,临界点不是局部极值。

参看[编辑]

参考文献[编辑]

  1. ^ Binmore, Ken; Davies, Joan. Calculus Concepts and Methods. Cambridge University Press. 2007: 190. ISBN 9780521775410. OCLC 717598615. 
  2. ^ 白清顺; 孙靖明; 梁迎春 (编). 机械优化设计(第6版). 北京: 机械工业出版社. 2017.6(2018.11重印): 35~36页. ISBN 978-7-111-56643-4.