凸函数

维基百科,自由的百科全书
跳转至: 导航搜索
在区间上的凸函数

凸函数是一个定义在某个向量空间凸子集C区间)上的实值函数f,如果在其定义域C上的任意两点x,y,以及t\in [0,1],有

f(tx+(1-t)y)\leq t f(x)+(1-t)f(y)

也就是说,一个函数是凸的当且仅当上境图(在函数图像上方的点集)为一个凸集

如果对于任意的t\in (0,1)

f(tx+(1-t)y) < t f(x)+(1-t)f(y),函数f严格凸的。

若對於任意的x,y,z,其中x\le z\le y,都有f(z)\leq \max\{f(x),\,f(y)\}, \,\,\, \forall x,y,z \,\,\, x\leq z\leq y,則稱函數f幾乎凸的。

性质[编辑]

函数(蓝色)是凸的,当且仅当其上方的区域(绿色)是一个凸集

定义在某个开区间C内的凸函数fC连续,且在除可数个点之外的所有点可微。如果C是闭区间,那么f有可能在C的端点不连续。

一元可微函数在某个区间上是凸的,当且仅当它的导数在该区间上单调不减

一元连续可微函数在区间上是凸的,当且仅当函数位于所有它的切线的上方:对于区间内的所有xy,都有f(y) ≥ f(x) + f '(x) (yx)。特别地,如果f '(c) = 0,那么cf(x)的最小值

一元二阶可微的函数在区间上是凸的,当且仅当它的二阶导数是非负的;这可以用来判断某个函数是不是凸函数。如果它的二阶导数是正数,那么函数就是严格凸的,但反过来不成立。例如,f(x) = x4的二阶导数是f "(x) = 12 x2,当x = 0时为零,但x4是严格凸的。

更一般地,多元二次可微的连续函数在凸集上是凸的,当且仅当它的黑塞矩阵在凸集的内部是半正定的。

凸函数的任何极小值也是最小值。严格凸函数最多有一个最小值。

对于凸函数f水平子集{x | f(x) < a}和{x | f(x) ≤ a}(aR)是凸集。然而,水平子集是凸集的函数不一定是凸函数;这样的函数称为拟凸函数

延森不等式对于每一个凸函数f都成立。如果 X 是一个随机变量,在f的定义域内取值,那么E(f(X)) \geq f(E(X)). (在这里,E表示数学期望。)

凸函數的初等運算[编辑]

  • 如果f g 是凸函數,那麼m(x) = \max\{f(x),g(x) \} h(x) = f(x) + g(x) 也是凸函數。
  • 如果f g 是凸函數,且g遞增,那麼h(x) = g(f(x))是凸函數。
  • 凸性在仿射映射下不變:也就是說,如果f(x) 是凸函數(x\in\mathbb{R}^n),那麼g(y) = f(Ay+b) 也是凸函數,其中A\in\mathbb{R}^{n \times m},\; b\in\mathbb{R}^m.
  • 如果f(x,y) (x,y) 內是凸函數,且C 是一個凸的非空集,那麼g(x) = \inf_{y\in C} f(x,y)x 內是凸函數,只要對於某個x ,有g(x) > -\infty

例子[编辑]

  • 函数f(x)=x^2处处有f\,''(x)=2>0,因此f是一个(严格的)凸函数。
  • 绝对值函数f(x)=|x|是凸函数,虽然它在点x = 0没有导数。
  • 当1 ≤ p时,函数f(x)=|x|^p是凸函数。
  • 定义域为[0,1]的函数f,定义为f(0)=f(1)=1,当0<x<1时f(x)=0,是凸函数;它在开区间(0,1)内连续,但在0和1不连续。
  • 函数x3的二阶导数为6x,因此它在x ≥ 0的集合上是凸函数,在x ≤ 0的集合上是凹函数
  • 每一个在\mathbb{R}内取值的线性变换都是凸函数,但不是严格凸函数,因为如果f是线性函数,那么f(a + b) = f(a) + f(b)。如果我们把“凸”换为“凹”,那么该命题也成立。
  • 每一个在\mathbb{R}内取值的仿射变换,也就是说,每一个形如f(x) = a^T x + b 的函数,既是凸函数又是凹函数。
  • 每一个范数都是凸函数,这是由于三角不等式
  • 如果f 是凸函数,那么当t > 0 时,g(x,t) = tf(x/t) 是凸函数。
  • 单调递增但非凸的函数包括f(x) = \sqrt xg(x) = \log(x)
  • 非单调递增的凸函数包括h(x) = x^2k(x)=-x
  • 函数f(x) = 1/x2f(0)=+∞,在区间(0,+∞)内是凸函数,在区间(-∞,0)内也是凸函数,但是在区间(-∞,+∞)内不是凸函数,这是由于x = 0处的奇点。

参见[编辑]

参考文献[编辑]

  • Moon, Todd. Tutorial: Convexity and Jensen's inequality. [2008-09-04]. 
  • Rockafellar, R. T. Convex analysis. Princeton: Princeton University Press. 1970. 
  • Luenberger, David. Linear and Nonlinear Programming. Addison-Wesley. 1984. 
  • Luenberger, David. Optimization by Vector Space Methods. Wiley & Sons. 1969. 
  • Bertsekas, Dimitri. Convex Analysis and Optimization. Athena Scientific. 2003. 
  • Thomson, Brian. Symmetric Properties of Real Functions. CRC Press. 1994. 
  • Hiriart-Urruty, Jean-Baptiste, and Lemaréchal, Claude. (2004). Fundamentals of Convex analysis. Berlin: Springer.
  • Krasnosel'skii M.A., Rutickii Ya.B. Convex Functions and Orlicz Spaces. Groningen: P.Noordhoff Ltd. 1961. 
  • Borwein, Jonathan, and Lewis, Adrian. (2000). Convex Analysis and Nonlinear Optimization. Springer.