凸集和凸优化

凸集和凸优化本文深入探讨了凸集的定义与性质 包括与仿射集的关系 以及保凸运算

一、 凸集

1. 凸集与仿射集的关系

  • 说道凸集,就不得不提到仿射集的概念。
  • 仿射集:
    • 通过集合C中任意两个不同点的直线仍在集合C内,则称集合C为仿射集(例如直线和平面)。
      在这里插入图片描述
    • 设X1和X2是定义在集合C中任意两个不同的点,即X1 ≠ X2,并且 X1,X2 ∈ C,θ⊆R,对θ都有θX1 + (1-θ)X2 ∈ C,则称C为一个仿射集。
    • 若对上面定义增加一个条件0 ≤ θ ≤1,则C为一个凸集。
    • 因为仿射集的条件比凸集的条件强,因此仿射集必然是凸集。

2. 凸集相关概念

  • 保凸运算:
    1.凸集与凸集的交集还是凸集;
    2.仿射变换,即线性变换;
    3.透视变换;
    4.投射变换。
  • 保凸算子:
    • 凸函数的非负加权和
    • 凸函数和仿射函数的复合
    • 凸函数的逐点最大值,逐点上确界
      f(x) = max( f1(x),f2(x),fk(x)…fn(x) )
      f(x) = sup g(x,y)

二、凸函数

1. 定义

  • 若一个函数满足:
    1.定义域是凸集
    2.f(ax1 + (1-a)x2) <= af(x1) + (1-a)f(x2)  其中:∑a1=1,a1 >= 0   那么该函数为凸函数。
    示例: f ( x 1 + x 2 2 ) ≤ f ( x 1 ) + f ( x 2 ) 2 f(\frac {x_1+x_2}{2})≤\frac {f(x_1)+f(x_2)}{2} f(2x1+x2)2f(x1)+f(x2)
    在这里插入图片描述

2. 性质

  • 凸函数的局部极小值就是全局最小值
  • 凸函数Hessian矩阵半正定
  • Q为半正定对称阵,f(x) = xTQx为凸函数
  • f(x)为凸函数,f(E(x)) <= E(f(x))   (Jesson不等式)其中E(x)是x的期望
    Hessian矩阵半正定
    • 特征值:向量变换的大小;

3. 凸函数举例

  • 指数函数f(x) = ex
  • 幂函数f(x) = xa
  • 负对数函数f(x) = -logx
  • 负熵函数f(x) = xlnx
  • 范数f(x) = ||x||
  • 最大值函数f(x) = max(x1,x2,…,xn)

4. 海森矩阵

4.1 海森矩阵(Hession)和极值的关系

  • 可导函数在某一点处取得极值的必要条件是梯度为0,梯度为0的点成为函数的驻点这是疑似极值点。需要注意的是,梯度为0只是函数取极值的必要条件而不是充分条件,即梯度为0的点可能不是极值。
    如果Hession矩阵正定(所有特征值为正数),函数有极小值;
    如果Hession矩阵负定(所有特征值为负数数),函数有极小值;
    如果Hession矩阵不定(所有特征值为有正有负),则不是极值点(鞍点)。

5. 泰勒展开式

5.1 定理

  • 设n是一个正整数,如果定义在一个包含a的区间上的函数f在a点处n+1次可导,那么对于这个区间上的任意x,都有:
    f ( x ) = f ( a ) + f ′ ( a ) 1 !
编程小号
上一篇 2025-03-01 08:01
下一篇 2025-02-23 15:21

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/104886.html