单纯形法怎么理解_单纯形法各个步骤详解

简单易懂的单纯形法理解

$\qquad$ 从学线性规划开始一直觉得单纯形是一种奇奇怪怪不知所云的方法
~~（居然还好意思叫simplex，我觉得叫complex才对）~~，上课老师讲到的一大堆性质定理的证明也让人晕头转向，最后还是死记硬背下了单纯形表的解法勉强应付过了作业。直到今天小班课助教讲了他学到的对于单纯形的理解，才觉得豁然开朗，原来单纯形的确是这么“单纯”。和图解法结合起来也更加清晰直观地看到了单纯形法的工作过程，分享出来希望也能够帮助大家更好地理解。我们
不需要任何定理公式。

推荐阅读本文方法：自己在纸上把文中单纯形表和图像画出来，对照着进行学习。

$\qquad$ 需要读者关于线性规划标准形的一些最基本的概念，如基变量，基本可行解等，如果不了解可先学习一下标准形，在此不对概念做赘述。以及知道单纯形的大概思路（先确定一组基本可行解，然后通过各种操作使得目标函数的值不断下降，最终得到最优解）

$\qquad$ 我们以《算法设计与分析（第2版）》上的例子来进行讲解

$\qquad z=12x+15y\\ s.t.\quad 0.25x+0.50y\ \leq120\\ \qquad \;0.50x+0.50y\ \leq150\\\qquad0.25x\qquad\qquad\leq50\\x\geq0,\quad y\geq0$
画出的图像如图所示

$\qquad$ 这是最简单的情形，所有的约束条件都为小于等于，我们可以直接通过引入松弛变量来化为标准形，即：
$\qquad -z=-12x_{1}-15x_{2}\\ s.t.\quad 0.25x_{1}+0.50x_{2}+x_{3}\ =120\\ \qquad \;0.50x_{1}+0.50x_{2}+x_{4}\ =150\\\qquad0.25x_{1}\qquad\quad\quad\;+x_{5}=50\\x_{j}\geq0,\quad j=1,2,…,5$

$\qquad$ 单纯形的第一步是找出一组初始可行基，对于我们题目中这种约束条件全为小于等于的版本，我们只需取三个松弛变量作为初始可行基即可。

我们画出单纯形表（简化版）如下所示

$x_{B}$	$b$	$x_{1}\qquad\qquad x_{2}\qquad\qquad x_{3}\qquad\qquad x_{4}\qquad\qquad x_{5}$	$\theta$
$x_{3}$	120	$\qquad \qquad0.50\qquad\qquad1\qquad\qquad0\qquad\qquad0\quad$	240
$x_{4}$	150	$\qquad \qquad0.50\qquad\qquad0\qquad\qquad1\qquad\qquad0\quad$	300
$x_{5}$	50	$\qquad \qquad0\qquad\qquad\quad0\qquad\qquad0\qquad\qquad1\quad$
$- z$	0	$\qquad \ \ \quad-15\ \ \qquad\qquad0\qquad\qquad0\qquad\qquad0\quad$

$\qquad$ 让我们首先理解这个单纯形表表示的是什么意思。先抛开 $\ \theta\;$ 列不看，只看前面的几列。 $x_{B}$ 列表示的是我们当前选取的基变量，而 $\;b\;$ 列和 $\;x\;$ 列合起来就是我们目前线性规划的约束条件，最下面一行是我们当前的目标函数，由于我们目前选择的初始可行解为{0,0,120,150,50}，所以初始目标函数值为0。相信到这里大家都是能够理解的。

$\qquad$ 接下来就开始我们的优化，我们的目的是想让目标函数的值降低，而现在影响目标函数的变量有 $x_{1} 和 x_{2}$ ，两个变量增大均能够使得目标函数减小，我们先选择其中的一个来达成我们的第一步。注意到， $x_{1}$ 每增加1会使得 $\;-z\;$ 减小12，而 $x_{2}$ 每增加1会使得 $\;-z\;$ 减小15。我们希望目标函数减小的越快越好，所以这里我们选择 $x_{2}$ 进行增大，用单纯形的术语来说就是让 $x_{2}$ 作为换入变量，使它成为可行基。

$\qquad$ 我们当然希望目标函数越小越好，那么我们的 $x_{2}$ 自然是越大越好，但是它不能无限制地增大下去，因为我们有约束条件（三个等式，以及非负条件）。那么我们考察一下 $x_{2}$ 最多能增大多少呢？含有 $x_{2}$ 的等式限制是前两个： $\qquad 0.25x_{1}+0.50x_{2}+x_{3}\ =120\\ \qquad \;0.50x_{1}+0.50x_{2}+x_{4}\ =150$ 由于它们是等式条件，所以如果想要 $x_{2}$ 增大，必须有相应变量减小来维持等式条件成立，由于非负条件的限制，两式中能减小的只能分别是 $x_{3}$ 和 $x_{4}$ 了（ $x_{1}=0$ ）。
$\qquad$ 现在 $x_{3}$ 和 $x_{4}$ 的值均为1，要让 $x_{2}$ 增加到最大就要让它们减小到0。让 $x_{3}$ 减小到0可以使 $x_{2}$ 增大到 $1 * 120 / 0.50 = 240$ ，而让 $x_{4}$ 减小到0可以使 $x_{2}$ 增大到 $1 * 150 / 0.50 = 300$ 。有没有发现，这就是我们的 $\;\theta\;$ 那一列的值？注意这里有一个比较容易迷惑的点。 有些同学可能会想，我们想让 $x_{2}$ 越大越好，那这里300更大是不是能增大到300？这样思考是不对的。要知道，这两个等式是约束条件，是需要都满足的，如果我们选取了300那么第一个等式就不能满足了。从这个角度思考，这里我们其实应该选择的是 $\;\theta\;$ 的最小值，也即让 $x_{3}$ 减小到0，用单纯形的术语来讲就是选择 $x_{3}$ 作为换出变量。

$\qquad$ 现在，我们尽管没有提到变量替换这样的概念，但我们已经选好了所谓的换入变量和换出变量。这时候，我们的解向量变成了{0,240,0,1,0}，并且 $- z$ 的值变成了 $- 15 * 240 = - 3600$ （根据之前说的 $x_{2}$ 每增大1就会让 $- z$ 减小15）。因为 $x_{2}$ 此时已经不能再增加了，我们也在约束条件中想办法把它的影响减到最小，即只保留用到的等式约束中的 $x_{2}$ 并把它单位化，把其余的等式约束中消去 $x_{2}$ 。这一步通过行列变换可以很容易得到，化简后的等式约束变为：
$\quad\; 0.50x_{1}+x_{2}+2x_{3}\ =240\\ \quad0.50x_{1}-x_{3}+x_{4}\ =30\\\qquad\;0.25x_{1}\qquad\quad\quad\;+x_{5}=50$

同时，由于约束条件的改变，我们目标函数的形式也应该相应地进行改变。此时 $- z$ 的初值为-3600，解向量为{0,240,0,1,0}。考察现在各变量对于目标函数的影响。当 $x_{1}$ 增大1，目标函数会减小12；但同时，为了满足第一个等式约束， $x_{2}$ 的值也需要发生相应变化，即当 $x_{1}$ 增大1， $x_{2}$ 的值需要减小0.5，从而使目标函数增大 $- 15 * 0.5 * (- 1) = 7.5$ 。综合来看引起的变化可以得到，当 $x_{1}$ 增加1，会使得目标函数的值改变 $- 12 + 7.5 = - 4.5$ ，即 $x_{1}$ 新的系数为-4.5。同理对于 $x_{3}$ ，当 $x_{3}$ 增大时本来对目标函数影响是0，但是每当 $x_{3}$ 增大1，为了满足第一个等式，需要让 $x_{2}$ 减小2，从而使目标函数改变 $- 15 * 2 * (- 1) = 30$ ,即 $x_{3}$ 系数为30。即 $z=-3600-4.5x_{1}+30x_{3}$ 。如果仔细观察，我们可以惊奇地发现，这几个系数在表中的得出过程与上面改变约束时的行列变换做法完全一致，即把对应列（ $x_{2}$ ）消成0，这样我们得到一个更加简便的计算“新目标函数”的方法。

$\qquad$ 到这里，有些同学可能会提出疑问：为什么 $x_{2}$ ， $x_{4}$ ， $x_{5}$ 的系数是0呢？或者是：为什么我们考虑 $x_{1}$ 增大时只考虑了对 $x_{2}$ 的影响而没有考虑对 $x_{3}$ ， $x_{4}$ ， $x_{5}$ 的影响呢？这就涉及到我们对于换出的理解了。事实上，从一开始的目标函数中， $x_{1}$ 的系数-12就不只是增大1个单位 $x_{1}$ 的影响，而是增大1个 $x_{1}$ ，减小0.25个 $x_{3}$ ，减小0.5个 $x_{4}$ ，减小0.25个 $x_{5}$ 的收益，这才是我们系数的真正含义，其他变量的系数也是同理。当我们进行完第一步的单纯形变换后，由于我们的消元，后两个等式中都没有 $x_{2}$ ，故换入换出的比例关系不受到影响，所以我们只需要考虑第一个等式中的关系。同时，我们系数的含义是“增加1单位的 $x_{j}$ ,同时加上对其他变量的影响，一共对目标函数结果的影响”，而 $x_{2}$ 此时已经不能再增大了，自然也就没有系数了。这样我们就完全解释了所有系数的来历，也体会出了我们行列变换消元的重要性所在。

现在，我们已经基本完成了下一步的单纯形表的求解（除 $\;\theta\;$ 列以外），如下：

$x_{B}$	$b$	$x_{1}\qquad\qquad x_{2}\qquad\qquad x_{3}\qquad\qquad x_{4}\qquad\qquad x_{5}$	$\theta$
$x_{2}$	240	$\qquad \qquad1\qquad\qquad2\qquad\qquad0\qquad\qquad0\quad$	480
$x_{4}$	30	$\qquad \qquad0\quad\qquad-1\qquad\qquad1\qquad\qquad0\quad$	120
$x_{5}$	50	$\qquad \qquad0\quad\qquad\quad0\qquad\qquad0\qquad\qquad1\quad$	200
$- z$	3600	$\qquad \ \ \quad0\ \ \qquad\qquad30\qquad\qquad0\qquad\qquad0\quad$

总结一下变换的大体思路：先找出能让目标函数减小的变量（换入变量），然后找出对应的最严格的约束条件（换出变量），替换后将原变量约束的影响降到最低（单位化，消元），最后得到新的目标函数。

从图像上来看，我们让 $x_{2}$ 变到了可能的最大值，即目标函数如图所示：

$\qquad$ 从图上我们显然可以看到这并不是最优解，最优解应当经过B点，即让直线向右移，即让 $x_{1}$ 增大，那么我们从单纯形表中是不是也能得出同样的结论呢？让我们一起继续来看。

$\qquad$ 有了第一次单纯形变换的经验，我们很容易同样地进行第二步。首先选择能让目标函数减小的变量，这里只有 $x_{1}$ 可以了，即为换入变量。然后算出 $x_{1}$ 在约束的情况下能变化多少，即用 $b$ 列除以 $x_{1}$ 列算出 $\;\theta\;$ 列，选取其中最小的一个（必要的约束条件），这里是第二行120，则第二行对应的 $x_{B}$ 即 $x_{4}$ 为换出变量。然后我们对于 $x_{1}$ 列，把第二个等式单位化，第一三个等式对应行和下面的目标函数行列变换消元，得到新的单纯形表：

$x_{B}$	$b$	$x_{1}\qquad\qquad x_{2}\qquad\qquad x_{3}\qquad\qquad x_{4}\qquad\qquad x_{5}$
$x_{2}$	240	$\qquad \qquad1\qquad\qquad4\qquad\qquad-2\qquad\qquad0\quad$
$x_{1}$	30	$\qquad \qquad0\quad\qquad\quad-4\qquad\qquad4\qquad\qquad0\quad$
$x_{5}$	50	$\qquad \qquad0\quad\qquad\quad1\qquad\qquad-1\qquad\qquad1\quad$
$- z$	4140	$\qquad \ \ \quad0\ \ \qquad\qquad12\qquad\qquad18\qquad\qquad0\quad$

对应的图像为：

可以观察到图像和单纯形表完全对应，图像的虚线向右移动，即 $x_{1}$ 增大了。从图像可以看到，我们已经得到了最优解，那么从单纯形表中看如何呢？

我们在最后一行看现在的“新目标函数”， $z=-4140+12x_{3}+18x_{4}$ ，此时两个变量的增大均会使 $- z$ 减小，即术语所说的所有的检验数都大于等于零，达到了最优解。与图像完全符合！

总结

通过上面的详细分析，原来单纯形法并不只是课堂上一大堆~~让人听见就犯困的~~定理的证明，其实它的本质是选择某一个未达到最优的方向（即所谓非基变量），让它增大到这个变量的最优（图像上另一个顶点），通过这样不断地变换自然可以最终达到最优的那个顶点。抛开数学的部分，它其实还是很朴素的一样方法。一点感悟就是从设计者的思想来学习（从算法思路到概念引入到正确性证明）要比一上来就给出一大堆不知所云的定理要强得多，对于我们不专门搞理论算法的人来说也完全够用了 ~~（够期末考试用了）~~ 。
最后特别感谢我的算分小班助教GAREN，之前虽然不是完全死记方法但也只有很浅薄的理解，因为他的讲解让我有了对整个算法系统性的理解。希望大家也能从此文获益！

今天的文章单纯形法怎么理解_单纯形法各个步骤详解分享到此就结束了，感谢您的阅读。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/77121.html

单纯形法怎么理解_单纯形法各个步骤详解

简单易懂的单纯形法理解

相关推荐

发表回复