目录:
五、矩阵乘法和逆矩阵
1、矩阵乘法
1)矩阵乘法最常见求解方式 2)列组合与行组合方式 3)列乘以行 4)分块做乘法
2、逆矩阵
1)逆矩阵介绍 2)逆矩阵求解 3)A的LU分解
六、转置-置换-向量空间
1、置换矩阵回顾
2、置换矩阵的使用
3、转置矩阵
1)转置矩阵回顾 2)对称矩阵
4、向量空间与子空间
1)向量空间 2)子空间 3)列空间简要介绍
5、列空间和零空间
1)子空间回顾 2)子空间的交与并 3)列空间 4)零空间
七、求解Ax=0主变量与特解
1、消法求解零空间
1)消法确定主变量与自由变量(消) 2)对自由变量赋值覆盖零空间(回代) 3)算法总结
2、简化行阶梯形式
八、Ax=b的可解性与解的结构
1、Ax=b 的解
1)可解性 2)完整解方程过程
2、m*n 的矩阵A的秩与解的关系
1)列满秩 2)行满秩 3)行列皆满秩 4)不满秩 5)总结
五、矩阵乘法和逆矩阵
前面介绍了向量与矩阵之间的乘法,这一节我们要介绍两个矩阵之间的乘法;并讨论逆矩阵存在的条件;最后又介绍了求解逆矩阵的方法。
1、矩阵乘法
1)矩阵乘法最常见求解方式
首先来了解矩阵之间进行乘法运算时,我们是如何求解单个素的呢?
另外这里还要注意一下矩阵的规格问题,因为我们矩阵乘法运算是使用前一个矩阵的行向量点乘后一个矩阵的列向量,所以从向量角度看,它们必须有相同的分量。故A 列数必须与 B 行数相同,结果 C 矩阵的规格为 A 行数、B 列数。
--------------------------------
2)列组合与行组合方式
(1)列组合
还记得我们之前学习过矩阵与列向量的乘积,得到一个列向量:
那我们在计算矩阵之间的乘法时,可以把后面的矩阵 B 看作列向量的组合:
向量线性组合。最后再将得到的列向量组合在[1 2 3 …]中,即为结果 C。
这种方法的关键就是将右侧矩阵 B 看做列向量组合,将问题转化为矩阵与向量的乘法问题。也表明了矩阵 C 就是矩阵 A 中各列向量的线性组合,而 B 其实是在告诉我们,要以什么样的方式组合 A 中的列向量。
-----------------
(2)行组合
同理,我们还学习过行向量与矩阵的乘法,得到一个行向量。
同样,按照形式,这次将矩阵 A 看做行向量组合就行了:
之后每一个类似于[a a a a]B这样的行向量与矩阵之积,会得到一个行向量,各行向量最后构成了 C 中的各行。
这里要注意,C 中各行都来自于[a a a a]B形式求得的行向量,所以是矩阵 B 各行的线性组合组成了 C 的各行。
--------------------------------
3)列乘以行
常规方法中,计算 A*B=C 矩阵乘法时,使用 A 的行向量乘上 B 的列向量得到C 中各个位置的素。而我们这次介绍的方法,是用 A 的列向量乘上 B 的行向量得到各个矩阵,再将矩阵相加,得到 C。我们通过一个例子来讲解。
行向量都在[1 6]这条直线上,行空间(矩阵行所有可能的线性组合)是一条直线。
举例说明:
4)分块做乘法
分块乘法就是宏观上的矩阵乘法,比如现在有一个 50*50 的矩阵与 50*50 矩阵相乘,一个一个进行运算很麻烦,尤其是如果矩阵在某一区域上有一定的性质,那么我们可以将其分块,如:
2、逆矩阵
1)逆矩阵介绍
若存在非零向量 x,使得 Ax = 0,那么 A 就不可能有逆矩阵。
2)逆矩阵求解
其实求逆矩阵就是解方程组的过程,举例说明:
从列向量的角度看来,得到两个方程:
解这个方程就行了,但是这样做低阶矩阵还好,高阶矩阵计算量未免太大了。
所以这里介绍,高斯-若尔当方法:
这个方法就是可以同时处理两个方程组,即使用增广矩阵联系两个方程。
增广矩阵:
接下来进行行变换,将虚线左侧消为单位阵 I,此时右侧矩阵即为逆矩阵。
如下:
3)A的LU分解
(1)逆矩阵性质补充
首先考虑一个问题:方阵 A、B 都是可逆矩阵的话,AB 的逆矩阵是什么呢?这个问题并不复杂,想求出逆矩阵,无非就是令 AB*逆矩阵 = I,而我们不难想到
由于下一章中要涉及到矩阵的转置问题,我们在这里一并讨论矩阵转置与矩阵的逆的关系。首先介绍一下转置矩阵,转置矩阵就是将原矩阵各行换成对应列,所得到的新矩阵,如:
看起来就像是沿着左上角开始的一条对角线翻折了一样。
介绍完了转置矩阵的基础,接下来看一看它和逆矩阵有什么联系。说到逆矩阵,最经典的式子无非就是:AA^(−1) = I 。为了找到转置矩阵与逆矩阵A^(−1)间的关系,我们对AA^(−1) = I 两边同时进行转置运算,得到:
这个结果告诉我们:对于单个矩阵,转置与取逆两个运算顺序可颠倒。
-----------------
(2)A的LU分解
我们熟悉的的消法都是直接使用行变换得来的。而由于消矩阵的存在,说明用矩阵乘法也可以达到与之一样的消效果,所以
那么矩阵 L 是不是有什么特殊之处呢?我们通过一道例题来探讨下 。
这就给了我们启示,在使用 A = LU 分解矩阵的时候,我们只需要从 U 入手,反过来考虑,看如何通过行变换可以将上三角矩阵 U 变为 L,然后再将单位阵按此形式变化,就得到了 L 矩阵。这个性质也是 A = LU 形式分解矩阵的最大优点,我们甚至不需要知道类似的值到底是什么,我们只需要知道变换形式,即可求出 L,写出 A = LU 等式。
以上,我们已经学会了 A = LU 分解矩阵方法,那么现在有一个额外问题,就是消的运算量问题,比如现在我们有一个100*100的超级大的矩阵(无0素)。
我们需要运算(将一行乘一定倍数后加到另一行上消,每一个这样的过程计为一次运算)多少次之后,才能将其化为上三角矩阵 U 呢?这个问题我们先从列的角度进行考虑,第一列消运算结束之后,矩阵将会变为
形式,这一步中,第一列的素运算了 100 次,而第一行一共有 100 个素,于是仅第一行与第一列的消结束后,我们就运算了1002次。之后我们要研究的就变成了剩下的 99*99 的矩阵。以此类推,可知,最后的运算量为:
这个写法看上去比较难以计算,那么我们有没有什么估计大致值的方法呢?回想我们微积分中学到的知识,如果我们计算的不是离散的点
的值之和,而是连续区域上函数的黎曼和的话,我们可以通过积分来计算区域面积值的和。而这里我们的离散点很多,近似可以看做黎曼和,所以我们可以采用积分来估计和,也就是这样估算:
-----------------
(3)置换矩阵
我们之前接触过行变换所用到的矩阵,即是将单位阵 I 按照对应行变换方式进行操作之后得到的矩阵。它可以交换矩阵中的两行,代替矩阵行变换。什么时候我们需要使用矩阵行变换呢?一个经典的例子就是:在消过程中,当矩阵主位置上面不是 1 时,我们就需要用行变换将主位置换回 1。
这样的由单位阵变换而来的矩阵,通过矩阵乘法可以使被乘矩阵行交换。我们将这样的矩阵称为置换矩阵 P。我们通过一个例子来熟悉一下置换矩阵。
这可以理解为一个群,很明显任取两个矩阵相乘,结果仍在这个群中。
注:推广到 n 阶矩阵,n 阶矩阵有 n!个置换矩阵,就是将单位阵 I 各行重新排列后所有可能的情况数量。我自己的理解是:单看第一行,有 n 种排列方式,再看除去第一行,第一列的(n-1)阶矩阵,再看其第一行,有(n-1)种排列方式。以此类推,直到最后的 1 阶,有 1 种排列方式,由乘法原理,就有了 n!个置换矩阵。
六、转置-置换-向量空间
1、置换矩阵回顾
所谓的置换矩阵 P 就是用来完成行交换的矩阵,更具体来讲,是行重新排列了的单位矩阵。例如 I 就是一个置换矩阵,只不过 I 对矩阵没影响。那么对于 n 阶矩阵来说,有多少个置换矩阵呢?答案是n!种,也就是将单位矩阵 I 各行重新排列后所有可能的情况数量。
置换矩阵另一个优点就是可逆,因为置换矩阵各行还原后可以得到单位矩阵。而且对于置换矩阵 P,有
2、置换矩阵的使用
在讲消法的时候,主位置为 0 是一件很让人头疼的事情,这时就需要置换矩阵 P 来完成行交换,确保消过程顺利进行。上节课学习 A = LU 分解时,我们没有考虑要交换行的过程,如果我们想写出更普适的 LU 分解式的话,必须把行交换情况考虑进去,即:PA = LU
先用行交换使得主位置不为 0,行顺序正确。其后再用 LU 分解。
3、转置矩阵
1)转置矩阵回顾
之前简单介绍过转置矩阵,即
也就是说,转置矩阵中,行素与列素交换了,理解转置很简单。
--------------------------------
2)对称矩阵
对称矩阵,顾名思义,就是主对角线两侧素对应相等的矩阵。或者说,对矩阵 A,如果有:
4、向量空间与子空间
1)向量空间
首先明确“向量空间”的概念,它表示一整个空间的向量,但是要注意,不是任意向量的集合都能被称为向量空间。所谓的向量空间,必须满足一定规则,就是:该空间对线性运算(相加、数乘)封闭。类似:v → 3v 或 v,w → v+w运算,若得到的 3v 或者 v+w 都仍然在此空间中,那么这个空间可称为向量空间。
举个例子,R2就是一个向量空间。其中的向量均为二维实向量。在R2上就存在着线性组合,我们举例说明:
很明显,R2的向量空间可以构成一个平面,即是上图中的 xoy 面。这个向量空间存在的关键在于上图中平面上任何向量都在R2向量空间中。尤其是零向量。因为线性运算是数乘、相加。任何向量乘上 0 或者加上其反向向量后得到的都是零向量,所以它必然存在于所有向量空间中。这一点十分重要。同样,推广到R3空间,R3中是三维的向量,每个分量均为实数。例如
这样的向量就在R3空间中。再进行推广,空间中包括所有的 n 维向量,每个列向量有 n 个分量,且分量均为实数。
再举一个不是向量空间的例子:还是R2空间中,但是这次我们只取第一象限内的区域 D:
很明显,这部分空间无法满足“线性组合仍在空间中”的要求,比如数乘运算时,随便取个负数,向量就跑到第三象限去,脱离 D 空间范围内了。
2)子空间
上面的反例已经证明了在向量空间里随便取其一部分,很可能得到的不是向量空间。那如果我们取向量空间的一部分,将其打乱,构成的有没有可能是向量空间呢?
答案是有的,这样还能构成向量空间的部分我们称之为子空间。还是以R2为例:
如图,整个坐标平面表示的就是原向量空间R2,而这条穿过坐标原点的直线就是R2的子空间之一。检验一下这条直线上的任意向量,它们的数乘、相加运算结果全部都仍在这条直线上。这就构成了一个子空间。而如果这条直线不过原点,那就单说零向量都不在这个空间中,就更别谈什么子空间了。
那R2空间中,还有没有其他的子空间呢?既然我们这么强调零向量,那就让它单独成一个空间好了。记为 Z,其中只有一个零向量。它也是R2的子空间之一。
再稍稍推广一下,R3的子空间就是如下三个:
(1) 穿过原点的平面
(2) 穿过原点的直线
(3) Z 原点
--------------------------------
3)列空间简要介绍
上面介绍的子空间都是基于已知的图像来寻找的,接下来我们来通过具体的矩阵来构造出一个子空间,比如:列向量构造出的列空间。
两个向量
以及它们的所有线性组合都在这个二维平面上,构成一个空间。这部分要好好理解,用教授的话说“R3情况下还可以作图,但是更高维的类似于R10情况你要怎么办?譬如求R10空间中 5 个向量线性组合是什么样的?如果不共线,我们就可以类似地理解为一个十维空间中的五维平面之类的东西。”
这里还要注意列向量之间的性质,如果列向量之间就是共线的,那么其列空间就是一条过原点的直线。
5、列空间和零空间
矩阵乘法可以理解为一个特定的线性变换,矩阵的列向量相当基向量 i: (1,0) 和 j: (0,1) 经过变换过后的到达向量。
空间变换后的任何向量都可以由矩阵 A 的列向量线性表出,而这些所有可能的结果,也就是矩阵的列所张成的列空间(Column Space)。原先的空间经过这样2x2 矩阵 A 线性变换后的空间可能会有三种情况:
还是平面,仍是二维空间;
被压缩为一条线,变成了一维;
被压缩到原点,零维。
在数学专业的词汇来表示线性变换后空间的维数,称之为矩阵的秩(Rank)。换句话说,列空间就是矩阵的列所张成的空间。所以矩阵秩的另一种定义可以说是列空间的维数。经过变换后被压缩到原点的向量集,称为矩阵 A 的"零空间"(Null Space)或"核"(Kernel),记为 Null(A) 或 Ker(A)。
--------------------------------
1)子空间回顾
首先我们回顾一下上次讲到的子空间。首先明确,子空间必须对线性运算封闭。我们从一个简单的向量空间:R3空间开始。其图像如下,整个三维空间皆为R3空间。上一节中我们学习过,R3的子空间就是如下三个:
(1) 穿过原点的无限延伸的平面 P
(2) 穿过原点的无限延伸的直线 L
(3) Z原点
注:子空间必须包含原点(零向量),列向量与零向量都是一种子空间。
反映在图像上,即:
很明显,子空间直线 L 或平面 P 上,任取两个向量相加,得到的向量仍在该子空间中。而且将其上的向量做数乘伸长或缩短一定倍数,其结果也还在该子空间中。所以它们都对线性运算封闭。
--------------------------------
2)子空间的交与并
上面我们都是分别研究的两个子空间,那么接下来我们对两个空间之间联系部分展开讨论。
(1)P∪L空间
还是讨论上面R3的子空间 P 与 L,首先要研究的就是它们的并空间,即:现有一集合,包含了 P 与 L 中的所有向量,那么这个集合是子空间吗?答案是否定的。
很明显,我们将直线 L 与平面 P 看做同一个集合P∪L之后,这个集合对线性运算并不封闭。比如我们随便在直线 L 上取一个向量 a,在平面 P 上取一个向量b。此时向量 a+b 方向就会夹在直线 L 与平面 P 之间,脱离了P∪L的范围。所以P∪L无法构成空间。
-----------------
(2)P∩L 空间
如果看的是两个子空间的交集,那么上面那个R3的例子再合适不过了。因为平面 P 与直线 L 相交的部分只有一个地方-----原点。而原点显然是R3的子空间之一。如果推广到任意两个子空间的交呢?假设现在有子空间 S 和 T,问其交集S∩T 是否为子空间?这次答案是肯定的。为什么呢?抽象层面上来看,S∩T 集合是比 S、T 限制条件更多的集合,相当于一个更小的集合,限制更严格的集合,所以 S∩T 势必满足原本 S 和 T 的条件,所以可以构成一个子空间。
严格证明(对线性运算封闭)思路如下:
A.加法封闭:在 S∩T 中取 v,w 向量,单看 S 空间,v、w 均在 S 空间里,由于 S 是子空间,对线性运算封闭,故 v+w 也在 S 中,同样,再单看 T 空间,将上面的步骤中的 S 换成 T,也可以得 v+w 在T 空间中。这就说明 v+w 在 S∩T 中。所以 S∩T 对向量加法封闭。
B.数乘封闭:在 S∩T 中取 a 向量,a 在 S 空间中,所以 n 倍的 a 仍在 S 空间中。同样,a 也在 T 空间中,故 n 倍的 a 也在 T 空间中。也就是 n 倍的 a 仍在 S∩T 中。所以 S∩T 对数乘运算也是封闭的。
--------------------------------
3)列空间
(1)列空间回顾
我们通过一个例子来回顾之前的内容
张开的一个子空间。那么这个子空间有多大呢?这就需要用 Ax = b 方程来解释了。
-----------------
(2)Ax = b 的空间解释(从 A 的角度)
向量的一种线性组合,使 Ax = b。
第二个问题:什么样的 b 可以使方程 Ax = b 有解?
上面介绍过,Ax 就表示着 A 列向量的所有线性组合,也就是 A 的列空间。上面的 3.1 中提到过,A 的列空间就是R4的一个子空间,所以对于一个四维向量 b,只要 b 在“A 的列空间”这个R4的子空间中,那么就可以找到一种 A 列向量的线性组合来构成 b。也就是使得 Ax = b 有解。
第三个问题:能否去掉 A 的一列,却不影响 A 的列空间呢?
依靠前两列的线性组合就可以构成A的列空间。我们称
这样的列为主列。所以去掉第三列,并不影响 A 的列空间的构成。
--------------------------------
4)零空间
(1)零空间介绍
所谓零空间,就是 Ax = 0 的所有解所构成的一个空间,准确地说是解所张成的空间,方程等于零向量也是零空间中“零”的含义。
A.加法封闭:在此零空间中任取两向量 v、w,有 Av = Aw = 0,很显然 A(v+w) = 0,所以(v+w)也属于零空间,加法封闭得证。
B.数乘封闭:还是在此零空间中任取向量 v,Av = 0,则 cAv=0。
矩阵 A 与常数 c 位置可交换,所以 A(cv) = 0,所以 cv 也在零空间中。数乘运算封闭得证。
-----------------
(2)Ax = b 的空间解释(从 x 的角度)
那如果上面构造零空间的方程右侧变为任意向量的话,其解集 x 还能构成向量空间吗?如:
这也告诉我们,想从 x 的角度研究 Ax = b 这个方程,则只有 b 是零向量时,x 才能构成空间(零空间),其他情况中连零向量都不在解集中,更别谈向量空间了。
七、求解Ax=0主变量与特解
1、消法求解零空间
记得之前在讲解使用消法解方程组 Ax = b时,我们对一种情况是无法处理的,那就是矩阵 A 不可逆的情况。之前对这种情况的解释是:求出的解不唯一。这正好对应了我们现在学到的“空间”概念。我们首先从最简单的零空间(b = 0)的计算谈起。
1)消法确定主变量与自由变量(消)
首先注意A矩阵消之后只有两个主:1 和 2,主个数被称为“秩(yì)”,即 A 的秩(r)为:2。
接下来应该是进行回代求解,但是在这之前,由于消得到的 U 不是一个严格的上三角矩阵:
对角线上的 0 给我们造成了解不唯一的麻烦。所以先来明确几个概念:
所以这个 U 的主变量(主)为1,3。自由变量为2,4。
--------------------------------
2)对自由变量赋值覆盖零空间(回代)
通过特解的任意倍的线性组合可以构造出整个零空间。
--------------------------------
3)算法总结
对于一个 m*n 的矩阵 A,若其秩(R)为 r,那么就意味着其主变量为 r 个,而自由变量为 n-r 个。也就是只有 r 个方程起作用,而一共有 n 个变量 x,我们将其中的 n-r 个自由变量依次赋值为
接下来解方程求特解,将特解的任意倍进行线性组合就可以了。整体流程:
2、简化行阶梯形式
上面的消法看上去已经很完美了,但是最后一步解方程还有化简的余地,最后得到的 U 矩阵还可以被进一步化简。
拿上面【例】中的 U 矩阵
为例,继续化简:
(1)首先向上消,使主列除主之外都是 0:
(2)提出一列素公倍数,使主均为 1:
注:这就是简化行阶梯形式,将原来的行阶梯型矩阵简化,得到主列,自由列的最简单形式。
(3)列交换,使左上角变为单位阵 I:
显然,倍数 2 可以略去不看,不影响我们的解。此时的
也就是说 m*n 的 A 可以被化简为如下形式:
对比上面的
很好理解 R 的构成。左上角 I 是消化简之后得到的 r*r 大小的单位阵,代表着主列。右上角的 F 代表着自由列经过化简剩余的形式。
现在假设有一个零空间矩阵:即零空间矩阵各列由特解组成,记 N 为零空间矩阵。联系之前学习矩阵乘法时学到的分块乘法,不难得到:
八、Ax=b的可解性与解的结构
1、Ax=b 的解
1)可解性
2)完整解方程过程
所以最后的结果为:特解 + 零空间任意向量。
2、m*n 的矩阵A的秩与解的关系
1)列满秩
2)行满秩
3)行列皆满秩
4)不满秩
5)总结
如若喜欢这篇文章,不妨留下您宝贵的点赞,这将是对我莫大的鼓励。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/104354.html