带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」为了不浪费大家宝贵的时间,开头我先简要说明一下这篇博文对哪些读者可能会有帮助1、你是正在学习矩阵的乘法运算,觉得矩阵的乘法掌握起来很困难2、你已经学会了矩阵乘法,但如果你在计算矩阵乘法时还

为了不浪费大家宝贵的时间,开头我先简要说明一下这篇博文对哪些读者可能会有帮助

1、你是正在学习矩阵的乘法运算,觉得矩阵的乘法掌握起来很困难

2、你已经学会了矩阵乘法,但如果你在计算矩阵乘法时还在使用“一行乘一列得一数”的方法,那我强烈建议你看看后面的内容。

因为,我将带你更加深刻地理解矩阵,与之而来是对矩阵乘法的全新计算方式。这不仅让你在计算矩阵乘法时更快,而且更省心。

 

“矩阵就是数表”这可能是很多人第一次在线性代数课堂上听到的概念。我不能指责老师这样教有错,但这种肤浅的理解会给以后的学习带来越来越多的困难,无形之中让线性代数变得越来越“玄学”。

我认为好的学问都应该是通俗易懂的,因此让我们从一个最简单的概念开始——数数,或者说计量。

人类利用数字来表示事物的多少,但单有数字还是不够的,配合数字一起使用的还有一个概念——单位。例如,2L水,3kg钢铁等等。在更为抽象一点的事物上,还有与“单位”对应的一个概念——权。例如十进制数字 34 中的 4 的权是 1,而 3 的权是进制 10。简单来说,衡量任何实物,我们总是要现在此类事物中找一个看得顺眼的 “样品” 来作为衡量该类型其他事物的一个标准,看看需要衡量的事物是这个标准量的“几倍”,这样综合起来,我们心里就能有一个感性的认识。

认识一:其实没有标准,所有的标准都是由一个具体的事物(看得最顺眼的那个)来充当的。

上面的数数的例子都是单维度的,然而有很多量无法单单使用一对“数字+单位”这样的组合来描述清楚,而是需要多组。比如,平面上的点的位置需要两组,三维空间中的点的位置需要三组才能描述清楚,等等。而线性代数研究的就是空间。让我们还是再从最简单的概念开始——平面直角坐标系。

也许你会说,平面直角坐标系还不简单么,不就是这个么

                                                          带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

但是,我更希望它在你心中样子长成这样:

                                                  带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

官方的说法把它叫做“平面直角坐标系的基”,你可以把它理解为在平面中数点的位置时用到的“单位”(就叫它“标准1”吧)。点(2,3)实际上是:

                                                                   (2, 3)=2\times (1, 0) + 3\times(0, 1)

很多时候我们看的顺眼事物往往就那一个,因此标准也是唯一的了。比如二维平面的标准:

                                                                        \overrightarrow{e_{x}}=(1, 0)        \overrightarrow{e_{y}}=(0, 1)

或许有人会说,x方向的基并不一定需要和y方向上的基保持长度相同,夹角也不需要是直角(只要是两个方向就行了)。随便整一个:

                                                                  带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

这也能作为衡量平面中点的坐标的“单位”(暂且叫它“标准2”好了)。但让我们来看一个具体的例子:

如果有一个点在上面这个坐标系中的坐标是:x=3, y=4。我们是不是通常会“忍不住“计算一下:

                                       3\times \overrightarrow{e_{x}}+4\times \overrightarrow{e_{y}}=3\times(2,0)+4\times(\frac{1}{\sqrt[]{2}},\frac{1}{\sqrt[]{2}})=(6+2\; \sqrt[]{2},2\; \sqrt[]{2})

这个算式很简单,但不知你想过没有,为什么我们要去算呢?为什么不就用

                                                                               3\times \overrightarrow{e_{x}}+4\times \overrightarrow{e_{y}}

来表示这个点的坐标就好了呢,实际上,当我们写下第一个等号,在进行

                                                                    \overrightarrow{e_{x}}=(2,0)              \overrightarrow{e_{y}}=(\frac{1}{\sqrt[]{2}},\frac{1}{\sqrt[]{2}})

这样的换算时,我们就已经放弃上面的“标准2”,又使用起了平面直角坐标系的“标准1”。

认识二:标准往往是唯一的,使用其他的标准时,我们会情不自禁地回到这个唯一的标准。而这个唯一的标准都有一个特性,你不会去想把它转化成其他标准。

而这个的简单算式,实际上就是一次“矩阵运算”!不信?让我们再来看一下这个简单的式子:

                                            (3,4)\times (\overrightarrow{e_{x}},\overrightarrow{e_{y}}) =(3,4)\times \begin{bmatrix} 2&0 \\ \frac{1}{\sqrt[]{2}} &\frac{1}{\sqrt[]{2}} \end{bmatrix}=3\times(2,0)+4\times(\frac{1}{\sqrt[]{2}},\frac{1}{\sqrt[]{2}})\\=(6+2\; \sqrt[]{2},2\;\sqrt[]{2})          带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

这就是简单而又直接的算法,我可没有用什么“一横乘一竖”。不过你应该能发现两种算法的答案居然是一样的!等等,你也许会说,这根本就不是矩阵的乘法,就算你这样变形着写,着充其量也就是个向量对矩阵的乘法。那下面再让我们来思考一个更为深刻的问题——矩阵究竟是什么?是数表么,当然不是。其实,上文已经对这个问题给出了答案,再看看 认知一 吧,标准是由事物来充当的;二维空间中衡量点的位置的标准是由二维点来充当的,n 维空间中衡量点的位置的标准是由 n 维点来充当的。更进一步的,n 维空间中衡量一个点的坐标需要描述清楚 n 个维度,那描述清楚每一个维度又需要什么呢?回到开篇所说,需要一个数,一个“单位”。而在 n 维空间中,一个“单位”,一个“标准”,就是由一个点来充当的啊。即,一个维度需要一个标准,一个标准就是一个点,n 个维度自然需要 n 个点,而这每个点又都是 n 维空间中的点,自然每个都有 n 个维度。n 个 n 维点,可不就是一个 n\times n 的矩阵嘛。为什么长宽相等的矩阵出现频率这么高,因为这样的矩阵本质上是一个坐标系!一个描述 n 维空间的坐标系。

当你用一个点(专业的说法叫向量)乘以矩阵时,实际上是放弃了以这个矩阵作为坐标系来衡量这个点的位置,重新使用了我们看得最顺眼的衡量标准——“单位阵”;

当你用矩阵乘以矩阵时,如

                                                                              \mathbf{A_{n\times n}\times B_{n\times n}=C_{n\times n}}

实际上是进行了 n 次点乘以矩阵。你放弃了用矩阵 B 来衡量前面矩阵 A 中的 n 个点的位置,重新使用了我们看得最顺眼的衡量标准——“单位阵”。这矩阵A中的 n 个点在矩阵 B 中的位置就是矩阵 A 本身所描述的,在你放弃标准 B(进行了这次矩阵运算后),矩阵 A 中的 n 个点的位置变成由矩阵 C 来描述了。

最后,有了上面的铺垫,我们来看一下,在这样的理解下,矩阵乘法到底应该怎么算。

                                      \mathbf{A}\times \mathbf{B}=\begin{pmatrix}\mathbf{a_1}\\ \mathbf{a_2}\\ \mathbf{a_3}\end{pmatrix} \times \mathbf{B} = \begin{pmatrix} \mathbf{a_1}\times \mathbf{B}\\ \mathbf{a_2}\times \mathbf{B}\\ \mathbf{a_3}\times \mathbf{B} \end{pmatrix} =\begin{pmatrix} a_{11}\times \mathbf{b_1}+ a_{12}\times \mathbf{b_2}+ a_{13}\times \mathbf{b_3}\\ a_{21}\times \mathbf{b_1}+ a_{22}\times \mathbf{b_2}+ a_{23}\times \mathbf{b_3}\\ a_{31}\times \mathbf{b_1}+ a_{32}\times \mathbf{b_2}+ a_{33}\times \mathbf{b_3} \end{pmatrix}

这里只有“横”,没有什么“竖”的概念。不要一个数一个数地算,应该一个点一个点的算。公式太抽象?举个栗子,要计算:

                                                                          \begin{pmatrix} 1 & 2 & 4\\ 3 & 1 & 5\\ 4 & 6 & 3 \end{pmatrix}\times \begin{pmatrix} 2 & 1 & 3\\ 7 & 9 & 10\\ 5 & 7 & 1 \end{pmatrix}

我们一行一行的算,第一行:

                                   \begin{pmatrix} 1 & 2 & 4 \end{pmatrix} \times \begin{pmatrix} 2 & 1 & 3\\ 7 & 9 & 10\\ 5 & 7 & 1 \end{pmatrix} \\ \\= 1 \times \begin{pmatrix} 2 & 1 & 3 \end{pmatrix}+ 2 \times \begin{pmatrix} 7 & 9 & 10 \end{pmatrix}+ 4 \times \begin{pmatrix} 5 & 7 & 1 \end{pmatrix} \\ \\ =\begin{pmatrix} 2 & 1 & 3 \end{pmatrix}+ \begin{pmatrix} 14 & 18 & 20 \end{pmatrix}+ \begin{pmatrix} 20 & 28 & 4 \end{pmatrix}= \begin{pmatrix} 36 & 47 & 27 \end{pmatrix}

相信剩下两行的计算就不用我啰嗦了,大家都会。

相信大家在学线性代数的时候,一会儿是列向量,一会儿是行向量,叫人头晕,老师解释这只是种写法,并没有什么讲究,但事实又好像不是如此,因为你要“一行乘一列”嘛,前面放“行”后面放“列”,这式子没法算呐。但我在这里要呐喊:

认识三:从来就没有什么列向量,所有的向量都是行向量。

其实,你要是认为“从来就没有什么行向量,所有的向量都是列向量”也可以,那样的算法是一次算一列。事情的真相其实是所有的向量都是“同方向”的,你喜欢行向量就都是行向量好了,你喜欢列向量就都是列向量好了,反正他们不会同时存在。相信只有一个方向的向量会让你神清气爽,不再晕头转向。不过你要是用列向量的话,记得要从后往前算,有兴趣的读者可以研究一下具体的算法,如有不明之处可以下面留言交流。

最后再皮一下:其实我是喜欢都看成行向量的,一来写起来省纸又顺手,二来从左往右算,符合习惯。我还暗自揣测过为什么行比列顺手,可能跟书写工具有关吧,矩阵记号是西方发明的,西方人用硬笔,书写时沉腕,旋转肘关节自然横向方便,如果矩阵记号是中国人发明的,我们用软笔,书写时悬腕,旋转肩关节自然竖向方便,那说不定矩阵运算就是列运算更加方便了。

如果您觉得本篇文章对您有所帮助,那就支持我一下吧。

                                                

                                                         带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」

今天的文章带你深入理解矩阵乘法的方法_矩阵的相乘计算方法「建议收藏」分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:http://bianchenghao.cn/75766.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注