这是《机器学习中的数学基础》系列的第四篇文章。
在上一篇文章中,我们了解到矩阵实际上是一个线性变换,矩阵的每一列都是从原始基向量变换而来的。在此基础上,如果把两个矩阵放在一起,也就是说让两个矩阵相乘,意味着什么?
矩阵乘法让我们从矩阵和向量的乘法开始:
将矩阵乘以一个向量,得到一个新向量。如果我们把新向量乘以一个矩阵呢?获取另一个向量:
将等式(1)代入等式(2),得到:
我们已经知道矩阵是线性变换。从上面的公式可以看出,两个矩阵的相乘相当于连续的两次线性变换,作用是把一个旧的向量变成一个新的向量。我们不禁要想,一定有一个复合矩阵,它的作用等于两个矩阵相乘。公式是:
显然,我们要找的复合矩阵是两个矩阵的乘积:
有了这个想法,如何计算复合矩阵?别担心,让我们从基地的角度来解决这个问题。
公式[a,b;c,d]由原来的基向量I和j变换而来,我们把它看作新的基(a,c)和(b,d)。然后新的基数乘以矩阵[i,j;什么意思?这相当于分别对新的基进行另一次线性变换。因此,复合基质相当于:
复合矩阵的第一列是矩阵[i,j;k,l]与向量(a,c)的乘积;复合矩阵的第二列是矩阵[i,j;k,l]和向量(b,d)的乘积。扩展上述公式,得到复合矩阵,如下所示:
这是矩阵乘法的定义,我们从另一个角度来理解它的内涵。
行列式接下来,我们来看看矩阵行列式的几何意义。让我们从这里的结论开始。行列式是线性变换前后面积的比例因子。这到底是怎么回事?我们来看看下图:
如图所示,它是由我们的I和J基向量包围的区域。现在我们用矩阵[2,0;0,2],看看发生了什么变化:
从上图可以很容易地看出,在矩阵的作用下,I是翻倍的,J是翻倍的,所以新的基向量包围的面积是四倍。
因此,矩阵[2,0;0,2]等于4。
哦,也许你还是不明白。没关系。我们把它推广一下,看看行列式公式是怎么来的。二维矩阵行列式的公式如下:
我们用det()来表示矩阵的行列式。上面的公式是怎么来的?让我们画一幅画:
如图所示,OA是新的基向量(a,c),OC是基向量(b,d)。那么平行四边形OABC就是被两个新的基向量包围的区域。这个面积怎么算?我们可以把它做成长方形,如下图所示:
不难看出,平行四边形的面积等于矩形的面积减去角的面积。矩形的面积是(a b)(c d)。角区由四个三角形和两个小矩形组成,它们的面积为:ac bd 2bc。然后用矩形的面积减去角的面积,就是平行四边形的面积:
(a b)(c d)-(AC BD 2bc)=AC BC ad BD-AC-BD-2bc=ad-BC
而ad-bc就是上面公式的最终结果。
你明白我今天分享的内容吗?欢迎留言讨论。