机器学习中的矩阵向量求导,机器矩阵与向量求导教学

在机器学习中矩阵向量求导(一)求导定义和求导布局中，讨论了向量矩阵求导的9种定义和求导布局的概念。今天我们讨论其中标量对矢量求导、标量对矩阵求导、矢量对矢量求导三个场景的基本求导思路。

本文中标量对矢量或矩阵的导出，如前所述，将分母的布局作为默认布局。引导向量，以分子布局为既定布局。如果其他文章的引导结果与正文不同，请先确认使用的引导布局是否相同。此外，由于机器学习中很少有向量和矩阵引导标量的情况，所以本系列不单独讨论这两个导出过程。

1 .用定义法求解标量对矢量求导标量对矢量求导。严格来说是实数函数对矢量的求导。即，定义了实数函数f:RnRf:RnR，并且自变量xx是n维向量，并且输出yy是标量。对于给定的实数函数，如何求解yxyx呢？

首先，考虑了根据矩阵求导的定义进行。标量对矢量的求导，实际上是标量对矢量中的各成分分别求导，最后将求导的结果并列用一个矢量表示。那么，可以将实数函数引导到向量的每个分量，最后找到规律，得到引导的结果向量。

我们先来看一个简单的例子。 y=aTxy=aTx，求解atxxatxx

根据定义，首先对xx的第I个分量进行求导。这是标量对标量的引导，如下所示。

at XXI=j=1najxjxi=aixixi=aiatxxi=j=