首页 > 编程知识 正文

积分复合函数的求导,微积分求导公式大全

时间:2023-05-05 07:54:16 阅读:49445 作者:3588

全文为3893字,预计学习时间为10分钟

图片来源: unsplash

在就业市场上,机器学习工程师总是受到质疑,人们不相信他们的数学基础很深。 实际上,所有机器学习算法的本质都是数学问题,支持向量机、主成分分析、神经网络最终都归结为对偶优化、频谱分解筛选、连续非线性函数组合等数学问题。 只有彻底理解数学,才能真正掌握这些机器学习算法。

Python的各种数据库有助于使用高级算法执行简单的步骤。 例如,机器学习算法库Scikit-learn (包括诸如k近邻算法、k均值、决策树等算法)或Keras知道卷积神经网络CNNs和循环神经网络RNNs的后面的细节

但是,成为一名优秀的机器学习工程师需要的不仅仅是这些。 在面试中,面试官通常会问k近邻算法、如何从零实现决策树、如何推导线性回归、softmax反向传播方程的矩阵闭式解等问题。

本文回顾了微积分的基本概念,有助于为一元和多元函数的导数、梯度、雅可比矩阵、调和镜矩阵等面试做准备。 同时,本文也能为你深入研究机器学习,特别是神经网络背后的数学运算奠定良好的基础。 这些概念由五个导数公式给出,绝对是面试的必需干货。

导数1:复合指数函数

指数函数非常基础、常见,也非常有用。 这是标准的正函数。 实数中为e0,但同时指数函数具有e=1的重要性质。

另外,指数函数和对数函数互为反函数。 指数函数也是最容易求导的函数之一。 因为指数函数的导数本身,即(e )’=e。 如果将指数和其他函数组合起来形成复合函数,复合函数的导数会更复杂。 在这种情况下,应该根据链式法则求出推导,f(g(x ) )的导数为f ) ) g ) x ),即:

利用链式法则,可以计算出f(x )=e的导数。 首先求出g(x )=x的导数。 g(x )’=2x。 指数函数的导数就是它本身。 (e )’=e。 将这两个导数相乘,得到复合函数f(x )=e的导数。

这是一个非常简单的例子,乍一看可能无所谓,但在面试开始之前经常被面试官用来测试面试者的能力。 如果你很久没有复习过导数,很难迅速应对这些简单的问题。 它不一定能给你这份工作,但如果连这么基本的问题都回答不上,你一定会失去这份工作。

导数2:底数为变量的复变指数

复指数函数是经典的面试问题,特别是在计量金融领域,比起科技公司招聘机器学习职位,更重视数学技能。 复指数函数迫使面试者离开舒适的区域。 但实际上,这个问题最难的部分是如何找到正确的方向。

当函数接近指数函数时,首先最重要的是意识到指数函数和对数函数彼此是反函数。 然后,每个指数函数可以转换为自然指数函数的形式。

在推导复指数函数f(x )=x之前,必须用简单的指数函数f(x )=2证明复函数的性质。 先用上述方程将2变换为exp(XLN )2) ),然后用链式法则求出推导。

返回原始函数f(x )=x。 如果将其转换为f(x )=exp ) xlnx ),则求解变得比较简单。 唯一困难的部分可能是通过连锁法则寻求指引这一步骤。

请注意,在此使用乘积定律(uv )=u ) vUV )求出指数XLN ) x )的导数。

通常,面试官会提到

问这个函数时不会告诉你函数定义域。如果面试官没有给定函数定义域,他可能是想测试一下你的数学敏锐度。这便是这个问题具有欺骗性的地方。没有限定定义域,xˣ既可以为正也可以为负。当x为负时,如(-0.9)^(-0.9),结果为复数-1.05–0.34i。

 

一种解决方法是将该函数的定义域限定为ℤ⁻ ∪ ℝ⁺ ,但对于负数来说,函数依然不可微。因此,为了正确推导出复变指数函数xˣ的导数,只需要把该函数的定义域严格限定为正数即可。排除0是因为此时导数也为0,左右导数需相等,但在这种情况下,此条件是不成立的。因为左极限是没有定义的,函数在0处不可微,因此函数的定义域只能限定为正数。

 

 

在继续以下内容之前,先考考你,这里有一个比复变指数函数f(x) = xˣ更高级的函数f(x) = xˣ²。如果你理解了第一个例子背后的逻辑和步骤,再加一个指数应该毫无难度,可以推导出以下结果:

 

 

导数3:多元输入函数的梯度

 

 

到目前为止,前面讨论的函数导数都是从ℝ映射到ℝ的函数,即函数的定义域和值域都是实数。但机器学习本质上是矢量的,函数也是多元的。

 

下面这个例子最能阐释这种多元性:当神经网络的输入层大小为m和输出层大小为k时,即f(x) = g(Wᵀx + b),此函数是线性映射Wᵀx(权阵W和输入向量x)和非线性映射g(激活函数)按元素组成的。一般情况下,该函数也可视作是从ℝᵐ到ℝᵏ的映射。

 

我们把k=1时的导数称为梯度。现在来计算以下从ℝ³映射到ℝ的三元函数:

 

 

可以把f看作是一个函数,它从大小为3的向量映射到大小为1的向量。

 

图源:unsplash

多元输入函数的导数被称为梯度,用倒三角符号∇(英文为nabla)表示。从ℝⁿ映射到ℝ的函数g的梯度是n个偏导数的集合,每个偏导数都是一个n元函数。因此,如果g是一个从ℝⁿ到ℝ的映射,其梯度∇g是一个从ℝⁿ到ℝⁿ的映射。

 

要推导出函数f(x,y,z) = 2ˣʸ + zcos(x)的梯度,需要构造一个矢量的偏导数:∂f/∂x,∂f/∂y和∂f/∂z,结果如下:

 

需要注意,此处也需要利用公式进行等值转化,即2ˣʸ=exp(xy ln(2))。

 

总之,对于一个从ℝ³映射到 ℝ的三元函数f,其导数是一个从ℝ³映射到ℝ³的梯度∇ f。从ℝᵐ映射到ℝᵏ(k > 1)的一般式中,一个从ℝᵐ映射到ℝᵏ的多元函数的导数是一个雅可比矩阵,而非一个梯度向量。

 

导数4:多元输入输出函数的雅可比矩阵

 

 

上一节中已经提到从ℝᵐ映射到ℝ的函数的导数,是一个从ℝᵐ映射到ℝᵐ的梯度。但如果输出域也是多元的,即从ℝᵐ映射到ℝᵏ(k > 1),那又当如何?

 

这种情况下,导数为雅可比矩阵。可以把梯度简单视为一个m x 1的特殊雅可比矩阵,此时m与变量个数相等。雅可比矩阵J(g)是一个从ℝᵐ到ℝᵏ*ᵐ的映射,其中函数g从ℝᵐ映射到ℝᵏ。这也就是说输出域的维数是k x m,即为一个k x m矩阵。换言之,在雅可比矩阵J(g)中,第i行表示函数gᵢ的梯度∇ gᵢ。

 

假设上述函数f(x, y) = [2x², x √y]从ℝ²映射到ℝ²,通过推导该函数的导数可以发现函数的输入和输出域都是多元的。在这种情况下,由于平方根函数在负数上没有定义,需要把y的定义域限定为ℝ⁺。输出雅可比矩阵的第一行就是函数1的导数,即∇ 2x²;第二行为函数2的导数,即∇ x √y。

 

 

雅可比矩阵在深度学习中的可解释性领域中有一个有趣用例,目的是为了理解神经网络的行为,并分析神经网络的输出层对输入的灵敏度。

 

雅可比矩阵有助于研究输入空间的变化对输出的影响,还可以用于理解神经网络中间层的概念。总之需要记住梯度是标量对向量的导数,雅可比矩阵是一个向量对另一个向量的导数。

 

导数5:多元输入函数的和谐的镜子矩阵

 

 

目前仅讨论了一阶导数求导,但在神经网络中,会经常讨论多元函数的高阶导数。其中一种特殊情况就是二阶导数,也被称为和谐的镜子矩阵,用H(f)或∇ ²(微分算符的平方)表示。从ℝⁿ映射到ℝ的函数g的和谐的镜子矩阵是从ℝⁿ到ℝⁿ*ⁿ的映射H(g)。

 

现在分析一下我们是如何将输出域从ℝ转化为ℝⁿ*ⁿ。一阶导数,即梯度∇g,是一个从ℝⁿ到ℝⁿ的映射,其导数是一个雅可比矩阵。因此,每一个子函数的导数∇gᵢ都由n个从ℝⁿ映射到ℝⁿ的函数组成。可以这样想,就好比是对展开成一个向量的梯度向量的每个元素都求导,从而变成向量中的向量,即为一个矩阵。

 

要计算和谐的镜子矩阵,需要计算交叉导数,即先对x求导,再对y求导,反过来也可以。求交叉导数的顺序会不会影响结果,换句话说,和谐的镜子矩阵是否对称。在这种情况下,函数f为二次连续可微函数(用符号????²表示),施瓦兹定理表明交叉导数是相等的,因此和谐的镜子矩阵是对称的。一些不连续但可微的函数,不满足交叉导数等式。

 

构造函数的和谐的镜子矩阵就相当于求一个标量函数的二阶偏导数。以f(x,y) = x²y³为例,计算结果如下:

 

 

可以看到交叉导数6xy²实际上是相等的。先对x求导得到关于x的偏导数2xy³,再对y求导得到关于y的偏导数6xy²。对于x或y的每个一元子函数,对角元素都为fᵢ。

 

此类函数的拓展部分将讨论从ℝᵐ映射到ℝᵏ的多元函数的二阶导数的情况,可以将其视为一个二阶雅可比矩阵。这是一个从ℝᵐ到ℝᵏ*ᵐ*ᵐ的映射,即一个三维张量。与和谐的镜子矩阵相似,为了求出雅可比矩阵的梯度(求二阶微分),要对k x m矩阵的每一个元素微分,得到一个向量矩阵,即为一个张量。虽然不太可能要求面试者进行手动计算,但了解多元函数的高阶导数相当重要。

 

图源:unsplash

本文回顾了机器学习背后重要的微积分基础知识,列举了几个一元和多元函数的例子,讨论了梯度、雅可比矩阵和和谐的镜子矩阵,全面梳理了机器学习面试中可能出现的概念和涉及的微积分知识,希望你能面试顺利!


推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:mgdhm、热情的芒果

相关链接:

https://towardsdatascience.com/5-derivatives-to-excel-in-your-machine-learning-interview-25601c3ba9fc

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。