首页 > 编程知识 正文

梯度等于方向导数,梯度下降法数学推导

时间:2023-05-06 10:02:07 阅读:270677 作者:2145

预备知识点:斜率与变化率 方向导数 梯度 总结 1.预备知识点:斜率与变化率

斜率: 数学、几何学名词,是表示一条直线(或曲线的切线)关于横坐标轴倾斜程度的量。它通常用直线(或曲线的切线)与横坐标轴夹角的正切,或两点的纵坐标之差与横坐标之差的比来表示。
变化率:平均变化率,是y的增量与x的增量的比

变化率与斜率的概念、区别与联系

变化率:某曲线等由一点到另一点的变化率。斜率:表示一条直线相对于横坐标轴的倾斜程度。区别:变化率可以表示曲线·直线·物质转化等从一点到另一点的变化值;而斜率只能表示直线的倾斜度。相同点:两则都能表示变化的大小

2.方向导数 第一要明确一点:二元函数 Z = f(x,y) 的图像是一个三维空间的曲面,如下图:


每一座大山的表面可以看成是一个三维空间的曲面,刚好可以对应一个特定的二元函数,注意这里说的是大山的表面,之所以用大山来举例子,是为了方面下面说明梯度下降算法。梯度和方向导数紧密相关,让我们从方向导数开始。

方向导数:顾名思义,方向导数就是某个方向上的导数(也可以理解成某个方向上函数的变化率)。那么这里说的方向是什么?下面用图片结合文字来说明:

函数z = f(x,y) 在这个方向上的图像为下图所示:

我们知道在一元函数中,假设A点有导数,那么A点的导数就是A点的斜率。如下图:

那么对于二元函数z = f(x,y)在某一点(假设为A点)在这个方向上也是有切线的,其切线的斜率就是方向导数注意区分方向 、在该方向上的切线也就是在该方向上斜率(方向导数)这两个概念

显然,A 点不止一个方向,而是360度都有方向:

假设该二元函数可全微分(),则每个方向都是有方向导数的:

3.梯度

那么有个问题:在二元函数某一点的所有方向导数中,那个方向导数最大(函数变化率最大)呢?这就引出了梯度的定义。梯度:是一个矢量,梯度方向上的方向导数达到最大值,方向导数的最大值就是梯度的模。 也就是说本质上梯度就是前面说的一个方向(矢量)。只是在该方向上,方向导数的值最大;并且方向导数的最大值就等于梯度的模。数学定义如下:

补充:可微分意味着该二元函数z = f(x,y)在某一点处各个方向的切线都在同一个平面上,也就是切平面:注意是说切线(所有的方向导数在同一平面内)而不是方向

4.总结

到此已经把方向导数和梯度介绍了一下,总的来说有几个概念再强调一下:

方向:对于多元函数在求偏导数的时候有分别对x、y求偏导。在函数图像上则是对应某点沿着x、y方向的斜率(切线),单独对x或者y求偏导数,与一元函数的导数几何意义一样(斜率);但是多元函数中的某一点除了x、y两个方向还可以沿着其他方向发生变化(想象自己站在山顶上,原地可以旋转360°,除了x、y方向,其他的方向还有无数)。是在一个二维平面内的方向,这就是前面提到的不同方向。方向导数:对于一个多元函数(以二元为例,二元函数图像为三维空间曲面),对于二元函数上的某一个点,以这个点为起点,任意选择一个方向,在这个方向上,该点对应的切线就是方向导数,若函数可全微分(一阶连续可偏导),则在该点处有无数个方向,也就是有无数个方向导数。梯度:本质上就是一个方向导数的方向(矢量)。但是在梯度方向上对应的方向导数有最大值。梯度方向:注意梯度方向上面提到的方向的概念是不同的,以二元函数z = f(x,y)为例,方向是指xoy平面的某一个向量;而对于梯度方向则是在三维空间里,某点方向导数达到最大值对应的方向(某点变化率最大的切线的斜率方向)梯度计算:本质上就是求偏导数。在梯度方向的方向导数使函数增加最快,则负梯度方向下降减少的最快。 图片引用:知乎

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。