首页 > 编程知识 正文

曲线识别算法

时间:2023-05-04 23:45:48 阅读:258878 作者:4400


学习曲线用于检验你的学习算法是否运行正常(即是否处于高偏差或高方差,或二者均有),或者你想改进你的学习算法。
在这里插入图片描述

从图像分析::交叉验证集误差曲线和训练集误差曲线很快就接近平稳,且稳定在一个较高的水平。
这里出现高偏差,是由于参数过少(项数太少),而训练数据量又太大了。
当出现高偏差时,即使增加训练数据也不会有太大作用。

从图像分析:交叉验证集误差曲线比训练集误差曲线高很多,但交叉验证集误差曲线能一直降低。
上图出现高方差是由于项数过多(即参数过多,)而正则化参数过小,而导致。而当出现高方差时,增加训练数据是能减小误差的。
总结:假设函数的项数(即参数个数,也即是特征个数)和正则化参数都能影响高偏差和高方差的出现。

正则化参数越大,对参数θ(i)的约束能力就越强,那么参数θ(i)就越接近0,整个图像就越接近一条直线,出现欠拟合。
在高阶多项式中,正则化参数越小,对参数θ(i)的约束能力就越弱,相当于没有,拟合能力过强,泛化能力差,出现欠拟合。

选择神经网络的层数方法:
将数据分成训练集,验证集,测试集,然后在一次训练出含不同隐藏层数的神经网络模型,然后在有验证集检验哪个的误差更小,选择最优的那个。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。