首页 > 编程知识 正文

nor是什么意思,fm和uhf区别

时间:2023-05-03 21:23:29 阅读:30550 作者:2649

LR :

好处:

不错的baseline,效果很好。 当然有效果,所以后续版本要超过那个,真的很难。 实现简单,有开源工具可以直接用于训练,在线代码也很容易写

缺点:由于是线性模型,有选择交叉特征的工作,相应地会消耗大量的劳力,但往往没有效果。 一般是wrapper方法的选择,每一轮都可以进行时间级运算,理论上2^n轮() n是特征数),但离线分析指标和在线效果不一定有很强的相关性,所以分析更痛苦更糟的是,点击率估计的数据变化比较大,离线选择的特征、参数不一定适用于将来。 广告网站对点击率有决定性影响,因此大多数特征在广告网站之间交叉,无法共享广告网站之间的信息。 例如,如果广告网站a在广告网站x上的点击率很高,但广告网站y上没有曝光,对于广告网站y来说,广告网站a是全新的广告。 实际上,交叉特性可能会导致模型非常大。 虽然也使用了FTRL,但实际上无法有效生成稀疏模型。 如果模型非常大,同步模型就会变慢,同样会对效果产生很大的影响。 在线预测时,许多特征与广告ID交叉,因此在线组装的特征成本高,性能也可能成为问题。 调频:

好处

可以自动学习两个特征之间的关系,减少交叉特征的部分选择工作,参数也不太多,调整不太辛苦。 由于不需要输入那么多交叉特征,所以生成的模型相对于LR的模型要小很多。 在线计算减少了交叉特征的组装,在线计算的速度与LR大致相同(虽然在两个向量的点积的计算中计算量看起来是数倍)。

缺点是不能学习三个以上特征之间的关系,交叉特征选择的工作仍然是不可避免的。 从原理上看,调频的学习能力似乎更高,但从实践上看,超过LR的效果也是实力(运气? )从功利的角度看,调频很不值得尝试。 它的工作量不比神经网络小多少。 在不需要深度学习而对机器一无所知的环境中,使用调频算法,获得的资源、支持和收获,远远比不上神经网络,所以完成局域网后,最好直接换成神经网络不要调频了。 由于特征之间实际上是通过联系在一起的,因此FM基于LR引入组合特征,在组合特征、组合特征的参数估计中引入辅助(隐)向量,辅助(隐)向量的维-K值反映了FM模型的表达能力

扩展:调频进程:

公式如下。

1 .查找交叉项目:

上述公式排除了自身的组合,即,xi的平方,乘以1/2的目的是去除诸如xij和xji之类的重复项。

2 .求权重

用梯度下降法对特征(输入项)的导数求损耗函数计算梯度,更新权重。 以m为样本个数为权重。

在回归问题的情况下,损耗函数通常是均方误差(MSE ),即最大的dddkf次幂。

因此,回归问题相对于损失函数权重的梯度(导数)如下。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。