随着互联网的发展,大数据分析算法使许多企业在用户分析方面取得了重大突破。 今天,让我们来看看数据分析领域常见的算法。
1 .线性回归
线性回归可能是统计学和机器学习中有名且容易理解的算法之一。
预测建模主要关注小型化模型的误差,或者以可解释性为代价进行准确的预测。 我们从很多不同的领域借用、重用和盗用算法。 其中包括统计学知识。
线性回归由等式表示,通过找到输入变量的特定权重(b )来描述输入变量(x )和输出变量(y )之间的线性关系。
2 .物流回归
物流回归是机器学习可以从统计领域借鉴的另一项技术。 这是二分类问题的专用方法(两个类值的问题)。
逻辑回归与线性回归类似。 这是因为两者的目标都是找出每个输入变量的权重。 与线性回归不同,输出的预测值得使用被称为逻辑函数的非线性函数进行变换。
逻辑函数看起来像一个大s,可以将任何值转换为0到1的范围。 这很有用,因为它可以将适当的规则应用于逻辑函数的输出,将值分为0和1 (例如,如果IF小于0.5,则输出1 ),并预测类值。
3 .线性判别分析
传统的物流回归仅限于二分类问题。 如果有两个或多个类,则线性判别分析算法(LinearDiscriminantAnalysis,简称LDA )是选定的线性分类技术。
LDA的显示非常简单。 它由你数据的统计属性组成,按类别计算。 对于单个输入变量,这包括:
每个班的平均值。
跨所有类别计算的方差。
4 .分类和回归树
决策树是机器学习的重要算法。
决策树可以用二叉树表示。 是的,来自算法和数据结构的二叉树。 没什么特别的。 每个节点表示一个输入变量(x )和该变量上的左、右子项(假设变量为数字)。
5 .朴素贝叶斯
朴素贝叶斯是一种简单但非常强大的预测建模算法。
这个模型由两种概率组成,可以根据你的训练数据直接计算。 1 )各类概率; 2 )给定各x值类别的有条件概率。 计算后,概率模型可以用于利用贝叶斯定理预测新数据。 通常,如果下一条标记的数据是数字,则假设sddxs分布(贝尔曲线),以便易于估计这些概率。
摘录:互联网大数据
【免责事项】本论文是来自本网络编辑部分的转载,转载目的是传递更多信息,并不意味着本网络赞同其观点,对真实性负责。 有关作品的内容、版权和其他问题,请在30天内与管理员联系。 修改或删除相关文章以保证客户的权利