首页 > 编程知识 正文

从事大数据需要学什么,大数据分析的常用算法

时间:2023-05-04 11:28:17 阅读:53492 作者:3044

随着互联网的发展,大数据分析算法使许多企业在用户分析方面取得了重大突破。 今天,让我们来看看数据分析领域常见的算法。

1 .线性回归

线性回归可能是统计学和机器学习中有名且容易理解的算法之一。

预测建模主要关注小型化模型的误差,或者以可解释性为代价进行准确的预测。 我们从很多不同的领域借用、重用和盗用算法。 其中包括统计学知识。

线性回归由等式表示,通过找到输入变量的特定权重(b )来描述输入变量(x )和输出变量(y )之间的线性关系。

2 .物流回归

物流回归是机器学习可以从统计领域借鉴的另一项技术。 这是二分类问题的专用方法(两个类值的问题)。

逻辑回归与线性回归类似。 这是因为两者的目标都是找出每个输入变量的权重。 与线性回归不同,输出的预测值得使用被称为逻辑函数的非线性函数进行变换。

逻辑函数看起来像一个大s,可以将任何值转换为0到1的范围。 这很有用,因为它可以将适当的规则应用于逻辑函数的输出,将值分为0和1 (例如,如果IF小于0.5,则输出1 ),并预测类值。

3 .线性判别分析

传统的物流回归仅限于二分类问题。 如果有两个或多个类,则线性判别分析算法(LinearDiscriminantAnalysis,简称LDA )是选定的线性分类技术。

LDA的显示非常简单。 它由你数据的统计属性组成,按类别计算。 对于单个输入变量,这包括:

每个班的平均值。

跨所有类别计算的方差。

4 .分类和回归树

决策树是机器学习的重要算法。

决策树可以用二叉树表示。 是的,来自算法和数据结构的二叉树。 没什么特别的。 每个节点表示一个输入变量(x )和该变量上的左、右子项(假设变量为数字)。

5 .朴素贝叶斯

朴素贝叶斯是一种简单但非常强大的预测建模算法。

这个模型由两种概率组成,可以根据你的训练数据直接计算。 1 )各类概率; 2 )给定各x值类别的有条件概率。 计算后,概率模型可以用于利用贝叶斯定理预测新数据。 通常,如果下一条标记的数据是数字,则假设sddxs分布(贝尔曲线),以便易于估计这些概率。

摘录:互联网大数据

【免责事项】本论文是来自本网络编辑部分的转载,转载目的是传递更多信息,并不意味着本网络赞同其观点,对真实性负责。 有关作品的内容、版权和其他问题,请在30天内与管理员联系。 修改或删除相关文章以保证客户的权利

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。