首页 > 编程知识 正文

数据挖掘的实例(数据挖掘感想)

时间:2023-05-06 02:58:42 阅读:86124 作者:4872

回归分析介绍

回归分析通常是指使用一个或多个输入x (称为自变量、解释变量或预测变量)预测输出y )的因变量、响应变量或结果变量的方法

连续型变量:人的身高、每天的运动时间数等

类别类型变量:

无序类别变量:如性别、职业

秩序变量:例如运动强度(低、中、高)、成绩)优、良、中、差) ) ) ) ) ) ) ) )。

回归模型

简单线性回归

使用连续型的说明变量预测连续型的响应变量

例如,通过广告投入金额预测销售额

销售额=b a*广告投入

使用

简单多项式回归

连续型的说明变量预测连续型的响应变量。 模型的关系是n次多项式

例如,通过广告投入金额预测销售额

销售额=b a1*广告投入a2*广告投入^2

用两个以上连续型的解释变量预测

多元线性回归

连续型的响应变量

例如,使用风速和当天的照射值来预测太阳能发电站的发电效率PR

发电效率PR=b a1*风速a2*当天照射值

PR的多元回归曲面图

用两个以上的连续型解释变量预测

多元多项式回归

连续型的响应变量。 模型的关系是n次多项式和交叉乘积项

例如,通过广告投入额和研发投入额来预测销售额

销售额=b a1*广告投入a2*研发投入a11*广告投入^2 a22*研发投入^2 a12*广告投入*研发投入

010 -使用1010个以上的解释变量预测多个响应变量

010 -使用1010个以上的说明变量预测一个类别类型的响应变量

注意: Logistic回归的解释变量可以是连续型变量也可以是类别型变量; 响应变量是类别类型变量

例如,广告点击率推断问题(二分类问题)图像识别问题)多分类问题)

多变量回归

使用一个或多个说明变量来预测表示度数的变量

Logistic逻辑回归

使用一个或多个描述变量预测一个事件(死亡、失败或旧病复发)发生的时间

回归模型总结

参考文献

03010机器人I.kaba coff

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。