多重线性回归(Multiple Linear Regression):
研究一个因变量与多个自变量之间的线性关系的方法。
一元线性回归是特殊的多重线性回归,多重线性回归分析步骤和一元线性回归一样:
回归分析的步骤:
1.根据预测目标,确定自变量和因变量。
2.绘制散点图,确定回归模型类型。
3.估计模型参数,建立回归模型。
4.对回归模型进行检验。
回归方程的精度就是用来表示实际观测点和回归方程的拟合程度的指标,用调整判定系数来度量。
调整判定系数=ESS/TSS=1-(RSS/TSS)*(n-1/n-k-1)
其中:TSS:总离差平方和
ESS:回归平方和
RSS:残差平方和
n:样本个数
k:自变量个数
5.利用回归模型进行预测。
案例:现有10家已开店并营业的商店,有店铺面积、最近车站的距离及月营业额,现有一家新的店面,要求预测月营业额是多少
下面是分析过程:
第一步,根据预测目标,确定自变量和因变量。
因变量:月营业额
自变量:店铺面积、最近车站的距离。
代码演示:
第二步,绘制散点图,确定回归模型类型。
可以看出两个自变量都与因变量成较强相关性,因此可以采用多重线性回归模型来解决该问题:
结果如图所示:
可以看到店铺面积与月营业额成正相关,距离车站的距离与月营业额成负相关,三个变量都基本上呈正态分布,接下来我们可以用多重线性回归模型进行建模了。
代码和简单线性回归完全一样:
API小结:
矩阵数据绘制散点图:
pandas.tools.plotting.scatter_matrix(matrix,figsize,digonal)
matrix:矩阵
figsize:绘图尺寸
digonal:变量与本身之间的绘图函数kde为直方图。
---------------------
来源:CSDN
原文:
https://blog.csdn.net/weixin_42695959/article/details/84927799