首页 > 编程知识 正文

用excel做二元线性回归分析,用excel计算二元线性回归方程

时间:2023-05-05 20:02:58 阅读:190380 作者:537

Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。

本文主要介绍:

Excel数据分析工具库——回归线性回归和非线性回归简单线性回归和多重线性回归逻辑回归一、什么是回归分析(Regression)

1、定义

确定两个或多个变量之间相关关系的统计分析方法。 通过对数据之间相关性分析的研究,进而建立自变量(I=1,2,3,……)与因子y之间的回归函数关系,即回归分析模型,预测数据的发展趋势。

2、分类

根据涉及变量的多少,可分为一元回归和多元回归分析; 根据变量的数量,可以分为简单回归分析和多元回归分析; 根据自变量与因子之间的关系类型,可分为线性回归分析和非线性回归分析。二、线性回归

1、简单线性回归

简单线性回归也称为线性回归,回归模型只有一个自变量和一个因变量,回归方程可以表示为

其中,y是因数变量,x是自变量,a是常数,b是斜率,

2、最小二乘法:

如何确定参数a和b,用最小二乘法实现。 通过最小化误差的平方和并寻找数据的最佳函数匹配,观测点和估计点的距离的平方和也可以最小化。

3、线性回归分析步骤:

确定自变量和因变量并绘制散点图,确定回归模型类型估计模型参数,建立回归模型。 使用基于最小二乘法的模型参数估计回归模型的验证回归模型的预测4、多重线性回归

定义:一个因变量和多个自变量的线性回归问题是一元线性回归的推广。 其回归方程可以写成如下

多重线性回归方程中回归系数的估计也使用最小二乘法

三、用Excel做回归分析

讨论销售额y和推广费X1的关系,数据如下

首先,用数据分析—相关系数分析计算自变量和因子之间的相关系数,为0.95157,具有较强的相关性。

散点图如下所示。

其次,利用数据分析库的回归进行了分析

请注意y值和x值的输入区域。 x值为自变量,y为因变量。

四、线性回归方程的检验

评价回归拟合程度好坏(重要):

1、从回归统计表来看,Multiple R即相关系数r的值与我们以前进行相关分析得到的值相同,大于0.8时呈强正相关。

2、回归统计表中的R Square为r平方,r平方为r平方,也称为判定系数、拟合优度,取值范围为[ 0,1 ],r平方值越大表示模型拟合越好。 一般来说,如果大于70%,则可以很好地拟合;如果小于60%,则需要修改模型。 这个案例中r平方0.9054,相当好。

3、Adjusted R是调整后的r端,该值用于纠正自变量个数增加导致模型拟合效果过高的情况,多用于测量多元线性回归。

4、第二张表,方差分析表,df为自由度,SS为平方和,MS为均方根,f为f统计量,Significance F为整个回归方程的显著性检验,其中我们主要关注的是f检验的结果,即significance值。 F检验主要是检验因变量与自变量之间的线性关系是否显著,在线性模型描述他们之间关系的这一案例中F值较小,表明因变量与自变量之间存在显著性。

5、残差是实际值与预测值之差,残差图用于回归诊断,回归模型理想条件下残差图服从正态分布。

6、第三张表关注P-value,即p值,检验回归方程系数的显著性。 另外,被称为t检验。 t检验看p值,为显著性水平(常用值0.01或0.05 )下的f阈值,一般以此测定检验结果是否具有显著性,p值0.05,则结果无显著统计学意义,0.05

从第7、3张表的第1列可以得到这个回归模型的方程式。 y=4361.486 1.198017x,然后对于每个输入的参数x,可以根据此回归方程预测因变量y。

这里简单总结了一下什么是回归分析,如何用excel做线性回归分析,以及如何评价回归方程拟合程度的好坏。入门很简单,精通还很遥远,我们都在学习中。

注:本文首发于CSDN@文章属原创,转载请联系作者@作者:虾壳,在数据分析的道路上努力奔跑@微信公众号:可乐的数据分析之路

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。