首页 > 编程知识 正文

线性回归数据分析(线性回归r方多少合适)

时间:2023-05-05 07:43:37 阅读:95602 作者:371

大家做分析最多的还是线性回归,很多人咨询的是线性回归的问题,今天专门发了线性回归的文章。

在r语言中,可以使用基本包中的lm方法进行线性回归。 参数的表示形式也与数学方程式相同,为Y~X X2,但只是将等号替换为~。 我们用summary返回对象就能得到回归结果。 如果要看模型的残差,直接$resid就可以了。

我还是给大家写一个活生生的例子吧:

实例描述:

我们有如图所示的数据集。 我想通过回归分析建立month,spend对sales的关系。

首先读取数据集(请通过私信“数据链接”获取),然后规定数据的属性。

dataset=read.CSV (数据营销-预算- 12mo.CSV )、头=t、

colclasses=c('numeric ',' numeric ',' numeric ' ) )

简单线性回归和多元线性回归

在我们的例子中,变量是销售,所以如果只利用一个参数(如spend )进行预测,就意味着我用两个以上的自变量进行预测是多元线性回归,方法很简单:

simple.fit=lm (销售到速度,数据=数据) )。

摘要(简单. fit ) )。

multi.fit=lm (销售~速度监视器,数据=数据) )。

将summary(multi.fit )的两个模型的输出粘贴如下。

关于模型,首先应该看到整个模型的显性化。 也就是说,模型的f检查表明这两个模型都有意义。 接着,看看r侧和调整后的r侧,就会发现模特贼很好。 然后,让我们来看看各个变量的显性化。

输出结果的解释

首先有residuals。

residuals 3360 thesectionsummarizestheresiduals,theerrorbetweenthepredictionofthemodelandtheactualresults.smalleresidualsalts

然后是coefficients:

oefficients 3360 Foreachvariableandtheintercept,Aweightisproducedandthatweighthasotherattributeslikethestandarderror, a t-test value and significance .这是模型自变量的系数,该系数还包括四个部分,分别为estimate、std、t和p

estimate 3360 thisistheweightgiventothevariable.inthesimpleregressioncase (OnevariablePlustheintercept ),Foreveryonedolariarice themodelpredictsanincreaseof $ 10.6222.estimate解释说,对应的自变量改变1个单位,应变量的变化量。 Std. Error是其标准错误,t value是验证系数有效性的t统计量,pr(|t|)是p值,pr )|t|) )可以知道该系数是否不为0。

也有模型整体性能的指标。

residualstandarderror 3360 thisisthestandarddeviationoftheresiduals.smallerisbetter .这是残差变异,越小越好。

多功能/调节四方形:可移动, thedistinctiondoesn’treallymatter.r-squaredshowstheamountofvarianceexplainedbythemodel.adjusted r-squaretakesintoacococon ultiple-regression .然后是r侧和调整后的r侧,r侧是该模型可以解释的变异比例,调整后的r侧考虑了自变量的个数。 如果我们进行简单的线性回归的话,r侧和调整的r侧是一样的。

还有模型表示的F-Statistic :

p>F-Statistic: The F-test checks if at least one variable’s weight is significantly different than zero. This is a global test to help asses a model. If the p-value is not significant (e.g. greater than 0.05) than your model is essentially not doing anything.

F统计量是来看整个模型是不是有意义的,如果模型整体没意义相应的别的系数也就不用看了。

残差相关知识

对于线性模型我们有四个假设:

The mean of the errors is zero (and the sum of the errors is zero)(线性)The distribution of the errors are normal.(正态)All of the errors are independent.(独立)Variance of errors is constant (Homoscedastic)(qpdsl)

我们的模型满不满足这4个假设呢?我先画图看看:

layout(matrix(c(1,1,2,3),2,2,byrow=T)) plot(simple.fit$resid~dataset$Spend[order(dataset$Spend)], main=" 简单线性回归的自变量和残差变化", xlab="Marketing Spend", ylab="Residuals") abline(h=0,lty=2) hist(simple.fit$resid, main="残差的直方图", ylab="Residuals") qqnorm(simple.fit$resid) qqline(simple.fit$resid)

残差是否正态?

我们可以从两个图中来判断残差是否正态:

If the histogram looks like a bell-curve it might be normally distributed.If the QQ-plot has the vast majority of points on or very near the line, the residuals may be normally distributed.

首先是直方图,直方图是近似钟形的就为正态,QQ图中的点都和线靠得近就为正态。

但是我们数据量太少,看图似乎看不出来,我们考虑做个统计检验:

library(fBasics) jarqueberaTest(simple.fit$resid)

检验结果告诉我们残差确实是正态的。

残差是否独立?

残差独立的意思就是残差之间不存在相关性,我们也需要做统计检验:

library(lmtest) #dwtest dwtest(simple.fit)

检验结果告诉我们残差的自相关很大。

残差是否齐?

对于这个假设,通常情况下我们也是看残差图,如果残差图没有明显的离群值我们就可以认为残差是齐的。

小结

今天给大家比较详细的写了一般线性回归和多元线性回归的做法和解释以及相应的模型评价。感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,请关注后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议。

如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何问题,都可以联系我。因为我可以给您提供好的,详细和耐心的数据分析服务。

如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节,量表信效度等等统计技巧有任何问题,请私信我,获取详细和耐心的指导。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

猜你喜欢:

R数据分析:逻辑斯蒂回归与泊松回归

机器学习:逻辑回归分类器(一)

R数据分析:多分类逻辑回归

R数据分析:多元逻辑斯蒂回归的做法

R数据分析:线性回归的做法和优化实例

R数据分析:如何做逻辑斯蒂回归

python机器学习:线性回归中的哑变量转换

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。