我试图用coef打印VIF (方差膨胀系数)。 但是,似乎找不到来自statsmodels的说明如何实现这一点的文档。 我有一个要处理的n个变量的模型。 所有变量的多重共线性值都无助于删除共线性度最高的值。 在
这看起来像是答案
但是你怎么在这个工作簿上运行那个呢? 在
接下来是代码和摘要输出。 这也是我现在所在的地方。 在import pandas as pd上
import matplotlib.pyplot as plt
importstatsmodels.formula.apiassmf
#读数据输入数据帧
DATA=PD.read_CSV(somepath ),index_col=0) ) ) ) ) ) )。
print(data.head ) )
#multiregression
lm=smf.ols (formula=' sales~TV radio newspaper ',data=data ).fit ) ) ) ) ) ) )。
print(lm.summary ) )
OLS Regression Results
=========================================================================================
dep.variable : salesr-squared :897
model : olsa DJ.r-squared :896
method :学习质量-静态3360570.3
Date: Wed,15 feb 2017静态处理器(f-statistic ) : 1.58e-96
time :1:28336029 log-likelihood :-386.18
no.observations 3360200 AIC :780.4
df residuals :196 BIC :793.6
Df Model: 3
co variance type :否robust
=========================================================================================
coefstderrtp|t|[ 95.0 % conf.int.]
请参见----------------------------------------- -
intercept 2.93890.3129.4220.0002.3243.554
TV 0.04580.00132.8090.000.0430.049
radio 0.18850.00921.8930.000.1720.206
newspaper-0.0010.006-0.1770.860-0.0130.011
=========================================================================================
omnibus :60.414 durbin-Watson :2.084
prob(Omnibus ) :000 jar que-bera (JB ) : 151.241
skew:-1.327prob(JB ) : 1.44e-33
Kurtosis: 6.332 Cond. No. 454。
=========================================================================================