【1】直接导入csv格式数据
in sheet用户名. CSV,清除
【2】变量长度的修正
格式版本2 g
【3】删除重复值
sort var1 var2
复制下拉变量1变量2,强制
【4】数据整合
use数据1,清除
merge m : m var1var 2使用数据2
下降if _合并==2
下降if _合并==1
下降合并
【5】生成一期滞后项
TS set STK光盘ACC per
gen newvarname=L.varname
【6】将文字转换为数字变量
genBigN=0
replacebign=1ifstrmatch (dad tunit,'普华永道* ' ) )。
【7】删除有缺失值的记录
egenmis=rowmiss(_all ) ) )。
多洛普国际米兰足球俱乐部
德罗普米斯
【8】行业划分
克隆太平洋2=Ind
顺序光盘每秒2次
replacesic2=substr (sic 2,1,1 ) ifsubstr ) sic 2,1,1 )!=“c”
replacesic2=substr (sic 2,1,2 ) ifsubstr ) sic 2,1,1 )="c "
平板sic 2交流电对
【9】日期只剩下年份
DOPifsubstr(reptdt,6,2 )!='12 '
replacereptdt=辅助滴管(再滴管,1,4 ) ) ) )。
gen ACC per=真实(复制滴滴涕)
【10】数据序列
分割日期,稀疏(-)删除器'-' ) )。
【11】求出两个日期之间的间隔天数
GTD=日期(贸易日期,' YMD ' ) ) ) ) ) ) ) ) ) ) ) ) ) )。
g=日期(事件日期,' YMD ' ) ) ) )。
表单TD % TD
g=乙太网络
【12】产生行业、年伪变量
第二年,第二年,第三年
tab产业、gen、产业
【13】对数据进行Winsorize处理
寻找it视窗2
winsor2 varname,替换cut (199 ) )。
【14】说明性统计
tabstat var1var2、stat (最小中间值25 p 75 maxsd )、if组var==0或1
日志,保存(名称)世界替换:存储盘,启动)最大值)最大值) f ) f(%9.2g ) ) ) )。
【15】两变量列表
tabulate var1 var2,row chi2 taub gamma
【16】两个样本之间的平均值t检验
测试值,按(组值)
【17】两样品中央值z检查
秩和值,按(组值)
【18】人员/人员系数
人类x *
纽约市
x=st_data (.' x* ' ) ) ) )。
c=关系(x ) ) )
n=罗斯(c )
b=软件(下部三重(c )上部三重(ST_matrix('r ) rho ) ) ),' %9.3f ' )
p=ST _矩阵(' r (p ) ) )
for(I=2; i=n; I ) {2}
for(j=1; j=i-1; j ) {2}
p[i,j]^2缇(罗斯(x ),亚伯斯) c[I,j]^2方差(1-c[I,j]^2)/)罗斯(x )-2 ) )
B,j=B,j (p,j ) j]0.01? 3: (p [ I,j]0.05? 3: (p [ I,j]0.1? ' *': ' )
B,I=B,I (p,I ) i]0.01? 3: (p [ j,i]0.05? 3: (p [ j,i]0.1)? ' *': ' )
}
}
c=编辑值(b,' 2.000 ','1' )
c
结束
直接导出结果
日志,保存(pw )世界更换: pw核心_平均值,星1 (0.01 )星5 ) 0.05 )星10 (0.1 ) ) ) )。
【19】按年度分列的中央值分组
方法1
比亚迪:工程=Xtile (VAR,n )2) ) ) ) ) ) ) )。
方法2
bys accper: cumul icindex,g(g ) eq
每秒级别,本地(id ) )。
显示器' ` r (级别) '。
本地cut1=1/2
本地身份证{2}
编码(最小值cut1)=0);编码1 ) /最大值=1)输入频率=` x )。
}
分成三组
bys accper:cumul icindex,g(g ) eq
每秒级别,本地(id ) )。
显示器' ` r (级别) '。
本地cut1=1/3
本地cut2=2/3
本地身份证{2}
记录(最小值/(cut1)=1);cut1)/cut2)=2) )记录/最大值=3)信息频率=` x ) )
}
【20】输出回归结果
安装
ssc install estout,替换
单一回归
reg
esttab using name.rtf,压缩式2 AR 2之星(* 0.1 * * 0.05 * * 0.01 ) ) ) ) ) ) )。
多重回归
reg
星际大战m 1
reg
星际争霸2
EST Tab m1 m2使用者名称. rtf,压缩式2 AR 2之星(* 0.1 * * 0.05 * * 0.01 ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。
连续执行tobit模型的结果导出:
esttab m1 m2,b(%9.4f )叔比例(NlFChi 2类型),使用者名称. rtf,压缩无间隙
连续导出OLS模型结果:
esttab m1m2,b(%9.4f )叔比例) nR2FP ),使用者名称. rtf,压缩无间隙
【21】分散检查和处理
检查:白色检查
sc安装white tst
reg
开始测试,白色
处理:“OLS稳健标准偏差”
3个reg y x1 x2 x3,机器人
【22】DW检查(序列相关一次) )
gen id=_n
终端设置id
星际争霸战
【23】多重共线性
3个reg y x1 x2 x3
vif
【24】是否忽略了高次项
例如,检查y相对于x的线性回归是否遗漏了高次项
雷格Y x
测试东部
或estat ov测试,rhs
【25】阶段性回归
stepwise,PE(0.1 ) : reg y x
【26】maddala(1983 )二阶段处理效果模型
treatreg yx1-xn,tr(z=w1-WM ) two
【27】Justified Jones模型
statsby _b,by (电感)存储(*.DTA,替换) :reg yx,否常数
mergem :迷你连接*.DTA
gen yhat=y-_b*x