首页 > 编程知识 正文

r中怎么表示分类变量,r语言选择自变量有哪些原则

时间:2023-05-03 23:48:45 阅读:187129 作者:3284

文章目录一、分类相关性分析二、有序相关性分析三、数值相关性分析四、分类有序相关性分析五、分类数值相关性分析六、有序数值相关性分析

本文均假设显著性水平为0.05,特殊说明除外。 一.分类相关性分析

分类变量分析方法的选择与数据状态有很大的相关性,计数据样本量为n,两变量交叉单元数据为t。

卡方检验

卡方检验科用于二维列联表行变量和列变量的相关检验,只能反映相关统计学意义,不能分析相关强度

所有t5且总样本量为n40时,由Pearson卡方进行检测

t5,但t1且n40时,按连续性修正的卡方检验

“r语言”chisq.test(x1,x2)

样品数量不足表示检测结果可能不准确(chi-squaredapproximationmaybeincorrect ) :

如果样品量足够多就正常了。 p值小于0.05,str1和str2之间存在明显的相关关系。

费希尔精密检查

任何rCr (可用于验证times Crc数据之间的相关性) (也可用于2*2数据的分析。 与卡方检验只能拟合近似分布不同,fisher精密检验可以分析精密分布,适用于小样本数据的分析。

T<; 1或n<; 40时,用fisher’s检查

“r语言”fisher.test(x1,x2)

R中的fisher.test ()可以用于任意矩阵数为2以上的二维列连接表中,但不能用于22的列连接表中。 2 ) a/b )2) s/t )的错误如下:

2(a/b ) )4) a/b/c/d )是可以的。 p值小于0.05,str1与str3有显著相关

2(a/b ) )3) a/b/c )也可以。 p的值大于0.05,str1和str4没有关系

Cochran-Mantel-Haenszel检查

Cochran-Mantel-Haenszel验证的原始假设是,两个名义变量(x1,x2 )为第三个变量(x3 )的每一层条件是独立的

“r语言”mantelaen.test(x1,x2,x3)

二、有序相关分析(一)有序分类不认为是定距的(如三等奖与二等奖的区别一般与二等奖与一等奖的区别不同)。

特殊相关

Spearman相关器也称为Spearman秩相关器,用于检验不满足有序变量(所关注的至少一个被排序)或正态分布假设的等间隔数据的相关强度和相关性质。

“r语言”cor.test(x1, x2, method = “spearman”)x1、x2都是数值形式的变量,是原变量的等级数。 Kendall’stau-b (肯德尔)等级相关系数

Kendall’stau-b相关系数是用于验证至少一个有序分类变量的相关强度和方向的非参数分析方法。 这一检验基本上符合Spearman相关联的应用范围,但是如果存在多个相关数据,则例如适用于列结合表。 )二)认为固定距离的:

Mantel-Haenszel趋势检查

该检查也称为Mantel-Haenszel卡方检查、Mantel-Haenszel趋势卡方检查。 在该检查中,根据研究者对规则分类变量类别代入,判断两个规则分类变量间的线性趋势3、数值相关分析Pearson相关系数

Pearson相关系数测量两个连续变量之间的线性相关程度

“r语言”cor(x1,x2,method=‘pearson’)

Spearman相关系数

Spearman类相关系数可以度量非线性关系变量之间的相关系数,是一种非参数统计方法,可用于不满足序变量或正态分布假设的等距数据;

“r语言”cor(x1,x2,method=‘spearman’)

KKendall秩相关系数

Kendall秩相关系数也是非参数的秩相关测量,与Spearman秩相关系数相似。

“r语言”cor(x1,x2,method=‘kendall’)

“r”http://www.Sina.com/: chisq.test (,fisher.test )、mantelhaen.test )和cor ) )。

- stata包函数的最重要参数是

X,use,method。
---- X即指定分析的变量;
---- use指定缺失值处理的方法:all.obs则假设不存在缺失数据,遇到缺失数据时将会报错;everything遇到缺失数据时,结果将返回missing;complete.obs进行行删除;pairwise.complete.obs则成对删除
---- method指明计算相关系数的方法:pearson、spearman、kendall 四、分类 & 有序·相关性分析

(一)有序变量 X 1 X_1 X1​ & 二分类变量 X 2 X_2 X2​

无因果关系:
1.1 Biserial秩相关:
Biserial秩相关可以用于分析二分类变量和有序分类变量之间的相关性。在用二分类变量预测有序分类变量时,该检验又称为Somers’ d检验。此外,Mann-Whitney U检验也可以输出Biserial秩相关结果。

有序变量为因变量:
2.1 有序Logistic回归
有序Logistic回归在本质上并不是为了分析二分类变量和有序分类变量之间的相关性。但我们仍可以用有序logistic回归及其对应的OR值判断这两类变量之间的统计学关联。

二分变量为因变量:
3.1 Cochran-Armitage 检验
Cochran-Armitage 检验又称Cochran-Armitage 趋势检验,常用于分析有序分类自变量和二分类因变量之间的线性趋势。该检验可以判断随着有序分类变量的增加,二分类因变量比例的变化趋势,是对其线性趋势的统计学分析。
3.2 Mantel-Haenszel卡方检验:
Mantel-Haenszel卡方检验也称线性趋势检验(Test for Linear Trend)或定序检验(Linear by Linear Test)。要求一个变量是有序的,另一个变量可为二分类也可为多分类。
3.3 Cochran-Armitage趋势检验:
Cochran-Armitage 趋势检验要求一个变量是有序分类变量,另一个变量是二分类变量。

(二)有序变量 X 1 X_1 X1​ & 多分类变量 X 2 X_2 X2​

Mantel-Haenszel卡方检验:
Mantel-Haenszel卡方检验也称线性趋势检验(Test for Linear Trend)或定序检验(Linear by Linear Test)。要求一个变量是有序的,另一个变量可为二分类也可为多分类。 五、分类 & 数值·相关性分析

(一)数值变量 X 1 X_1 X1​ & 二分类变量 X 2 X_2 X2​: t t t 检验等

Point-biserial 相关性分析
Point-biserial相关是Pearson相关的一种特殊形式,适用于分析二分类变量和连续变量之间的相关性 t t t 检验 :
相当于检验不同 X 2 X_2 X2​对应的 X 1 X_1 X1​是否有差异,有显著差异则相关,无显著差异则无法说明其相关(运用假设检验的原因不能直接说不相关)。注意这里的 p 值代表检验结果显著程度,与相关程度无直接关系。

(二)数值变量 X 1 X_1 X1​ & 多分类变量 X 2 X_2 X2​:单因素方差分析等

ANOVA:
跟 t 检验一个原理,就是分类变量的类别超过2类后也适用。p 值小于显著水平则两变量具有一定的相关性,若 p 值大于显著性水平则无法证明两变量具有相关性(运用假设检验的原因不能直接说不相关),同样 p 值代表检验结果显著程度,与相关程度无直接关系。 六、有序 & 数值·相关性分析

没有专门针对有序变量和数值变量相关性分析的方法,一般将连续变量视为有序变量,按照有序 & 有序的方法进行分析

相关关系不是因果关系,相关关系是对称的。如果a和b是正相关关系,a会随着b的增加而增加,那么反过来b也会随着a的增加而增加,无论发现哪种现象,都能说明a和b之间存在正相关关系。本文评论中很多朋友纠结于x是什么,y是什么,实际上如果只是研究相关关系,x与y是可以互换的,关于相关关系的结论不会受影响。但如果朋友们研究的是因果关系,那么单纯相关分析是不足够的,需要更为进阶的模型来辅助研究。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。