首页 > 编程知识 正文

不能用卡方检验的是,卡方检验和fisher精确检验

时间:2023-05-04 02:48:34 阅读:162781 作者:827

x2检验(chi-square test )或卡方检验是一种用途广泛的假设检验方法。 可以分为组比较(不配对数据)和个别比较(配对)、或者同一对象的两个处理的比较)两种。

一.四格表资料的x2检验

例20.7某医院分别采用化疗联合化疗对卵巢癌患者进行放疗,结果如表20-11,询问两种治疗方法是否存在差异。

表20-11两种治疗方法治疗卵巢癌疗效比较

团体

有效

无效

合计

效率() ) ) ) ) ) ) ) ) ) )。

化疗组

19

24

43

44.2

化疗和放疗组

34

10

44

77.3

合计

53

34

87

60.9

表内用虚线分隔的这4个数据是整个表的基本资料,剩下的数据都是由此推算出来的; 这四格资料表又名四格表(fourfold table ),或两行两列表(22 contingency table ),根据该资料计算两种治疗的有效率分别为44.2%和77.3% 两种治疗的有效率)总体率)确实不同,现通过x2检验可区分其差异有无统计学意义,检验基本公式如下:

式中的a为实际数,以上4格表的4个数据为实际数。 t是理论数,根据检验假说估计; 也就是说,假设这两种卵巢癌治疗的有效率本来就不一样,差异是采样误差造成的。 在此,可以将两种治疗方法的合计效率设定为理论上的效率,即53/87=60.9%,据此可以推测4格表对应的4格理论数据。 以表20-11资料为例验证如下。

检查步骤:

1 .作出检验假设:

H0:1=2

H1:12

=0.05

2 .计算理论数(TRC ),计算公式如下:

TRC=nR.nc/n的公式(20.13 ) ) ) ) ) ) ) ) )。

式中的TRC是表示r行第c列格子的理论数,nR是理论数同行的总数,nC是与理论数同列的总数,n是总例数。

第1行第1列: 4353/87=26.2

第一行第二列: 4334/87=16.8

第2行第1列: 4453/87=26.8

第2行第2列: 434/87=17.2

推算结果与原4项实际数并列见表20-12

表20-12两种治疗方法治疗卵巢癌疗效比较

团体

有效

无效

合计

化疗组

19(26.2 )。

24(16.8 )。

43

化疗和放疗组

34(26.8 ) )。

十(17.2 )。

44

合计

53

34

87

上表中各行和列的合计数是固定的,如果用TRC式求出某个理论数(例如T1.1=26.2 ),则剩下的3个理论数都可以用同行或同列的合计数相减直接求出,如下所示。

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3 .计算x2值用公式20.12代入

4 .查x2值表求p值

在查表之前应该知道正题的自由度。 x2检验自由度v=(行数-1) )列数-1),调查此问题的自由度v=(2-1) )2-1)=1,x2边界值表(附表20-1 ),x20.001 )1)=6.63,本问题x2=10

通过实例计算,读者对卡方的基本公式有如下理解。 各理论数和对应的实际数之差越小,x2值越小,如果两者相同,则x2的值一定为零,x2总是正值。 另外,理论数和实际数的每对都加入了x2值,组化越多,也就是格子数越多,x2值也越大,所以每次考虑x2值的大小的意义时,也需要考虑格子数。 因此,如果自由度较大,则x2的阈值也相应变大。

二、四格表的专用公式

关于四格表数据,也可以用以下专用公式求出x2值。

式中的a、b、c、d分别表示4格表中的四个实际数,现在也以表20-12为例,将上式的记号标记如下,并进行实际计算。

表20-13两种疗法治疗卵巢肿瘤患者的疗效

团体

有效

无效

合计

化疗组

19(a ) )。

24(b ) )。

43(ab ) )。

化疗和放疗组

是34(c )

10(d ) )。

44(CD ) ) )。

53 (交流电)

>34(b+d)

87(n)

计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。

三、四格表x2值的校正

x2值表是数理统计根据正态分布中

的定义计算出来的。

    是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

如果用四格表专用公式,亦应用下式校正:

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算

疗法

痊愈数

未愈数

合计

26(28.82)

7(4.18)

33

36(33.18)

2(4.82)

38

合计

62

9

71

从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:

1.检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用公式(20.15)运算如下:

查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果x2=4.068,则结论就不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验(x2test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

式中n为总例数;A为各观察值;nR和nC为与各A值相应的行和列合计的总数。

例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

检查结果

居室朝向

合计

西、西南

东、东南

北、东北、西北

患病

180

14

120

65

379

无病

200

16

84

33

333

合计

380

30

204

98

712

患病率(%)

47.4

46.7

58.8

66.3

53.2

/P>

该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

(一)检验步骤

1.检验假设

H0:四类朝向居民婴幼儿佝偻病患病率相同。

H1:四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算x2值

3.确定P值和分析

本题v=(2-1)(4-3)=3,据此查附表20-1:

x20.01(3)=11.34,本题x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

五、配对计数资料x2检验(x2test of paired comparison of enumeration data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

甲培养基

乙培养基

合计

+

-

+

11(a)

9(b)

20

-

1(c)

7(d)

8

合计

12

16

28

从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

检验步骤:

1.检验假设

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算x2值

3.确定P值和分析 配对资料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c>40,则可采用:

此外还有两种以上处理方法的比较,可参阅预防医学专业的医学统计方法有关章节。

附表20-1 x2界值表

v

P

V

P

0.05

0.01

0.001

0.05

0.01

0.001

1

3.84

6.63

10.83

16

26.30

32.00

39.25

2

5.99

9.21

13.81

17

27.59

33.14

40.79

3

7.81

11.34

16.27

18

28.87

34.18

42.31

4

9.49

13.28

18.47

19

30.14

36.19

43.82

5

11.07

15.09

20.52

20

31.41

37.57

45.32

6

12.59

16.81

22.46

21

32.67

38.93

46.80

7

14.07

18.48

24.32

22

33.92

40.29

48.27

8

15.51

20.09

26.12

23

35.17

41.64

49.73

9

16.92

21.67

27.88

24

36.42

42.98

51.18

10

18.31

23.21

29.59

25

37.65

44.31

52.62

11

19.68

24.72

31.26

26

38.89

45.64

54.05

12

21.03

26.22

32.91

27

40.11

46.96

55.48

13

22.36

27.69

34.53

28

41.34

48.28

56.89

14

23.68

29.14

36.12

29

42.56

49.59

58.30

15

25.00

30.58

37.70

30

43.77

50.89

59.70

原文链接:http://www.med66.com/html/2005/8/hu79050353148500210950.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。