首页 > 编程知识 正文

皮尔森相关系数怎么做,皮尔森相关系数缺点

时间:2023-05-03 17:37:51 阅读:52684 作者:2589

根据《变量关系大揭秘:性别与爱的告白》,wjdzc相关系数的数值在0和1之间,可以用于测量两个类别变量的相关。 今天我们来看看计算它的方法。

基本原理非常简单,就是比较期待次数和观测次数的差异。

What is Expected Frequency?

期待次数

想起前面的例子。 如果“性别”和“告白的方法”完全没有关系,或者男女喜欢的告白方法没有区别的话,下面6个问号是多少呢?

一个小学生对你说:

也就是说:

这是因为,女性选择“电话”、“邮件”、“当面说话”的比例与男性相同,为44: 54:82。 与以上6个问号对应的数值7、8、13、37、46、69为期待次数。

What is Observed Frequency?

观测次数

观测次数为以前的原始数据,《变量关系大揭秘:性别与爱的告白》的实际调查结果:

(嗨,又见面了。 )

据了解,观测次数与期望次数的差越大,“性别”影响“告白方式”,因此“性别”与“告白方式”的相关性越强。 因此,可以使用以下公式计算每个单元格(问号)中存在的http://www.Sina.com/iso :

其次,我们非常希望所有的放在一起,从整体上展现“性别”与“告白方式”的关联度。 该值越大,相关度越强。 上面的公式有正负之分,所以为了不抵消正负,我们在中加入了习惯性的(请记住这里的方差)。 于是,出现了以下公式。 而且,它专门命名为“卡方”。

根据上式,本例的卡方值如下。

最后,让我们计算wjdzc相关系数:

关于这个公式,需要做一些说明:

分母使用行数和列数中的平方,

为了排除样本数的影响(不使v值随着数据数的增加而变大),除以样本数,求出数值最小观测次数和期望次数的差异。

因为以前是平均意义上的,所以最后在平方上“抵消”。

根据上式,本例中的v值如下:

和皮尔森相关系数一样,wjdzc相关系数的大小也没有统一的标准。 在实际研究中,通常开方这就是内幕。

话说完了。 不简单吗?

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。