首页 > 编程知识 正文

python线性回归中的哑变量转换,python虚拟自变量回归方法

时间:2023-05-03 13:28:10 阅读:259808 作者:4883

题目:

把分类变量转变成哑变量之后,如何进行多元线性回归呢?

我需要分析的因变量是连续数值变量,自变量中包含连续数值变量、二分类变量和转换后的虚拟变量.软件是SPSS,但具体的操作环节我不知道怎么做.

解答:

嗯,在分类变量中包括二分类的变量和多分类的变量,其中二分类的变量改成虚拟变量,只要将一类赋值为0,另一类赋值为1就可以了,0作为对照组;如果是多分类的变量,改成虚拟变量时,需要设立分类数减1的虚拟变量,比如年级有三个值:一年级、二年级、三年级,那就需要设两个虚拟变量:年级1、年级2,以一年级作为对照组,那年级1和年级2同时为0则表示一年级,年级1为1,年级2为0表示二年级,年级1为0,年级2为1表示三年级.

在输入数据时,数据中有两个变量:年级1和年级2,两个变量的取值都是0和1,在做回归分析时将这两个变量选入自变量中就可以了.(这些在logistic回归中其实就一步完成了,但是在线性回归中就按照上面说的,比较麻烦.)不知道我是否说明白了.

再问: 谢谢!上面一段我明白,但是在SPSS的多元回归中怎么操作呢?比如把年级(G)转换成G1和G2,把城市(C)转换为C1、C2和C3,在加上连续数值变量M、N和二分类变量P、Q,这样的情况下是把这些自变量都一次性的选入自变量当中,按照enter的方法分析吗?我还是很困惑赋值以后接下来的操作。

再答: 是的,一次性选入自变量中,但最好选择逐步法(stepwise),因为这么多变量之间可能存在较高的相关性。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。