文章目录介绍了如何转换变量转换变量
内容介绍
在日常的数据分析工作中,需要将数据变量转换为模型所需的样子。 例如,我们经常遇到的数据都是标签化、文字化等内容,需要将这些数据转换为计算机能理解的内容。 需要转换标签变量。
无论是离散数据还是连续数据,特定环境都可能需要类别转换处理。
变量变换将离散数据和连续数据变换为标志变量。
离散数据:分类数据是非数字数据,其数据属性只能属于特定类别。 例如,性别男性和女性是分类数据。 分类数据中的值没有等级、顺序、顺序、好坏等明显的高、低、大、小和逻辑上的区分,但是用于区分具有相同属性或相同属性的两个以上属性的等价值。
连续数据:连续数据仅由特定排序类别中的非数字数据引起。 例如,用户价值高、中度低,教育程度分为博士、研究生、学士。 这些都是连续数据。 顺序数据有明显的排序规则和逻辑划分。
变量转换方法分类数据和连续数据必须参与模型计算,通常转换为数值数据。 当然,一些算法可以让这些数据直接参与计算,如分类算法决策树和关联规则。 将非数字数据转换为数字数据的最佳方法是将所有类别或顺序变量的范围从一列转换为数字数据