首页 > 编程知识 正文

分类数据,顺序数据和数值型数据的区别,分类数据和顺序数据统称

时间:2023-05-04 21:48:22 阅读:278496 作者:2227

(一)、category的创建及其性质
一、 分类变量的创建
1.用Series创建

2.对DataFrame指定类型创建

3.利用内置Categorical类型创建

4.利用cut函数创建
默认使用区间类型为标签

可指定字符为标签

二、分类变量的结构
一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order)
从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量
下面介绍如何获取或修改这些属性
1.describe方法
该方法描述了一个分类序列的情况,包括非缺失值个数、元素值类别数(不是分类类别数)、最多次出现的元素及其频数
2.categories和ordered属性
查看分类类别和是否排序

三、类别的修改
1.利用set_categories修改
修改分类,但本身值不会变化

2.利用rename_categories修改¶
需要注意的是该方法会把值和分类同时修改

利用字典修改值

3.利用add_categories添加
4.利用remove_categories移除
5.删除元素值未出现的分类类型

(二)、分类变量的排序
一、序的建立
1.一般来说会将一个序列转为有序变量,可以利用as_ordered方法¶

退化为无序变量,只需要使用as_unordered
2.利用set_categories方法中的order参数
3.利用reorder_categories方法
二、排序

(三)、分类变量的比较操作
一、 与标量或等长序列的比较
1.标量比较

2.不等式判别(包含>=,<=,<,>)
两个分类变量的不等式判别需要满足两个条件:① 分类完全相同 ② 排序完全相同

仅作学习打卡使用

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。