首页 > 编程知识 正文

pandas用哪个方法去除重复数据,pandas的dataframe筛选大于1的数据

时间:2023-05-03 08:48:53 阅读:179015 作者:1009

duplicated公式说明参考

duplicated方法说明:

简要代码实现: importpandasaspdfrompandasimportdataframe ' '实现任务: dataframe的列元素中重复的数据项' ' if _ _ name _=' _ maid ' key2': ['one ',' two ',' one ',' two ',' one ',' two ',' one2' data2' 3360 [ 1,2,5,5,5 ] (print(df ) # pandas的简洁、暴力的两行代码key_duplicated=df ) df.key2. duplicated (false ) ) print ) ' key2'列中包含重复元素的数据如下() ) ) pricated 'data1']] ) (key2)列中的元素进行排序的sort _ key _ duplicated=key _ duplicated.sort _ values (by=[ ' kkey ] ) ) print )可以讨论我写的白痴方法(不需要看) (importpandasaspdfrompandasimportdataframe ' '实现任务)在dataframe的某列元素中重复的数据项“” ['a ',' a ',' b ',' b ',' a ',' c ',' a'],' key2': ['one ',' two ',' one ',' one ',' key2' }#print(df ) )取出key2列数据的key=df.key2) print ) key ) key ) print ) ) key.duplicated ) false )的返回是() ) print ) key ) key2) key2) key2) key2) key2) key 出现重复要素索引位置indexs=[] #重复要素被配置在valuesetvalueset=set(set ) ) dup=key.duplicated (false ) for index中, valueinenumerate(dup ) :ifvalue:indexs.append ) index ) valueset.add ) key[index] ) print ) (重复值为) print(indexs )重复元素的数量num=0 # )重复的值按组输出。 forrepeatvalinvalueset 3360 flag=0forindex, valueinenumerate(key ) : ifrepeatval==value : if flag==0: print (------ find-----' ) num

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。