pandas用哪个方法去除重复数据,pandas的dataframe筛选大于1的数据

duplicated公式说明参考

duplicated方法说明：

简要代码实现： importpandasaspdfrompandasimportdataframe ' '实现任务： dataframe的列元素中重复的数据项' ' if _ _ name _=' _ maid ' key2': ['one '，' two '，' one '，' two '，' one '，' two '，' one2' data2' 3360 [ 1，2，5，5，5 ] (print(df ) # pandas的简洁、暴力的两行代码key_duplicated=df ) df.key2. duplicated (false ) ) print ) ' key2'列中包含重复元素的数据如下() ) ) pricated 'data1']] ) (key2)列中的元素进行排序的sort _ key _ duplicated=key _ duplicated.sort _ values (by=[ ' kkey ] ) ) print )可以讨论我写的白痴方法(不需要看) (importpandasaspdfrompandasimportdataframe ' '实现任务)在dataframe的某列元素中重复的数据项“” ['a '，' a '，' b '，' b '，' a '，' c '，' a']，' key2': ['one '，' two '，' one '，' one '，' key2' }#print(df ) )取出key2列数据的key=df.key2) print ) key ) key ) print ) ) key.duplicated ) false )的返回是() ) print ) key ) key2) key2) key2) key2) key2) key 出现重复要素索引位置indexs=[] #重复要素被配置在valuesetvalueset=set(set ) ) dup=key.duplicated (false ) for index中， valueinenumerate(dup ) :ifvalue:indexs.append ) index ) valueset.add ) key[index] ) print ) (重复值为) print(indexs )重复元素的数量num=0 # )重复的值按组输出。 forrepeatvalinvalueset 3360 flag=0forindex， valueinenumerate(key ) : ifrepeatval==value : if flag==0: print (------ find-----' ) num