1、遍历文件夹操作
for root,dirs, filesinOS.walk(file_location ) : # root输出文件夹、dirs输出root下的所有文件夹、files输出root下的所有文件打印)和root当前文件夹3360 files (print ) )操作系统. walk是系统附带的函数,用于遍历文件夹中的所有文件;操作系统是python附带的系统库,前面写为import os操作系统
2、批量读取文件名称
file_list=[] #设置列表存储文件名设置csv文件的循环路径,并将文件名存储在file_listfor root,dirs中。 filesinOS.walk(file_location ) : forfilenameinfiles 3360 if filename.end with ).CSV ) 3360 file _ path=OS.join finfiles
all_data=PD.dataframe(#数据df=PD.read_CSV )循环读取参数forFPinsorted ) : #读取数据df=PD.read_CSV
第一,必须使用sorted方法对文件列表进行排序
第二个编码是utf-8还是gbk
第三个忘了ingnore_index=True
第四个skiprows因情况而异,通常等于1
3、遍历文件名,批量导入数据
all _ data.sort _ values (by=[ ' candle _ begin _ time ' ],inplace=True ) dataframe.sort_values ) by=‘# # #
by指定的列名(axis=0或)索引)或索引值(axis=1或) columns ) (axis=0或)索引),则按指定列中的数据大小排序如果axis=1或’columns’,则按指定索引中的数据大小排序,缺省axis=0ascending是否按指定列的数组按升序排序,缺省为True,即按升序排序
all _ data.to _ hdf (r ' e : (数字字符序列(部分3 (数据) EOS_1min_data.H5 ),key='all_DOS )