首页 > 编程知识 正文

throat的音标

时间:2023-05-03 20:29:39 阅读:234283 作者:4138

Python2.7,处理csv文件时,把英文逗号替换成中文逗号之后就会乱码,title变量会乱码,可是content就不会,他们都是str类型,麻烦大家,这是为啥??def main():

#初始化数据

caiji_path = 'E:/content/01_caiji'  #初始文件路径

file_list = os.listdir(caiji_path)  #文件名列表

#根据列表处理文档

for file_name in file_list:

abstract = ''

file_path = os.path.join(caiji_path, file_name)  #拼接出完整文件路径

try:

with open(file_path, 'r') as f:

title = file_name[:-4]   #title

print '获得title:', title.decode('gbk')

content = f.readline()

content = f.readline() #正文,暂时用最笨的方法,两次readline输出第二行的正文,第一行是标题。

print '获得content:......'

#字符串替换:csv使用 英文逗号 作为分隔符,要把文档中的 英文逗号 替换成 中文逗号。

title = title.replace(',', ',')

content = content.replace(',', ',')

print title#.decode('gbk')#.encode('gbk')    # title 如果不替换逗号,title会正常显示,替换之后就出现乱码,decode、encode也不行

print content      # content 则显示正常

except:

print sys.exc_info()[0], sys.exc_info()[1]

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。