冰楓論壇

標題: 遇到文件乱码?不要怕利用python转换 [打印本頁]

作者: syukai    時間: 2022-8-24 20:02
標題: 遇到文件乱码?不要怕利用python转换
  1. x=open('in.txt','r',encoding='gb18030')
  2. z=x.read()
  3. z=z.encode('gb18030').decode('cp932')
  4. j=z.encode('gb18030').decode('gb18030')
  5. print(j)
  6. if('・' in z):
  7.     y=open('out.txt','w',encoding='utf8')
  8.     y.write(j)
  9. else:
  10.     y=open('out.txt','w',encoding='gb18030')
  11.     y.write(j)
  12. x.close()
  13. y.close()
複製代碼

乱码.png (14.04 KB, 下載次數: 6)

转换前后

转换前后


作者: syukai    時間: 2022-8-24 20:09
乱码发生的原因是,运行环境有固定的编码格式,用不正确的编码去解码就会乱码,
解决方案是正确的编码去解码然后再用自己的环境编码重新把字符编码一次再解码就能正常显示内容啦
上面gb18030为升级版gb2312(简体中文)编码
cp932又名(ms932)为微软定义的日文编码(shiftjis)扩充
【・】字符是比较难转码的字符,容易报错,需要转utf-8达到正常显示
针对文本文档格式,csv、txt、逗号分隔、tab分隔都能转换哦,大家可以试试
针对其他语言的转码只要改编码部分名称即可




歡迎光臨 冰楓論壇 (https://bingfong.com/) Powered by 冰楓