当前位置: 首页 > news >正文

pandas使用read_csv时报错解决

问题描述:

在使用read_csv时报错:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 9451: invalid continuation byte

或者:

UnicodeDecodeError: 'gb2312' codec can't decode byte 0x88 in position 68296: illegal multibyte sequence

问题原因:

因为csv不是按照utf-8格式写入的,可能是其他格式,而pandas默认是使用utf8来进行解码的,所以可以使用 gbk 格式来进行读取:

df = pd.read_csv('a.csv', encoding='gbk')

拓展说明:

可以通过如下方式获取文件的编码格式:

import chardetdef find_encoding(fname):r_file = open(fname, 'rb').read()result = chardet.detect(r_file)charenc = result['encoding']return charenc

http://www.lryc.cn/news/291107.html

相关文章:

  • Optimism的挑战期
  • Linux——安装MySQL
  • java常量和kotlin常量
  • Python学习笔记--创建最简单的自定义异常类
  • 2024年,AI 掀起数据与分析市场的新风暴
  • 小程序软件测试应该怎么做?有什么作用?
  • springboot2.2.9整合kafka之KafkaListener实现原理
  • 数据结构day7
  • cleanmymacX有必要买吗
  • 智慧文旅:打造无缝旅游体验的关键
  • C语言 | 求最大/小值小技巧:fmax、fmin函数
  • 【深度学习每日小知识】Model Accuracy 模型准确率
  • 智能AI系统开发,专业软件硬件物联网开发公司,探索未来科技新纪元
  • 第七篇:node中间件详解
  • Jenkins自动化打包
  • 【服务端性能测试】性能测试策略如何做
  • 透明拼接屏造型:多样拼接与影响因素
  • c# 对路径的访问被拒绝
  • 【数据结构】单调队列
  • 《统计学习方法:李航》笔记 从原理到实现(基于python)-- 第5章 决策树(代码python实践)
  • 电脑可以设置代理IP吗
  • Zookeeper服务注册与发现实战
  • 【LeetCode】每日一题 2024_1_30 使循环数组所有元素相等的最少秒数(哈希、贪心、扩散)
  • uni-app vite+ts+vue3模式 集成微信云开发
  • 一个程序入库出现死锁问题的排查
  • 记录解决报错--These dependencies were not found jsencrypt lodash-es
  • 【极数系列】Flink集成DataSource读取集合数据(07)
  • React hooks子组件暴露方法示例
  • 数据结构:大顶堆、小顶堆
  • 电加热热水器上架亚马逊美国站需要的UL174报告