当前位置: 首页 > news >正文

【python pandas】合并文件并剔除重复数据

1.背景

  工作中需要处理多个文件,每个文件里面有重复的数据,剔除重复数据,保留最新的数据

2.代码:

import pandas as pd
import osdl= []
#person_list是文件路径
for i in range(person_list_len):#把文件df全部集合进列表dldl.append(pd.read_csv(person_list[i], encoding='utf-8'))
#集合数据
df=pd.concat(dl)
#删除重复的数据
df.drop_duplicates(subset=['身份证号'],keep='last',inplace=True)
#保存数据到cvs
new_file = 'D:\\xxx\\xxx\\合并_%s.csv'%file_name
if os.path.exists(new_file):os.remove(new_file)
df.to_csv(new_file)
http://www.lryc.cn/news/67688.html

相关文章:

  • Spellman高压电源X射线发生器维修XRB160PN480X4593
  • msvcr120.dll丢失怎样修复?msvcr120.dll丢失修复的四个方法
  • 马哈鱼SQLFLow数据流生成介绍
  • 使用 MVC 模式,实现简单登录功能 (Kotlin)
  • ASEMI代理LT8471IFE#PBF原装ADI车规级LT8471IFE#PBF
  • 8. 100ASK_V853-PRO开发板支持MPP媒体处理平台
  • CLMP证书:让你在职场中脱颖而出的秘密武器!
  • 【从零开始】Docker Desktop:听说你小子要玩我
  • 制造业为什么要数字化?
  • NPC 也有了生命?当 ChatGPT 注入游戏你能想象吗
  • Shell编程入门讲解
  • C++ 变量作用域
  • 【状态未成功】CONFIG_CFI_CLANG失败过程记录
  • 基于消息调度优化启动速度方案实践
  • 【C#】RemoveAt索引越界问题
  • 【华为OD机试2023】工位序列统计友好度最大值 100% C++ Java Python
  • Rust Atomics and Locks 阅读笔记 第二章 Atomics
  • Helm3入门
  • 动态规划-线性动态规划-最长上升子序列模型
  • ResNet 论文理解含视频
  • Java8之Stream操作
  • 二分查找基础篇-JAVA
  • shell脚本5数组
  • Kubernetes二进制部署 单节点
  • 基于VC + MSSQL实现的县级医院医学影像PACS
  • Jmeter 压测 QPS
  • 如何在云上部署java项目
  • IT行业项目管理软件,你知道多少?
  • 小爱同学接入chatGPT
  • java运算符