当前位置: 首页 > news >正文

Python按要求从多个txt文本中提取指定数据

基本想法

遍历文件夹并从中找到文件名称符合我们需求的多个.txt格式文本文件,并从每一个文本文件中,找到我们需要的指定数据,最后得到所有文本文件中我们需要的数据的集合

举例

如现有名为file一个文件夹,里面含有大量的.txt格式文本,需要从文件名中找到含有test字段的文件,并且取出name是李四、李五、王五的用户数据。

代码示例

# -*- coding: utf-8 -*-import os
import pandas as pddef concat_data(ori_path, target_list):result_df = pd.DataFrame()for file in os.listdir(ori_path):if file.endswith(".txt") and file[0:4] == "test":file_path = os.path.join(ori_path, file)df = pd.read_csv(file_path, delimiter="\t")# try:select_df = df[df["Name"].isin(target_list)]data_append = select_dfif not data_append.empty:result_df = pd.concat([result_df, data_append])# except:#     pass# result_df.reset_index(drop=False, inplace=True).drop(['index'], axis=1)result_df.to_csv(ori_path + '/result.csv', encoding='ANSI')return result_dfif __name__ == '__main__':f_path = r"D:\program"f_var = ['李四', '李五', '王五']concat_data(f_path, f_var)

原始数据

在这里插入图片描述

结果展示
在这里插入图片描述

http://www.lryc.cn/news/252433.html

相关文章:

  • DFT新手教程:VASP中ISIF取值设置
  • pytest自动化框架之allure测试报告的用例描述设置
  • 在编程中遇到的问题总结
  • 【数据库设计和SQL基础语法】--SQL语言概述--SQL的基本结构和语法规则(二)
  • easyexcel多级表头导出各级设置样式(继承HorizontalCellStyleStrategy实现)
  • QMLfor python pyside6
  • 几何教学工具 Sketchpad几何画板 mac软件特色
  • 华清远见嵌入式学习——C++——作业5
  • Java中的类与类之间的关系
  • 全新仿某度文库网站源码/在线文库源码/文档分享平台网站源码/仿某度文库PHP源码
  • HTTPS的安全问题及应对方案
  • TensorRT-LLM保姆级教程(一)-快速入门
  • 使用Redis构建简易社交网站(3)-状态与信息流
  • Python,非二进制的霍夫曼编码
  • 详解—[C++数据结构]—红黑树
  • 甘草书店记:6# 2023年10月31日 星期二 「梦想从来不是一夜之间实现的」
  • 基于Java SSM车辆租赁管理系统
  • 侯捷C++八部曲(一,面向对象)
  • 《数据库系统概论》学习笔记——王珊 萨师煊
  • 关于使用百度开发者平台处理语音朗读问题排查
  • 安全认证 | CISP和CISP-PTE的区别在哪里?
  • Unity3D 导出的apk进行混淆加固、保护与优化原理(防止反编译)
  • C语言扫雷小游戏
  • 用取样思想一探AIX上进程性能瓶颈
  • 分布式搜索引擎elasticsearch(二)
  • Tecplot绘制涡结构(Q准则)
  • Whisper
  • Android系统分析
  • 五、关闭三台虚拟机的防火墙和Selinux
  • 【从零开始学习Redis | 第六篇】爆改Setnx实现分布式锁