当前位置: 首页 > news >正文

pandas读取CSV格式文件生成数据发生器iteration

背景

数据集标签为csv文件格式,有三个字段column_hander = [‘id’, ‘boneage’, ‘male’],需要自己定义数据集。文件较大,做一个数据发生器迭代更新数据集。


实现模板

Pandas中,可以使用pandas.read_csv函数读取CSV文件,并使用iter函数将DataFrame转换为迭代器,每次next时返回一行数据。

import pandas as pd# 读取CSV文件到DataFrame
df = pd.read_csv('your_file.csv')# 将DataFrame转换为迭代器
data_iter = iter(df.itertuples(index=False, name=None))# 使用next获取每行数据
try:while True:row = next(data_iter)print(row)
except StopIteration:print("迭代完成")

数据实践

骨龄数据集boneage-training-dataset.csv

import pandas as pdprint("Reading data...")
csv_dir = r"boneage-training-dataset.csv"
boneage_df = pd.read_csv(csv_dir)# 将DataFrame转换为迭代器data_iter = iter(boneage_df.itertuples(index=False, name=None))# 使用next获取每行数据try:while True:row = next(data_iter)print(row)except StopIteration:print("迭代完成")

在这里插入图片描述


Tips

  1. 使用iter函数将DataFrame转换为迭代器使自定义数据集更加丝滑。
http://www.lryc.cn/news/392985.html

相关文章:

  • SpringBoot 启动流程四
  • 实现桌面动态壁纸(二)
  • JavaEE——计算机工作原理
  • 并发、多线程和HTTP连接之间有什么关系?
  • 展开说说:Android服务之startService源码解析
  • Java + MySQL 实现存储完整 Json
  • 解决刚申请下来的AWS EC2,无法用finalshell连接的问题
  • 如何在PD虚拟机中开启系统的嵌套虚拟化功能?pd虚拟机怎么用 Parallels Desktop 19 for Mac
  • vue中实现button按钮的重复点击指令
  • 智能与伦理:Kimi与学术道德的和谐共舞
  • mac有什么解压软件 mac怎么解压7z软件 苹果电脑好用的压缩软件有哪些
  • C语言_练习题
  • Type-C接口快充取电技术的实现
  • 压测工具---Ultron
  • Kubernetes 负载均衡器解决方案 MetalLB实践
  • 力扣爆刷第159天之TOP100五连刷61-65(翻转单词、对称二叉树、遍历求和)
  • (七)[重制]C++命名空间与标准模板库(STL)
  • Elasticsearch:Runtime fields - 运行时字段(一)
  • 03:C语言运算符
  • JAVA每日作业day7.4
  • WordPress网站违法关键词字过滤插件下载text-filter
  • ros1仿真导航机器人 navigation
  • Python制作动态颜色变换:颜色渐变动效
  • Python 异步编程介绍与代码示例
  • 堆叠的作用
  • ubuntu 如何查看某一个网卡的ip地址
  • 跨界客户服务:拓展服务边界,创造更多价值
  • linux驱动编程 - kfifo先进先出队列
  • JS 四舍五入使用整理
  • 上万组风电,光伏,用户负荷数据分享