当前位置: 首页 > news >正文

029—pandas 遍历行非向量化修改数据

前言

在 pandas 中,向量化计算是指利用 pandas 对象的内置方法和函数,将操作应用到整个数据结构的每个元素,从而在单个操作中完成大量的计算。
但在一些需求中,我们无法使用向量化计算,就需要迭代操作,本例就是这样的一种情况。

需求:

  1. 第一行的值为所在行的 a + b
  2. 第二行及以后的值为 上一行的 c + a

思路:

  • 本例不是一个向量化的计算,因为第一行的计算逻辑与其他行的计算逻辑不同。针对,这样的情况,我们可以用迭代的方法进行灵活的操作。
  • 先根据第一行的计算逻辑增加 c 列,然后迭代并排除第一行,对其他行按计算逻辑进行修改。

二、使用步骤

读入数据

代码如下(示例):

import pandas as pddf = pd.DataFrame({'a': [5, 6, 7], 'b': [3, 5, 8]})
df

在这里插入图片描述

# 按第一行的计算逻辑增加 c 列:
df['c'] = df.a+df.b
df

在这里插入图片描述

# 迭代计算修改其他行:
# 遍历df的每一行,返回一个命名元组,命名元组的字段包括Index和DataFrame中的各列
for i in df.itertuples():if i.Index != 0:df.loc[i.Index, 'c'] = i.a + df.loc[i.Index-1, 'c'] # 当前行的'a'列值与上一行的'c'列值相加,并将结果赋值给当前行的'c'列
# 以上代码,df.itertuples() 产生一个可迭代 map 对象,每行是一个 namedtuple 类型数据。即:for i in df.itertuples():print(i)

在这里插入图片描述

# 接着判断如果索引不是第一行(值为 0)就用 loc 获取定位并进行修改,最后得到的数据为:df

在这里插入图片描述

总结

以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

http://www.lryc.cn/news/319926.html

相关文章:

  • 相机安装位置固定后开始调试设备供电公司推荐使用方法
  • AI视频批量混剪系统|罐头鱼AI视频矩阵获客
  • 线程池学习-了解,自定义线程池
  • CentOS7.9 安装SIPp3.6
  • Java零基础入门-LinkedHashMap集合
  • LRC转SRT
  • mybatis源码阅读系列(二)
  • 【Web开发】CSS教学(超详细,满满的干货)
  • 系列学习前端之第 5 章:学习 ES6 ~ ES11
  • Linux学习(4)——使用编辑器
  • 简单函数_短信计费
  • centos命令history设置记录10000行
  • SpringBoot打造企业级进销存储系统 第七讲
  • 1.实用Qt:解决绘制圆角边框时,圆角锯齿问题
  • JavaWeb08-Filter和Listener
  • 关于ClickHouse的一些小技巧
  • 有来团队后台项目-解析7
  • 用户数据的FLASH存储与应用(FPGA架构)
  • Chrome的V8引擎 和操作系统交互介绍
  • Redis:持久化、线程模型、大 key
  • Linux 16个常用脚本(初级)练习
  • 接口测试及接口测试工具【Postman】相关的面试题
  • android 怎么自定义view
  • JavaScript的事件
  • android 简单快速 自定义dialog(简单好用,不需要设置样式)
  • JAVA代理模式梳理
  • 推荐几个线上兼职,每天两小时收入几十到一百
  • excel封装和ddt D17
  • PHP8编译安装
  • 3D Gaussian Splatting for Real-Time Radiance Field Rendering(慢慢啃,还是挺复杂的)