当前位置: 首页 > news >正文

pd.cut()函数--Pandas

1. 函数功能

将连续性数值进行离散化处理:如对年龄、消费金额等进行分组

2. 函数语法

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True)

3. 函数参数

参数含义
x要离散分箱操作的数组,必须是一维的
bins取值为:(1)整数n:将数据x划分为组距相等的n组;(2)标量组成的序列:指定每组的分界值;(3)IntervalIndex:间隔索引
right布尔值,默认为True:包括每组的右边边界值:当“ right = True”(默认值)时,则“ bins”=[1、2、3、4]表示(1,2],(2,3],(3,4]
labels指定离散化后返回每组的标签,长度与组数一致。默认为None:以分界值组成的左开右闭区间展示;取值为False时,返回一个区分箱的整数组成的序列。
retbins布尔值,默认为False:不返回分箱情况,该参数在bins取值为整数时起作用
precision分箱数值的精度,取值为整数,默认为3
include_lowest布尔值,默认为False:不包括每组的左侧分界值,即:左开区间
duplicates可选参数:当bins的边界值存在重复,采取的措施:raise(报错:默认)或者drop(删除)
ordered布尔值,默认为True:对labels标签排序,属于定序型变量:优秀>良好;取值为False时:得到的标签labels属于定类型变量:如:汉族、维吾尔族

4. 返回值

返回值包括两个

返回值含义
out返回值取决于labels参数的取值:(1)labels参数取值为None(默认):输入为Series时返回一个Series,其他输入类型返回categorical;(2)labels取值为标量组成的序列:输入为Series时返回一个Series,其他输入类型返回categorical;(3)labels取值为False时:返回一个整数组成的数组
bins计算得到或者制定的每组分界值,当retbins=True时,才会返回该值

5. 示例

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

其实标签为上述数字边界组成时,不需要通过Labels特别指定,取值为None时,默认即是上述形式。见下例:
在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/142960.html

相关文章:

  • DataBinding的基本使用
  • eslint和prettier格式化冲突
  • matlab使用教程(26)—常微分方程的求解
  • 尚硅谷宋红康MySQL笔记 14-18
  • 香港全新的虚拟资产服务商发牌制度
  • C# 泛型
  • servlet,Filter,责任的设计模式,静态代理
  • C++中的运算符总结(5):按位运算符(上)
  • 8.Oracle中多表连接查询方式
  • Linux 安装mysql(ARM架构)
  • git:git clone报错提示permissions xxxx for xxxxxx are too open
  • elasticSearch数据的导入和导出
  • DDR PHY
  • XSS攻击是怎么回事?记录一下
  • FFmpeg支持多线程编码并保存mp4文件示例
  • 一文搞懂深度信念网络!DBN概念介绍与Pytorch实战
  • MyBatis:使用注解让数据库操作更简单
  • 基于PyTorch深度学习遥感影像地物分类与目标检测、分割及遥感影像问题深度学习优化
  • 4.网络设计与redis、memcached、nginx组件(一)
  • leetcode分类刷题:矩阵顺时针模拟
  • Java8新特性整理记录
  • 43.227.196.1 RAID技术有什么意义?
  • c++ qt--信号与槽(一) (第三部分)
  • LLM学习《Prompt Engineering for Developer》
  • nginx-获取客户端IP地址
  • Redis 高可用之集群搭建和数据分片
  • 兄弟,王者荣耀的段位排行榜是通过Redis实现的?
  • Linux系统编程--文件编程--打开创建文件
  • http协议与apache
  • 搜索二叉树的算法解析与实例演示