当前位置: 首页 > news >正文

Pandas实战100例 | 案例 31: 转换为分类数据

案例 31: 转换为分类数据

知识点讲解

在处理包含文本数据的 DataFrame 时,将文本列转换为分类数据类型通常是一个好主意。这可以提高性能并节省内存。Pandas 允许将列转换为 category 类型。

  • 分类数据类型: category 类型适用于那些只包含有限数量不同值的列(例如,性别、产品类型、评级等)。
示例代码
# 由于代码执行环境重置,需要重新导入 pandas 和准备数据
import pandas as pd# 示例数据
data_categorical_conversion = {'Product': ['Apple', 'Banana', 'Cherry', 'Date', 'Elderberry'],'Price': [5, 3, 9, 7, 1]
}
df_categorical_conversion = pd.DataFrame(data_categorical_conversion)# 转换为分类数据
df_categorical_conversion['Product'] = df_categorical_conversion['Product'].astype('category')df_categorical_conversion.dtypes, df_categorical_conversion

在这个示例中,我们将 Product 列从普通的字符串类型转换为了 category 类型。

示例代码运行结果
Product    category
Price         int64
dtype: objectProduct  Price
0       Apple      5
1      Banana      3
2      Cherry      9
3        Date      7
4  Elderberry      1

这个结果展示了转换后的数据类型为 category。使用分类数据类型,尤其在处理具有重复值的文本列时,是一种有效的数据优化技术。

http://www.lryc.cn/news/280013.html

相关文章:

  • 椋鸟C语言笔记#33:文件的顺序读写
  • Transformer - Attention is all you need 论文阅读
  • 安装配置Flink
  • 解决Spss没有创建虚拟变量的选项的问题
  • wxWidgets实战:使用mpWindow绘制阻抗曲线
  • 深度学习15—(迁移学习)冻结和解冻神经网络模型的参数
  • 强化学习应用(八):基于Q-learning的无人机物流路径规划研究(提供Python代码)
  • 常见面试题之HTML
  • 数据结构与算法教程,数据结构C语言版教程!(第三部分、栈(Stack)和队列(Queue)详解)六
  • 使用Docker部署PDF多功能工具Stirling-PDF
  • linux安装系统遇到的问题
  • groovy XmlParser 递归遍历 xml 文件,修改并保存
  • 小程序基础学习(多插槽)
  • 爬虫补环境jsdom、proxy、Selenium案例:某条
  • 电子学会C/C++编程等级考试2021年09月(四级)真题解析
  • DevExpress历史安装文件包集合
  • 科技云报道:“存算一体”是大模型AI芯片的破局关键?
  • watch监听一个对象中的属性 - Vue篇
  • Spark---RDD序列化
  • Xtuner大模型微调
  • JavaScript基础04
  • HarmonyOS@Observed装饰器和@ObjectLink装饰器:嵌套类对象属性变化
  • x-cmd pkg | jless - 受 Vim 启发的命令行 JSON 查看器
  • 【HuggingFace Transformer库学习笔记】基础组件学习:Datasets
  • [机缘参悟-126] :实修 - 从系统论角度理解自洽的人生:和谐、稳定,不拧巴,不焦虑,不纠结
  • 慢 SQL 的优化思路
  • 强化学习(一)简介
  • 外贸常用网站
  • Android中集成FFmpeg及NDK基础知识
  • 1.13寒假集训