当前位置: 首页 > news >正文

【Kaggle | Pandas】练习5:数据类型和缺失值

文章目录

    • 1. 获取列数据类型.dtype / .dypes
    • 2. 转换数据类型.astype()
    • 3. 获取数据为空的列 .isnull()
    • 4. 将缺少值替换并且排序.fillna(),.sort_values()

1. 获取列数据类型.dtype / .dypes

数据集中points列的数据类型是什么?

# Your code here
dtype = reviews.points.dtype

2. 转换数据类型.astype()

从points列中的条目创建一个系列,但将条目转换为字符串。提示:字符串在本机 Python 中是str

point_strings = reviews.points.astype(str)

3. 获取数据为空的列 .isnull()

有时价格列为空。数据集中有多少评论缺少价格?

missing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
# Cute alternative solution: if we sum a boolean series, True is treated as 1 and False as 0
n_missing_prices = reviews.price.isnull().sum()
# or equivalently:
n_missing_prices = pd.isnull(reviews.price).sum()

4. 将缺少值替换并且排序.fillna(),.sort_values()

最常见的葡萄酒产区有哪些?创建一个系列,计算每个值在region_1字段中出现的次数。该字段经常缺少数据,因此将缺少的值替换为Unknown 。按降序排列。你的输出应该是这样的:
在这里插入图片描述


reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending = False)
http://www.lryc.cn/news/474341.html

相关文章:

  • 《YOLO 目标检测》—— YOLO v4 详细介绍
  • Ubuntu:通过ssh链接另外一台Ubuntu
  • 黄山谷捷提交创业板IPO注册,募资扩产提升综合竞争力
  • (python)如何进行加密
  • 夸克网盘免费扩容 20T 福利,无限次叠加,亲测有效
  • 开源协议类型及长安链开源协议介绍
  • SQL Server 可观测最佳实践
  • 青少年编程能力等级测评CPA Python编程(一级)
  • WebSocket 连接频繁断开的问题及解决方案
  • [CSP篇] CSP2024 游记(上)
  • Mac “屏幕保护程序启动或显示器关闭后需要密码“无效
  • 架构师之路-学渣到学霸历程-35
  • 2024-10月的“冷饭热炒“--解读GUI Agent 之computer use?phone use?——多模态大语言模型的应用进阶之路
  • sheng的学习笔记-AI基础-激活函数
  • 重构代码之重复的观察数据
  • SpringBoot【实用篇】- 热部署
  • C语言 核心语法2
  • 【论文阅读】Real-ESRGAN
  • 安达发|零部件APS车间排程系统销售预测的优点
  • Android 同花顺面经
  • 搜维尔科技:Manus数据手套在水下捕捉精确的手指动作, 可以在有水的条件下使用
  • 网络:IP分片和组装
  • Oracle dblink创建使用
  • Classic GNNs are Strong Baselines: Reassessing GNNs for Node Classification
  • Android 字节飞书面经
  • 选择好友窗口(三)
  • 【含文档】基于ssm+jsp的音乐播放系统(含源码+数据库+lw)
  • 【C语言】动态内存开辟
  • Redis缓存在thinkPHP/fastAdmin框架中的应用
  • Ceisum无人机巡检视频投放