当前位置: 首页 > news >正文

数据分析师之Excel数据清洗

前言

目前,掌握一定的Excel技能时,怎么通过自己的技能实现数据分析的操作,就需要进行具体项目的实战,本身数据分析这个行业是非常吃经验的,既然我们是小白入坑,就需要多做实战演练,才能够实际的拿到这一行的敲门砖

数据分析流程

分析流程:明确需求->确认思路->处理数据->分析数据->展示数据,撰写报告->效果反馈

处理数据

数据清洗:选择子集->列名重命名->删除重复值->缺失值处理->一致化处理

删除重复值:找到不可重复的字段(例如ID之类),观察重复值是否完全一致,后保留唯一项

缺失值处理:缺失值数量较少,可直接删除该行数据;文本型,如果和其他列有关联关系(如省份和地州),可以自行判断填充,若实在无关联关系,可以放弃该维度的分析;缺失值数量大,数值型进行填充(均值、中位数)

一致化处理:对于某些数据列,需要规范数据类型之类的内容

异常值处理:对于某些数据是不符合需求要求的数据可以进行剔除

http://www.lryc.cn/news/446847.html

相关文章:

  • 手机解压软件加密指南:让文件更安全
  • python yield generator 详解
  • MATLAB矩阵下标引用
  • syn洪水攻击原理是什么
  • 前缀和(4)_除自身以外数组的乘积
  • 第二十一节:学习Redis缓存数据库的Hash操作(自学Spring boot 3.x的第五天)
  • OpenCV视频I/O(1)视频采集类VideoCapture介绍
  • CVE-2024-46103
  • 三,MyBatis-Plus 的各种查询的“超详细说明”,比如(等值查询,范围查询,模糊查询...)
  • Linux 冯诺依曼体系结构与操作系统概念
  • UE4中 -skipbuild -nocompile 有什么区别
  • k8s篇之数据挂载类型及区别
  • LiveQing视频点播流媒体RTMP推流服务功能-支持电子放大拉框放大直播视频拉框放大录像视频流拉框放大电子放大
  • fetch怎么使用
  • 回归预测 | Matlab基于SO-SVR蛇群算法优化支持向量机的数据多输入单输出回归预测
  • 光耦知识分享:如何挑选合适的可控硅光耦型号
  • MySql Explain优化命令使用
  • Android NestedScrollView+TabLayout+ViewPager+ 其它布局,ViewPager 不显示以及超出屏幕不显示问题
  • Linux开机logo设置
  • webpack插件开发 模拟vue系统登录后,获取a标签下的文件
  • 大规模数据处理:分库分表与数据迁移最佳实践
  • TCP网络编程概述、相关函数、及实现超详解
  • Cluade 3.5 Sonnet 提示词泄露
  • git clone代码报错Permission denied (publickey)
  • QT设计中文输入法软键盘DLL给到C#开发步骤
  • 使用 Rust 和 wasm-pack 开发 WebAssembly 应用
  • 1. IP地址介绍
  • 喜报来袭~又有一波优秀企业选择Smartbi
  • Web端云剪辑解决方案,BS架构私有化部署,安全可控
  • AI 代码助手插件推荐