当前位置: 首页 > news >正文

读书笔记//来自公众号(1)

——【9大数据分析方法】——

总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。
总结2:抓住两个关键因素:维度(类别)、指标

一、周期性分析

1.常见的周期包括2种:自然周期/生命周期。

  • 自然周期:指标随时间推移而自然发生波动。
  • 生命周期依据对象分为3类:商品生命周期,app生命周期,用户生命周期。参考线:时间轴+指标走势。如:第1天/第2天/第3天,天/周/月。

2.周期性分析的作用:做出一个参考曲线,为进一步判断提供依据。

二、结构分析

1.结构分析,对指标在维度上做层层拆解和对比,如用户、行业、渠道、区域、产品等维度。
2.结构分析的作用:把握结构变化情况,追踪指标走势,能快速定位问题发生点,为进一步针对性提出解决方案提供方向。

三、分层分析

1.用户分群、商品ABC分析、行业二八法则,本质就是分层分析。
2.分层分析,针对单一指标,是为了应对平均值失效的场景,如异常值、极大值等
3.设定分层的层级的方法: “二四六八十”法则

  • 比平均值高的,根据平均值的2倍、4倍、6倍、、分层。
  • 比平均值低的,根据平均值的1/2、1/4分层。
    4.分层分析的作用:是其他分析的前哨战,做好分层,能引发更多思考和分析。
    5.单一指标用分层分析,两个指标用矩阵分析,多个指标用DEA模型。

四、矩阵分析

1.矩阵分析,对两个指标各自确定一个阈值分类点,划分出4个象限,把分析对象映射到矩阵图上。阈值客观上可以取平均数,主观上可以根据专家判断、或资源承受力等。
2.矩阵分析的作用:从两个指标交叉对比种发现问题。
3.常见的KANO模型(用户需求分析)和波士顿矩阵(企业实力分析),本质就是找两个评价指标,构造交叉矩阵,对业务分类。两个指标可以是互相矛盾的(收入规模和利润)、或互相促进的(增长率和占有率)。
4.有两个场景不适合用矩阵分析,①有极值影响平均数,②两个指标高度相关。

五、指标拆解

1.常见指标关系:

  • 并列关系(相互独立),如业绩=客户数x消费率x客单价
  • 串行关系(前后关系),如漏斗模型最后一个指标的逆推

2.固定的指标拆解法:财务分析领域的杜邦分析(利润=收入-成本),零售行业的人货场模型。

3.指标拆解的流程:

  • 找到主指标
  • 找到负责主指标的部门
  • 确认子指标可采集到数据
  • 列车拆解公式,进行数据对比

4.指标拆解的作用:可以发现问题,解释问题。

六、漏斗分析

1.漏斗分析,可处理多个指标,指标对应业务在流程上有顺序关系。
2.漏斗分析的作用:可以看到问题发生在哪里,但无法解释。

七、相关分析

1.直接相关,即有些指标之间天然存在关系,有三种形式:

  • 在结构分析法种,整体指标与部分指标之间的关系
  • 在指标拆解中,主指标与子指标之间的关系
  • 在漏斗分析法中,前后步骤指标之间的关系
    2.间接相关。有两种常用分析方法:散点图、计算相关系数。
    3.相关分析法的不足:
  • 相关不等于因果
  • 相关分析不能解决非量化指标因素。有时候我们寻找关系的因素不能量化,如装修风格。关于非量化特征与指标的关系,用标签分析法。
    4.相关分析的作用:可以解释问题、可以预测。

八、标签分析

1.标签分析,把难以量化的因素转化为标签类别,比较不同标签下指标的差异。
2.标签化要确保标准统一、达成统一认识。
3.qx感觉标签分析与结构分析有很多相似之处。

九、MECE法

1.当有太多因素影响分析不知从何入手,可以用MECE把影响因素梳理清楚。先把最大因素分离出来,再分离小的因素。由大到小,逐步剥洋葱。
2.MECE指的是相互独立、完全穷尽的分类原则,可采用二分法(A和非A)。
3.该方法的不足是,有些因素无法量化,有时候缺乏数据。

——【必备7大能力】——

能力一:理解业务
业务流程、业务动作、业务方期望的结果
能力二:梳理需求
清晰的需求要说清楚5W:
who:数据使用者
when:数据使用时间
where:数据使用场合
why:使用数据原因(做监控?找原因?做预测?)
what:具体数据格式
能力三:梳理指标体系
qx根据我的项目经验,一开始的指标比较基础,往往为了满足监控和效果统计,随着业务深入开展,需要查找指标异常原因,在分析中提炼固化一些指标。业务发生变化,如变动更复杂更多样,相应要增加指标,同时理清指标间的关系。
能力四:梳理标签体系
注意:业务部门对标签有约定俗成的说法,不同部门之间标签口径混乱不一。能沟通一致最好,不能的话出报告要备注。
能力五:选择分析方法——数据分析
预测类方法:用哪个模型?
原因类方法:从哪个角度切入?如果构建逻辑链?
检验类方法:假设是什么?从哪个角度检验?
评估类方法:从哪些角度评估更合理、全面?
能力六:设计数据实验
结合业务流程,设计实验方法,要考虑具体问题:如抽样方式、样本量等等。
能力七:输出数据报告
做好汇报,很考验综合能力。数据分析首先是描述和发现问题。异常指标往往指向对应业务的负责人/负责部门,这是个找茬的活儿啊。
业务通常会找各种理由:

  • 质疑数据
  • 活动不如预期、指标不达标,如“自然增长率”计算不合理,或者大环境不行

本篇整理来自微信公众号【码工小熊】。作者在互联网大厂从事数据分析,很勤快,写了很多总结。有一些真知灼见,值得摘要。

http://www.lryc.cn/news/8137.html

相关文章:

  • 10款让程序员用了会上瘾的工具
  • 类和对象(下)(一)
  • 46.在ROS中实现global planner(2)
  • 05- 泰坦尼克号海难生死预测 (机器学习集成算法) (项目五)
  • 【python百炼成魔】python运算符的使用与输入输出函数
  • uniapp实现app检查更新与升级-uni-upgrade-center详解
  • 公司项目引入这种方式,开发应用真是又快又准!
  • virtuoso数据库介绍
  • linux高级命令之编辑器 vim
  • 分布式光伏储能系统的优化配置方法(Matlab代码实现)
  • Grafana loki部署及使用及问题处理方法(超详细)
  • vue项目如何使用 SheetJS(xlsx)插件?
  • 项目管理工具dhtmlxGantt甘特图入门教程(九):支持哪些数据格式(上篇)
  • iView Table合并单元格(行、列)
  • 如何用P6软件编制项目进度计划(下)
  • 环境配置完整指导——Installing C++ Distributions of PyTorch
  • 深度学习——自注意力机制和位置编码(笔记)
  • 内网渗透(三十)之横向移动篇-利用远控工具向日葵横向移动
  • 自动化测试中,该如何高效管理测试数据?
  • Qt中项目A调用另一个项目B的方法汇总
  • 【项目精选】基于Javaee的影视创作论坛的设计与实现(视频+论文+源码)
  • 深入【虚拟列表】动态高度、缓冲、异步加载... Vue实现
  • Windows 11 + WSL(ubuntu 20.04) + CLion(2022.3) 编译OpenJDK12
  • Freemarker 语法精粹
  • 使用Benchto框架对Trino进行SQL性能对比测试
  • Redis之哨兵模式
  • Selenium自动化测试Python二:WebDriver基础
  • 蓝桥杯模块学习17——AT24C02存储器(深夜学习——单片机)
  • netty
  • Django项目部署-uWSGI