当前位置: 首页 > news >正文

百货商场用户画像描绘and价值分析(下)

目录

  • 内容概述
  • 数据说明
  • 技术点
  • 主要内容
    • 4 会员用户画像和特征字段创造
      • 4.1 构建会员用户基本特征标签
      • 4.2 会员用户词云分析
    • 5 会员用户细分和营销方案制定
      • 5.1 会员用户的聚类分析及可视化
      • 5.2 对会员用户进行精细划分并分析不同群体带来的价值差异

内容概述

本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。

数据说明

数据集分为两部分,.xlsx结尾的是会员信息表,.csv结尾的是销售流水表。其中,会员信息表共有将近19万条记录,销售流水表共有接近189万条记录。

两个表包含了如会员卡号,消费产生时间,性别,出生时间,商品编码,销售数量,商品售价,消费金额,商品名称,此次消费的会员积分,收银机号,单据号,柜组编码,柜组名称,等级时间等 15 个特征。

  • L(入会程度):3个月以下为新用户,4-12个月为中等用户,13个月以上为老用户
  • R(最近购买的时间)
  • F(消费频次):次数20次以上的为高频消费,6-19次为中频消费,5次以下为低频消费
  • M(消费金额):10万以上为高等消费,1万-10万为中等消费,1万以下为低等消费
  • P(消费积分):10万以上为高等积分用户,1万-10万为中等积分用户,1万以下为低等积分用户

技术点

  • 数据预处理:包括去重去缺失值、异常值处理、变量重编码和时间序列数据处理方式等;
  • 数据可视化:饼图、柱状图、折线图、雷达图和复合图等绘制方式等;
  • 特征创造和数据建模:从海量连续数据中创造出性别、消费偏好、入会程度、最近购买的时间、消费频次、消费金额、消费积分等类别数据,建模部分主要通过标准化和归一化数据来对比KMeans聚类的轮廓系数结果。

主要内容

4 会员用户画像和特征字段创造

4.1 构建会员用户基本特征标签

说明积分这一列没有存在异常值
在这里插入图片描述

在这里插入图片描述

查看登记时间和消费产生的时间是否存在异常值,即大于2018-01-03
在这里插入图片描述

筛掉两列异常时间的数据

在这里插入图片描述

说明单个会员有多条消费记录数
在这里插入图片描述

可以先筛选每位会员,然后依据各个字段对进行运算,求出对应的LRFMP

自定义一个函数来实现两列数据时间相减

在这里插入图片描述

开始登记的时间 和 最后一次消费的时间
在这里插入图片描述

调用函数
在这里插入图片描述

会员消费的总次数:
会员消费的总金额:
会员的积分总数:
在这里插入图片描述

创造一列特征字段“消费时间偏好”(凌晨、上午、中午、下午、晚上)

在这里插入图片描述

会员消费的时间偏好,在多项记录中取众数
在这里插入图片描述

会员性别
在这里插入图片描述

开始构建对应的特征标签

在这里插入图片描述

在这里插入图片描述

构建会员用户业务特征标签

取DataFrame之后转置取values得到一个列表,再绘制对应的词云,可以自定义一个绘制词云的函数,输入参数为df和会员卡号

在这里插入图片描述

在这里插入图片描述

查看数据的基本特征

在这里插入图片描述

描述性统计
在这里插入图片描述

开始对数据进行分组

在这里插入图片描述

保存数据

在这里插入图片描述

4.2 会员用户词云分析

开始绘制用户词云,封装成一个函数来直接显示词云

在这里插入图片描述

随机查找一个会员来绘制用户画像
在这里插入图片描述

在这里插入图片描述

5 会员用户细分和营销方案制定

5.1 会员用户的聚类分析及可视化

先对数据进行标准化处理
在这里插入图片描述

对数据进行聚类
在这里插入图片描述

在这里插入图片描述

构造一个绘制聚类可视化效果雷达图的函数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

从上面可以看出,标准化后的数据聚类效果相较于归一化的更好,且从轮廓系数和聚类雷达图也可以看出,聚类数最佳为2。因此,下面我们使用聚类数为2的标准化数据进行聚类,得到两类客户的LRFMP均值数据,以此来判断两者之间的差异

5.2 对会员用户进行精细划分并分析不同群体带来的价值差异

以聚类数为2贴上对应的标签
在这里插入图片描述

统计一下两类用户之间的差异,发现两类客户之间数量相差过大
在这里插入图片描述

用均值来计算两类样本之间的LRFMP

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

从上面可以看出,标签为1的客户消费频次、消费金额和消费积分均远大于标签为0的客户,且这类客户所占的比例仅有2.3%,可以将其定义为“重要保持会员”。标签为0的客户所占比例为97.7%,其会员登记时间跟标签为1的比较接近,但最近一次消费时间较标签1的还要长,可以将其定义为“一般发展会员”


更多详细内容可看
在这里插入图片描述

http://www.lryc.cn/news/339578.html

相关文章:

  • spring-cloud微服务gateway
  • 【python】在pycharm创建一个新的项目
  • java小作业(9)----用函数实现斐波那契数列(第二遍)
  • 部署项目的时候的一些错误
  • 1044: 顺序栈基本操作的实现
  • 微信小程序(总结)
  • C#医学实验室/检验信息管理系统(LIS系统)源码
  • Linux驱动编程-module_platform_driver注册platform_driver
  • 论文解读 --- 《针对PowerShell脚本的有效轻量级去混淆和语义感知攻击检测》
  • 在Spring Boot实战中碰到的拦截器与过滤器是什么?
  • 数据可视化基础与应用-04-seaborn库人口普查分析--如何做人口年龄层结构金字塔
  • 软考之【系统架构设计师】
  • LigaAI x 极狐GitLab,共探 AI 时代研发提效新范式
  • 如何看待2023年图灵奖
  • 《云原生安全攻防》-- 云原生攻防矩阵
  • 自然语言处理: 第二十七章LLM训练超参数
  • Linux使用C语言实现Socket编程
  • Swin Transformer——披着CNN外皮的transformer,解决多尺度序列长问题
  • 数据结构排序算法
  • 【深度剖析】曾经让人无法理解的事件循环,前端学习路线
  • Spring 事务失效总结
  • K8S节点kubectl命令报错x509: certificate signed by unknown authority
  • 【HTML】制作一个简单的实时字体时钟
  • servlet的三个重要的类(httpServlet 、httpServletRequst、 httpServletResponse)
  • 【软考】设计模式之命令模式
  • 波奇学Linux:ip协议
  • Efficient Multimodal learning from data-centric perspective
  • ubuntu下交叉编译ffmpeg到目标架构为aarch架构的系统
  • 【Linux C | 多线程编程】线程同步 | 条件变量(万字详解)
  • 【高阶数据结构】哈希表 {哈希函数和哈希冲突;哈希冲突的解决方案:开放地址法,拉链法;红黑树结构 VS 哈希结构}