电商双11美妆数据分析
一、项目背景:双 11 美妆数据的价值所在
每年的 “双 11” 购物节都是电商行业的盛宴,而美妆品类作为消费热门领域,蕴含着丰富的用户行为与市场趋势信息。该项目聚焦双 11 期间的美妆电商数据,旨在通过数据分析揭示以下核心问题:
- 美妆品类的热销商品特征是什么?
- 不同品牌、不同品类的销售表现有何差异?
- 如何从海量商品标题中提取关键信息,辅助产品定位与营销策略制定?
这些问题的答案不仅能为商家提供运营参考,也能帮助消费者更清晰地了解市场动态。
核心分析工具与技术亮点
在数据分析过程中,项目巧妙运用了中文自然语言处理与数据清洗技术,其中最关键的工具便是jieba 分词库—— 中文文本处理的 “利器”。
二、数据初步了解
三、数据清洗
1. 重复值处理

2. 缺失值处理

3. 数据挖掘寻找新的特征
给出各个关键词的分类类别
对是否是男性专用进行分析并新增一列
对每个产品总销量新增销售额这一列

四、数据分析及可视化
通过图表不难看出以下几点:
--悦诗风吟的商品数量遥遥领先,然而其商品销量只排在第三位,总销售额只排在第五位。
--SKII,玉兰油,植村秀商品数量大概都在500-1500的范围,而销量为0。
--相宜本草商品数量也只属于中游,但其销量销售额均排在第一位,由于其销量是第二名的大约两倍,而销售额远不到两倍,所以销售额/销量,也就是每一单的均价也是一个值得研究的新指标。
通过加入平均每单单价之后,观察销售额较高的几个品牌相宜本草,欧莱雅,佰草集,悦诗风吟,雅诗兰黛。其中相宜本草,悦诗风吟,欧莱雅都是平均单价200元以下的,佰草集为200-300元区间,雅诗兰黛为大于500元区间。是否能够判断价格亲民的品牌的销售额会相对来说更高?下面根据这里的数据先把平均单价分为几个区间,其中0-100元记为A类,100-200元记为B类,200-300元记为C类,300元及以上记为D类。
各个类别的销售情况
用seaborn包给出每个店铺各个大类以及各个小类的销量销售额
电商双11美妆数据分析 - Heywhale.com