当前位置: 首页 > news >正文

AI数据分析:用deepseek进行贡献度分析(帕累托法则)

帕累托法则,也称为80/20法则,是由意大利经济学家维尔弗雷多·帕累托提出的。它指出在许多情况下,大约80%的效益来自于20%的原因。这个原则在很多领域都有应用,包括商业、经济、社会问题等。

在数据分析中,帕累托法则可以用来识别和专注于最具影响力的因素。以下是帕累托分析的基本步骤:

数据收集:首先,收集相关数据,确定你的分析目标。

数据排序:将数据按照某个特定的标准(如销售额、成本、频率等)进行排序。

计算总和:计算所有项目的总和。

确定累积百分比:对于每个项目,计算累积百分比。这可以通过将每个项目的值除以总和,然后乘以100来实现。

识别关键因素:识别累积百分比达到80%的那些关键因素(原因)。这通常意味着这些因素是最重要的贡献者。

分析和决策:根据帕累托分析的结果,分析关键因素对整体效益的影响,并做出相应的决策

任务:计算下面Excel表格中用活用户的贡献度

在deepseek中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:

读取Excel文件"F:\AI自媒体内容\AI行业数据分析\poetop50bots中文翻译.xlsx",

用matplotlib绘制一个柱状图:

从A列“热门bot名称”中提取数据作为标签,用于X轴;

从E列“月活用户占比”中提取数据作为大小,用于Y轴;

设置图表的标题为“Poe平台前50个bots月活用户贡献度分析”;

在相同的图表上绘制累积比例曲线,颜色为红色,使用次y轴,次y轴的刻度是从0到1,中间间隔0.1,数据来自于E列,在累积比例曲线上要显示累积比例的数值;

设置matplotlib默认字体为'SimHei',文件路径为:C:\Windows\Fonts\simhei.ttf

保存图片到文件夹“F:\AI自媒体内容\AI行业数据分析”,图片标题为:poetop50bots贡献度;

显示图片;

注意:每一步都输出信息到屏幕

源代码:

import pandas as pd

import matplotlib.pyplot as plt

from matplotlib import font_manager

# 设置matplotlib默认字体

font_path = r'C:\Windows\Fonts\simhei.ttf'

font_prop = font_manager.FontProperties(fname=font_path)

plt.rcParams['font.family'] = 'SimHei'

# 读取Excel文件

file_path = r'F:\AI自媒体内容\AI行业数据分析\poetop50bots中文翻译.xlsx'

df = pd.read_excel(file_path)

# 提取数据

labels = df['热门bot名称']

sizes = df['月活用户占比']

# 计算累积比例

cumulative_sizes = sizes.cumsum() / sizes.sum()

# 绘制柱状图

fig, ax1 = plt.subplots()

ax1.bar(labels, sizes, color='b')

ax1.set_xlabel('热门bot名称')

ax1.set_ylabel('月活用户占比', color='b')

ax1.tick_params(axis='y', labelcolor='b')

# 设置次y轴

ax2 = ax1.twinx()

ax2.plot(labels, cumulative_sizes, color='r')

ax2.set_ylim(0, 1)

ax2.set_yticks([i / 10 for i in range(0, 11)])

ax2.set_ylabel('累积比例', color='r')

ax2.tick_params(axis='y', labelcolor='r')

# 在累积比例曲线上添加文本注释

for i, (label, cumulative_size) in enumerate(zip(labels, cumulative_sizes)):

ax2.annotate(f'{cumulative_size:.2f}', (label, cumulative_size), textcoords="offset points", xytext=(0,10), ha='center')

# 设置图表标题

plt.title('Poe平台前50个bots月活用户贡献度分析')

# 保存图片

image_path = r'F:\AI自媒体内容\AI行业数据分析\poetop50bots贡献度.png'

plt.savefig(image_path)

# 显示图片

plt.show()

print("图表绘制完成,图片已保存到:", image_path)

http://www.lryc.cn/news/365581.html

相关文章:

  • 生成式人工智能的风险与治理——以ChatGPT为例
  • 十足正式在山东开疆拓土!首批店7月初开业,地区便利店现全新面貌!
  • Unity2D游戏开发-玩家控制
  • 如何在 Windows 11 上免费恢复永久删除的文件
  • Spring boot 集成mybatis-plus
  • 数据仓库之缓慢变化维
  • 跑mask2former(自用)
  • Linux日志服务rsyslog深度解析(上)
  • python的df.describe()函数
  • Feign的介绍与说明
  • 【Linux】用户和组的管理、综合实训
  • B=2W,奈奎斯特极限定理详解
  • 【Pytorch 】Dataset 和Dataloader制作数据集
  • [Algorithm][动态规划][两个数组的DP][正则表达式匹配][交错字符串][两个字符串的最小ASCII删除和][最长重复子数组]详细讲解
  • Ffmpeg安装和简单使用
  • 29、matlab算数运算汇总2:加、减、乘、除、幂、四舍五入
  • <Rust><iced>基于rust使用iced库构建GUI实例:动态改变主题色
  • k8s——安全机制
  • Linux驱动应用编程(三)UART串口
  • 【设计模式深度剖析】【4】【行为型】【策略模式】
  • opencv dnn模块 示例(26) 目标检测 object_detection 之 yolov10
  • 【python进阶】python图形化编程之美--tkinter模块初探
  • discuz点微同城源码34.7+全套插件+小程序前端
  • ActiveMQ 介绍、下载、安装和控制台
  • MacOS M系列芯片一键配置多个不同版本的JDK
  • 源码文章上传无忧,论坛小程序支持
  • Docker面试整理-如何优化Docker容器的性能?
  • list(二)和_stack_queue
  • 查询SQL02:寻找用户推荐人
  • 2、Tomcat 线程模型详解