基于Dify实现对Excel的数据分析--动态配置图表
在之前的Excel数据分析文章发出后,网友们都在咨询如何实现根据数据情况动态调整图表输出,其实这个不难,这几天抽空做了一个简单实现。主要原理就是在series模板中做工作,其他内容和之前文章类似,这里就不重复了,主要提供自定义代码完整内容。具体如下,供大家参考学习。
一、数据准备
准备一个Excel文件,内容可以是产品月度销售数据或者油气田月度产量数据等。如下图。
二、工作流程设计之自定义代码
自定义代码(Exl2Echart)代码,代码需要在sandbox容器中执行,目前主要支持python和nodejs代码,记得安装相应的依赖库。本文中的csv和json库都是默认安装的。代码详见下方
import csv
import json
def main(csv_string):# 将CSV字符串分割成行lines = csv_string.strip().split('\n')# 使用csv模块读取数据reader = csv.reader(lines)# 将所有行转换为列表data = [row for row in reader]# 将数字字符串转换为浮点数for row in data[1:]: # 跳过标题行,即第一行# 将第二列及之后的所有列的数据类型调整为数字类型(这里是float)for i in range(1, len(row)):try:row[i] = float(row[i])except ValueError:pass# 根据数据情况动态增加图表配置。主要是修改series,这个其实与大模型无关。 custom_series=[] # 1.柱状图:根据data行数增加series列表数据 for row in range(len(data)-1): # 第一个网格中的柱状图系列,取决于行数。 type_schema={"type": "bar", "seriesLayoutBy": "row"} custom_series.append(type_schema) # 2.折线图:根据data列数增加series列表数据 for row in range(len(data[0])-1): # 第二个网格中的折线图系列,取决于列数 type_schema={"type": "line", "xAxisIndex": 1, "yAxisIndex": 1} custom_series.append(type_schema)# 创建完整的ECharts配置echarts_config = {"legend": {},"tooltip": {},"dataset": {"source": data},"xAxis": [{"type": "category", "gridIndex": 0},{"type": "category", "gridIndex": 1}],"yAxis": [{"gridIndex": 0},{"gridIndex": 1}],"grid": [{"bottom": "55%"},{"top": "55%"}],"series": custom_series}# 生成输出文件,这里是echart要求的格式输出output = "```echarts\n" + json.dumps(echarts_config, indent=2, ensure_ascii=False) + "\n```"return {"output": output}
三、应用效果演示
运行工作流后,选择文件后启动对话,在对话框中输入“请分析Excel数据”,即可实现如下效果。演示示例是2个油田4个月度数据,如果用户提供了更多的数据,该agent会自动解析数据,形成多列多行的图表数据,实现对Excel数据分析,大家可以试试。