【人工智能agent】--dify实现文档内容的自动抽取
Dify 实现文档内容自动抽取并生成新文档的完整流程.
想象一下这样的场景:一个文档需要选取里面的一部分内容,做rag大模型问答,
工作流如下:
目录
1.上传文档
2.提取文档内容
3.大模型提取
4.md转docx
5.测试
1.上传文档
开始节点输入需要上传的文档:
2.提取文档内容
可以使用其他工具(需要对图片处理),我这里是用自带的:
这个好像是会把文档内容处理成,markdown格式,
3.大模型提取
请提取出文档中我需要的数据,就是标题+内容.并且严格按照输出要求输出.,
规范输出格式,严格按照markdown格式输出,输出结果显示为可视化的markdown。文档:{{#1750758704829.text#}}输出参数:
1. 基本信息(输出表格,直到‘气藏概况’截止)4. 构造特征:(直到“构造圈闭特征”截止)
4.1.构造圈闭特征
4.2.断层特征(直到‘地层及沉积相’截止)*/****
4.md转docx
商店搜索:doc
也可以使用:
转换成文档格式:
5.测试
由于数据保密: