当前位置: 首页 > news >正文

【Datawhale AI夏令营】基于多模态RAG的企业财报问答系统

文章目录

    • 学习资源
    • 数据处理流程
    • 整体架构流程

学习资源

学习者手册:https://www.datawhale.cn/activity/359/learn/206/4495

数据处理流程

原始PDF财报
多模态解析
模态拆分
文本内容
表格数据
图像/图表
文本分块
表格结构化
图像特征提取
文本嵌入
表格描述生成
图像嵌入
向量数据库

整体架构流程

数据处理流水线
文本/表格/图像向量
文本提取器
PDF解析器
表格识别器
图表检测器
文本分块
表格转结构化数据
图表描述生成
文本嵌入模型
表格描述模型
图像嵌入模型
向量数据库
用户界面
查询处理器
多模态检索引擎
向量数据库
多模态生成模型
响应生成
http://www.lryc.cn/news/615155.html

相关文章:

  • Arduino系列教程:点亮一个LED灯
  • 【工具】Python多环境管理
  • Red Hat Enterprise Linux 7.9安装Oracle 11.2.0.4单实例数据库-图文详解
  • Python训练营打卡Day27-类的定义和方法
  • 线程池多反应堆服务器webserver(c++)
  • 算法篇----模拟
  • Linux的软件防火墙iptables
  • QML 鼠标穿透
  • 从免费到盈利:Coze智能体1小时封装变现全流程指南——井云科技
  • 云服务器--阿里云OSS(2)【Springboot使用阿里云OSS】
  • 81 keil仿真调试记录
  • C++11中的移动语义
  • 优化器:SGD、Adam、RMSprop等优化算法对比与机器翻译应用
  • day 16 stm32 IIC
  • 【Java EE初阶 --- 网络原理】JVM
  • 堆----3.数据流的中位数
  • 【Redis】Redis-plus-plus的安装与使用
  • 自定义通知组件跟随右侧边栏移动
  • SQL基本
  • 探索Trae:使用Trae CN爬取 Gitbook 电子书
  • 2025-08-09 李沐深度学习14——经典卷积神经网络 (2)
  • 生态问题是什么?
  • P1890 gcd区间
  • 如何理解SA_RESTART”被信号中断的系统调用自动重启“?
  • SELinux 入门指南
  • ROS2 多线程 与组件机制
  • Python NumPy入门指南:数据处理科学计算的瑞士军刀
  • Qt 的对象线程亲和性规则
  • 华为欧拉OpenEnler系统在启动MindIE时权限问题的解决方法
  • 从灵感枯竭到批量产出:无忧秘书创作平台如何重构内容生产者的工作流程?全环节赋能分析