当前位置: 首页 > news >正文

smell---Paddle-DI

跨模态文档智能大模型–Ernie-Layout

目标:提取文档中无结构或半结构化的知识

github项目地址
Paddle NLP
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

ERNIE-Layout基于Transformer Encode架构,并提出以下trick:
1、OCR工具提取信息
借助OCR工具提取图片中的文字及文字对应的坐标信息(bounding box)。例如:paddleOCR等.
2、复杂布局position_ids
ERNIE-Layout借鉴了 DeBERTa 的解耦注意力,依靠Layout-Parser来设计 position_ids。LayoutParser是借助于目标检测模型来提取重要的内容patch,从而避免了两列内容按行扫描的混乱结果。

参考文献

Layout-Parser:
论文
代码

文档智能之ERNIE-Layout 1
文档智能之ERNIE-Layout 2
写在RAGFlow开源2万星标之际

通用信息抽取 UIE

Paddle

参考1:
Paddlenlp与Paddlepaddle

参考2:
ERNIE预训练模型下载

参考3:
PaddleNLP 安装和配置指南
参考4:
paddlenlp教程文档

http://www.lryc.cn/news/514639.html

相关文章:

  • PCL点云库入门——PCL库点云特征之点云法向量(NormalEstimation)及其可视化
  • 25.Java JUC 引入(进程与线程、线程的状态、并发与并行、管程、用户线程与守护线程)
  • Linux 异步 I/O 框架 io_uring:基本原理、程序示例与性能压测
  • Uniapp中使用`wxml-to-canvas`开发DOM生成图片功能
  • Linux之ARM(MX6U)裸机篇----5.仿stm32的LED驱动实验
  • DVWA靶场Open HTTP Redirect (重定向) 漏洞所有级别通关教程及源码审计
  • 探索 JMeter While Controller:循环测试的奇妙世界
  • Flutter踩坑记-第三方SDK不兼容Gradle 8.0,需适配namespace
  • ubuntu支持ssh
  • 浏览器书签智能分类
  • 通俗易懂的讲一下Vue的双向绑定和React的单向绑定
  • Redis 深度解析:从入门到精通
  • 基于物联网的冻保鲜运输智能控制系统
  • 【深度学习基础之多尺度特征提取】多尺度卷积神经网络(MS-CNN)是如何在深度学习网络中提取多尺度特征的?附代码(二)
  • 论文解读之learning to summarize with human feedback
  • STM32学习(六 )
  • 基于 GitHub API 的 Issue 和 PR 自动化解决方案
  • 56.在 Vue 3 中使用 OpenLayers 通过 moveend 事件获取地图左上和右下的坐标信息
  • 文件本地和OSS上传
  • elementui table 表格 分页多选,保持选中状态
  • MSE+Range案例
  • C# 设计模式(结构型模式):代理模式
  • YOLO——pytorch与paddle实现YOLO
  • 持续大额亏损,销量增幅有限,北汽蓝谷依旧黯然神伤
  • C# OpenCV机器视觉:背景减除与前景分离
  • C语言return与 ? :
  • 【论文阅读】SCGC : Self-supervised contrastive graph clustering
  • python pyqt5+designer的信号槽和动态显示
  • 版本控制系统Helix Core 2024.2增强功能:与OpenTelemetry协议集成、Delta同步和传输等
  • certificate verify failed: unable to get local issuer certificate (_ssl.c:10