当前位置: 首页 > article >正文

解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

ragflow版本为:v0.19.0


1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。
看报错怀疑是分片的问题,于是把文档的切片方法中的“建议文本块大小”数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。


2.但是还是有些PDF解析的时候报错如下图:


看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。

http://www.lryc.cn/news/2394288.html

相关文章:

  • c#基础08(数组)
  • 嵌入式学习--江协stm32day3
  • docker-记录一次容器日志<container_id>-json.log超大问题的处理
  • 4.8.1 利用Spark SQL实现词频统计
  • 头歌java课程实验(Java面向对象 - 包装类)
  • 经济法-7-上市公司首次发行、配股增发条件
  • PyTorch中nn.Module详解
  • Mac 每日磁盘写入量异常高
  • 《深入解析Go语言结构:简洁高效的工程化设计》
  • [蓝桥杯]机器人塔
  • 如何将vue2使用npm run build打包好的文件上传到服务器
  • Ubuntu 22.04 系统下 Docker 安装与配置全指南
  • 动态表单开发避坑:改变input的值不会触发change事件即时修复策略-WdatePicker ——仙盟创梦IDE
  • 10.安卓逆向2-frida hook技术-frida基本使用-frida指令(用于hook)
  • 动态设置微信小程序页面标题(navigationBarTitleText属性)
  • 前端流式接收数据讲解
  • Flutter下的一点实践
  • Python训练营打卡 Day41
  • Eclipse集成lombok
  • 什么是trace,分布式链路追踪(Distributed Tracing)
  • VScode ios 模拟器安装cocoapods
  • Redis最佳实践——安全与稳定性保障之数据持久化详解
  • 互联网大厂Java求职面试实战:Spring Boot微服务架构及Kafka消息处理示例解析
  • K 值选对,准确率翻倍:KNN 算法调参的黄金法则
  • 技术栈ES的介绍和使用
  • 跟Gemini学做PPT-模板样式的下载
  • Windows版本的postgres安装插件http
  • uni-app学习笔记十六-vue3页面生命周期(三)
  • 优化的两极:凸优化与非凸优化的理论、应用与挑战
  • (五)MMA(OpenTelemetry/Rabbit MQ/ApiGateway/MongoDB)