当前位置: 首页 > news >正文

OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错
调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;
合合通用多语言:
https://www.textin.com/experience/text_recognize_3d1

做的是真不错啊,demo的交互和体验起飞!百度的通用模型:
https://ai.baidu.com/tech/ocr/general?p=%E5%8A%9F%E8%83%BD%E6%BC%94%E7%A4%BA&from=experience
在这里插入图片描述
版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

http://www.lryc.cn/news/152797.html

相关文章:

  • 倍增的经典题目:扩大区间、st表
  • LeetCode——和为K的子数组(中等)
  • Truncation Sampling as Language Model Desmoothing
  • docker安装jenkins
  • 学习pytorch8 土堆说卷积操作
  • pytest自动化测试两种执行环境切换的解决方案
  • 说说TIME_WAIT和CLOSE_WAIT区别
  • Docker的优势
  • C++——string使用
  • 10. selenium API (二)
  • [国产MCU]-W801开发实例-用户报文协议(UDP)数据接收和发送
  • JavaScript 生成 16: 9 宽高比
  • HTML5之drawImage函数
  • leetcode7.整数反转-Java
  • 操作系统备考学习 day2 (1.3.2 - 1.6)
  • Django-跨域
  • wireshark抓包体验
  • Prometheus+grafana安装配置
  • 长连接和短连接有什么区别?
  • Qt应用开发(基础篇)——输入对话框 QInputDialog
  • C++ struct 笔记(超级详细)
  • Vue基础1:生命周期汇总(vue2)
  • Linux串口驱动
  • java反编译工具jd-gui使用
  • Linux 之 shell 脚本
  • 如何去阅读开源的第三方库的源码
  • 浅析Linux虚拟网络技术
  • 设计模式之九:迭代器与组合模式
  • 官方推荐:6种Pandas读取Excel的方法
  • Redis与Mysql区别