当前位置：首页 > news >正文

OCR多语言识别模型构建资料收集

news 2025/6/28 2:47:57

OCR多语言识别模型构建

构建多语言识别模型方案

合合，百度，腾讯，阿里这四家的不错
调研多家，发现有两种方案，但是大多数厂商都是将多语言放在一个字典里，构建1w~2W的字典，训练一个可识别多种语言的模型；
合合通用多语言：
https://www.textin.com/experience/text_recognize_3d1

做的是真不错啊，demo的交互和体验起飞！百度的通用模型：
https://ai.baidu.com/tech/ocr/general?p=%E5%8A%9F%E8%83%BD%E6%BC%94%E7%A4%BA&from=experience
在这里插入图片描述
版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

http://www.lryc.cn/news/152797.html

相关文章：

倍增的经典题目：扩大区间、st表

LeetCode——和为K的子数组（中等）

Truncation Sampling as Language Model Desmoothing

docker安装jenkins

学习pytorch8 土堆说卷积操作

pytest自动化测试两种执行环境切换的解决方案

说说TIME_WAIT和CLOSE_WAIT区别

Docker的优势

C++——string使用

10. selenium API （二）

[国产MCU]-W801开发实例-用户报文协议(UDP)数据接收和发送

JavaScript 生成 16: 9 宽高比

HTML5之drawImage函数

leetcode7.整数反转-Java

操作系统备考学习 day2 （1.3.2 - 1.6）

wireshark抓包体验

Prometheus+grafana安装配置

长连接和短连接有什么区别？

Qt应用开发(基础篇)——输入对话框 QInputDialog

C++ struct 笔记（超级详细）

Vue基础1：生命周期汇总（vue2）

Linux串口驱动

java反编译工具jd-gui使用

Linux 之 shell 脚本

如何去阅读开源的第三方库的源码

浅析Linux虚拟网络技术

设计模式之九：迭代器与组合模式

官方推荐:6种Pandas读取Excel的方法

Redis与Mysql区别