当前位置: 首页 > news >正文

合合信息OCR支持30类国内常见票据一站式分类识别,支持医疗发票、数电票识别

合合信息TextIn平台明星产品——国内通用票据识别,重磅更新!

产品支持票据类型扩展到23大类、30小类,覆盖场景更全面,同时升级优化了多款票据识别模型,平均识别率较前版本提升11.5%,整体识别速度提升21.9%,识别更快更精准。

▶ 支持多种票据类型

国内通用票据识别依托合合信息多年积累的票据文字OCR识别能力,可识别包含增值税发票、医疗发票、数电票、火车票、出租车发票、飞机行程单、网约车行程单等在内的23大类、30小类国内通用票据,提取其中的信息,并以整理成标准结构化的Key/Value形式返回或导出。

· 医疗票据

国内通用票据识别支持电子医疗发票、纸质门诊发票、纸质住院发票的识别与信息抽取,兼容多种地区版式,精准识别复杂表格信息,助力医保报销、健康险理赔流程自动化。

· 数电票

全面数字化的电子发票(数电票)是与纸质发票具有同等法律效力的新型发票。2022年,国票信息发票通企业数字化税务协同管理平台全新升级数电票功能。2023年12月,数电票试点覆盖到西藏,彻底覆盖全部省/直辖市。

国内通用票据识别支持增值税电子普通发票、增值税电子专用发票、铁路电子客票、航空运输电子客票行程单、区块链电子发票等数电票的票面信息识别,为不满足乐企系统(数电票管理平台)接入条件的小微企业的财务数字化、自动化转型提供有力支持。

▶ 支持多种票据格式

国内通用票据识别支持识别jpg、png、bmp、tiff等多种通用图片格式,以及PDF、OFD格式。

其中,OFD格式作为我国电子学会牵头制定的国家标准,于2009年首次发布,2020年被指定为“增值税电子普通发票”标准文件格式。国内通用票据识别支持全票种多页OFD格式,为有强自动化、批处理需求的用户提供更好的体验。

· 自动分类票种

票据识别OCR多用于报销或审核场景,但具体票据类别难以预测。传统的票据分类方法通常针对某一票面提供单一的API接口,在高吞吐量、多票面场景下难以应对。国内通用票据识别经过深度优化,提供单接口调用服务,自动分类票种并返回识别结果,大幅简化集成难度。用户上传票据时无需手动选择类型,直接上传票据图像,系统即可智能识别类型。

· 图像智能处理,混贴切分

企业报销场景中,常常要求将报销票据黏贴在一页A4纸上。面对混贴多张票据的图像,国内通用票据识别可清晰区分票据,自动切边提取票面信息,智能识别票据类型,便捷切换展示分类识别结果,支持多类票据批量上传、混合扫描、切图、分类、识别。同时对旋转、角度不正的票据图像,也可自动旋转矫正图像,不影响识别效果。

▶ 产品亮点

· 识别准确率高:针对各类票据的打印方式和字体进行专项优化,对针式打印、油墨略微污损的文字提供更高的识别准确率。全票种平均识别率94%以上,增值税发票、电子医疗发票、数电票等常用票种平均识别率可达97%以上。

·识别速度快:平均0.6秒即可完成单次识别。

·适用范围广:支持23大类、30小类的国内主流通用票据类型,支持jpg、png、pdf、ofd等多种文件格式,支持单页、多页文件上传,能满足各类业务场景需求。

·简易集成:标准化API接口,支持智能分类,无需手动指定。

▶ 多种方式灵活部署

国内通用票据识别支持私有化部署、公有云API等多种部署方式,提供前端识别预览和标准化JSON结果。

传统OCR服务中,支持私有化服务的产品往往无法在线试用,而能在线试用的产品又难以原样部署到本地,导致在项目或业务中的不同阶段,验证OCR服务的性能和能力边界变得困难。

合合信息TextIn产品系列采用多端同步引擎架构,确保在线SaaS服务版本与私有化版本的引擎一致性,保障两者提供几乎一致的识别率和性能表现,让在线验证、线下部署成为可能。私有化部署支持CPU、GPU环境及国产化操作系统部署。

同时,SaaS版本和私有化版本还可以简单构成混合云架构,提供灵活的补位选择,满足复杂应用需求。

http://www.lryc.cn/news/423425.html

相关文章:

  • LeetCode-day40-3151. 特殊数组 I
  • 技术研究:Redis 数据结构与 I/O 模型
  • 46-扇孔的处理及铺铜以及布线
  • LVS实验的三模式总结
  • 游戏安全入门-扫雷分析远程线程注入
  • bert-base-chinese模型的完整训练、推理和一些思考
  • JS基础5(JS的作用域和JS预解析)
  • Doris 夺命 30 连问!(中)
  • 书生.浦江大模型实战训练营——(四)书生·浦语大模型全链路开源开放体系
  • SpringBoot 整合 RabbitMQ 实现延迟消息
  • Cilium:基于开源 eBPF 的网络、安全性和可观察性
  • Axios 详解与使用指南
  • 深度学习 —— 个人学习笔记20(转置卷积、全卷积网络)
  • 解决Mac系统Python3.12版本pip安装报错error: externally-managed-environment的问题
  • lvm知识终结
  • ESP32S3 IDF 对 16路输入输出芯片MCP23017做了个简单的测试
  • 【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
  • Redis 的 STREAM 和 RocketMQ 是两种不同的消息队列和流处理解决方案,它们在设计理念、功能和用途上有显著区别。以下是它们的主要区别:
  • Visual Studio Code安装与C/C++语言运行(上)
  • 探索数据可视化,数据看板在各行业中的应用
  • haralyzer 半自动,一次性少量数据采集快捷方法
  • mall-admin-web-master前端项目下载依赖失败解决
  • 【07】JVM是怎么实现invokedynamic的
  • 使用API有效率地管理Dynadot域名,查看参与的拍卖列表
  • Linux 基本指令讲解
  • PRE_EMPHASIS
  • 【QT常用技术讲解】多线程处理+全局变量处理异步事件并获取多个线程返回的结果
  • 数组列表中的最大距离
  • C语言新手小白详细教程(7)指针和指针变量
  • Kafka保证消息不丢失