当前位置: 首页 > news >正文

ComPDFKit 转档SDK OCR表格识别功能

我们非常高兴地宣布,适用于 Windows、iOS、Android 和服务器的 ComPDFKit 转档SDK 1.8.0 现已发布!在该版本中,OCR 功能支持了表格识别,优化了OCR文字识别率。PDF to HTML 优化了html 文件结构,使转换后的 HTML 文件容量大幅减少。

OCR 表格识别:

Windows:

CPDFConvertWordOptions wordOptions = new CPDFConvertWordOptions();

wordOptions.IsAllowOCR = false;

Mac:

CPDFConvertWordOptions *options = [[CPDFConvertWordOptions alloc] init]

autorelease];

[options setIsAllowOCR:YES];

如果您想了解更多平台有关如何使用OCR的更多信息,请访问我们详细的OCR指南。

PDF to HTML:

Windows:
string resPath = “";
string inputFilePath = "
”;
string outputFolderPath = “";
string outputFileName = "
”;

CPDFConverter.Init(resPath);
CPDFConverterHTML converter = CPDFConvertFactroy.CreateConverter(CPDFConvertType.CPDFConvertTypeHtml, inputFilePath) as CPDFConverterHTML;

CPDFConvertHTMLOptions htmlOptions = new CPDFConvertHTMLOptions();
htmlOptions.PageAndNavigationPaneOpts = PageAndNavigationPaneOptions.SinglePageNavigationByBookmarks;
htmlOptions.IsAllowOCR = false;
htmlOptions.IsContainAnnotations = true;
htmlOptions.IsContainImages = true;

int pageCount = converter.GetPagesCount();
int[] pageArray = new int[pageCount];
for (int i = 0; i < pageArray.Length; i++)
{
pageArray[i] = i + 1;
}

ConvertError error = ConvertError.ERR_UNKNOWN;
converter.Convert(outputFolderPath, ref outputFileName, htmlOptions, pageArray, ref error, getPorgress);

如果您想了解更多平台有关如何使用PDF to HTML转换的更多信息,请访问我们详细的PDF to HTML指南。

问题修复:

  • 修复了 PDF 转 Word 对繁体文档进行 OCR 时可能会Crash 问题。
  • 修复了 PDF 转 RTF 会多出一页空白页的问题。
  • 修复了 PDF 转 RTF 的**OnProgress()**回调函数返回进度过慢的问题。
  • 修复了 PDF 转 Excel 在文档没有表格的情况下,OnlyTable等于 true 时,返回转换失败的问题,现在会生成一个空白的 Excel 文件。
  • 修复了 PDF 转 HTML 部分文件链接无法跳转的问题。
  • 修复了 PDF 转 HTML 部分文件注释丢失的问题。
  • 修复了 PDF 转 jpg 和 png,传入DPI 参数为负数时 Crash 问题。

总的来说,我们相信此次更新将把您使用 ComPDFKit 的体验提升到一个全新的水平。我们将继续优化我们的功能,为每一位用户提供更好的用户体验。欢迎您联系我们,试用 ComPDFKit 并向我们提供反馈意见。

http://www.lryc.cn/news/101858.html

相关文章:

  • 华为OD机考--阿里巴巴黄金箱
  • mybatis-config.xml-配置文件详解
  • 【雕爷学编程】MicroPython动手做(18)——掌控板之声光传感器
  • Ribbon源码
  • Linux下在终端输入密码隐藏方法
  • 【ARM 常见汇编指令学习 3 -- ARM64 无符号位域提取指令 UBFX】
  • 求分享如何批量压缩视频的容量的方法
  • ChatGPT 是如何工作的:从预训练到 RLHF
  • KafKa脚本操作
  • 【自动化运维】playbook剧本
  • java中双引号和单引号的区别
  • jenkinsfile指定jenkins流水线的构建号
  • 微信小程序:实现提示窗确定,取消执行不同操作(消息提示确认取消)showModal
  • 深度学习论文: Q-YOLO: Efficient Inference for Real-time Object Detection及其PyTorch实现
  • 解读随机森林的决策树:揭示模型背后的奥秘
  • OceanMind海睿思获评中国信通院“内审数字化产品评测”卓越级(最高级)!
  • TPlink云路由器界面端口映射设置方法?快解析内网穿透能实现吗?
  • css3的filter图片滤镜使用
  • ❤️创意网页:打造炫酷网页 - 旋转彩虹背景中的星星动画
  • react常用知识点
  • iOS开发-QLPreviewController与UIDocumentInteractionController显示文档
  • 八、用 ChatGPT 帮助排查生产事故
  • WPF实战学习笔记25-首页汇总
  • FreeRTOS源码分析-7 消息队列
  • 机器学习深度学习——权重衰减
  • 【Linux】线程互斥 -- 互斥锁 | 死锁 | 线程安全
  • 【vue-pdf】PDF文件预览插件
  • Flink集群运行模式--Standalone运行模式
  • Spring整合JUnit实现单元测试
  • Spring Boot学习路线1