当前位置: 首页 > news >正文

mupdf加载PDF显示中文乱码

现象

加载PDF显示乱码,提示非嵌入字体

 non-embedded font using identity encoding

调式

在pdf-font.c中加载字体

调试源码发现pdf文档的字体名字居然是GBK,估计又是哪个windows下写的pdf生成工具生成pdf

字体方法:

static pdf_font_desc *
load_cid_font(fz_context *ctx, pdf_document *doc, pdf_obj *dict, pdf_obj *encoding, pdf_obj *to_unicode)

具体加载

 pdf_to_name(ctx, pdf_dict_get(ctx, dict, PDF_NAME(BaseFont)));

解决

转码发现是宋体,简单判断转换下

  unsigned char utf8SimSun[]={0xe5,0xae,0x8b,0xe4,0xbd,0x93};unsigned char gbkSimSun[]={0xcb,0xce,0xcc,0xe5};
     if(0 == memcmp(basefont,utf8SimSun,sizeof(utf8SimSun))){fz_warn(ctx, "basefont:宋体UTF8");basefont = "SimSun";}if(0 == memcmp(basefont,gbkSimSun,sizeof(gbkSimSun))){fz_warn(ctx, "basefont:宋体GBK");basefont = "SimSun";}

PDF字体查看

可以借助福昕软件查看
在这里插入图片描述

http://www.lryc.cn/news/393571.html

相关文章:

  • 常用的限流工具Guava RateLimiter 或Redisson RRateLimiter
  • 卷积神经网络(CNN)和循环神经网络(RNN) 的区别与联系
  • Unity【入门】场景切换和游戏退出及准备
  • Python 函数递归
  • MyBatis(27)如何配置 MyBatis 实现打印可执行的 SQL 语句
  • 3.js - 裁剪平面(clipIntersection:交集、并集)
  • 在5G/6G应用中实现高性能放大器的建模挑战
  • Perl 数据类型
  • 网络协议 -- IP、ICMP、TCP、UDP字段解析
  • 【工具】豆瓣自动回贴软件
  • 初学Spring之动态代理模式
  • Visual studio 2023下使用 installer projects 打包C#程序并创建 CustomAction 类
  • vue学习笔记(购物车小案例)
  • 昇思25天学习打卡营第19天 | RNN实现情感分类
  • 【VUE基础】VUE3第三节—核心语法之ref标签、props
  • 生物化学笔记:电阻抗基础+电化学阻抗谱EIS+电化学系统频率响应分析
  • SQL使用join查询方式找出没有分类的电影id以及名称
  • 对MsgPack与JSON进行序列化的效率比较
  • Unix\Linux 执行shell报错:“$‘\r‘: 未找到命令” 解决
  • 动态路由--RIP配置(思科cisco)
  • python - 函数 / 字典 / 集合
  • connect to github中personal access token生成token方法
  • Appium启动APP时报错Security exception: Permission Denial
  • ubuntu22 使用ufw防火墙
  • 初识STM32:开发方式及环境
  • 详解Amivest 流动性比率
  • pycharm小游戏制作
  • 昇思11天
  • AI绘画Stable Diffusion【图生图教程】:图片高清修复的三种方案详解,你一定能用上!(附资料)
  • 适用于Mac和Windows的最佳iPhone恢复软件