当前位置: 首页 > news >正文

【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

<p>      aaa   </p>

解析成如下格式:

<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性“prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。
end。

http://www.lryc.cn/news/198707.html

相关文章:

  • Ansible定义各类变量,引用变量方式介绍及注册变量和vars_prompt的用法示例
  • 各类证件的版面信息收集
  • vueday01——ref响应式
  • SpringBoot集成Redisson操作Redis
  • 整数反转
  • 【ELK使用指南 2】常用的 Logstash filter 插件详解(附应用实例)
  • (转)STR 内核做了什么
  • fastapi项目结构以及多进程部署
  • 【LeetCode】 412. Fizz Buzz
  • vector+算法sort与list+sort的效率比较,容易写错的地方原因探析
  • iOS——Manager封装网络请求
  • 【javascript】内部引入与外部引入javascript
  • 掌握JavaScript的练习之道:十个手写函数让你信手拈来!
  • 买卖股票的最佳时机 II[中等]
  • 前端开发调试技巧:如何在Component下选中当前插件并且查看当前插件信息
  • 你是否还迷茫要不要学习Linux?
  • leetcode(1)链表
  • spring boot Rabbit高级教程
  • FTP的魅力:构建高效的文件传输基础
  • 70、window11+visual studio2019+共享内存进行数据传输
  • SSTI模板注入(flask) 学习总结
  • 最近的工作和生活
  • 第六节:Word中对象的层次结构
  • ARJ_DenseNet BMR模型训练
  • React之Hook
  • OSG嵌入QT的简明总结2
  • 日常中msvcp71.dll丢失怎样修复?分享5个修复方法
  • 【腾讯云TDSQL-C Serverless 产品体验】使用 Python向TDSQL-C添加读取数据实现词云图
  • 服务器感染了.360、.halo勒索病毒,如何确保数据文件完整恢复?
  • BAT028:批量将文件修改日期后缀更新为最新修改日期