当前位置: 首页 > news >正文

【工具】arxiv_latex_cleaner 去除latex注释

https://github.com/google-research/arxiv-latex-cleaner/issues/24

文章目录

  • 1.修改编码
  • 2.如何安装
    • 2.1.打包
    • 2.2.安装
  • 3.测试功能

注意:需要创建python==3.9的环境

1.修改编码

官方提供的arxiv_latex_cleaner的编码格式是有问题的,见这里。这个有位朋友说需要改成utf-8,但是还是报错

  File "D:\Env\anaconda\envs\arxiv_clean\lib\codecs.py", line 322, in decode(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 706: invalid start byte

原因是我的windows电脑采用的是ISO-8859-1编码,所以需要对代码做如下修改

def _read_file_content(filename):with open(filename, 'r', encoding='ISO-8859-1') as fp:lines = fp.readlines()lines = _strip_tex_contents(lines, '\\end{document}')return lines

修改完成后再安装

2.如何安装

2.1.打包

tar -zcvf 给打包的文件起个名字呗.tar.gz   文件包在的目录

比如:tar -zcvf arxiv-latex-cleaner.tar.gz arxiv-latex-cleaner

2.2.安装

pip install /path/to/package.tar.gz

3.测试功能

直接cd到指定的.tex目录下

arxiv_latex_cleaner ./
http://www.lryc.cn/news/453020.html

相关文章:

  • macOS开发环境配置与应用开发
  • 15分钟学 Python :编程工具 Idea 和 vscode 中配置 Python ( 补充 )
  • MyBatis 如何实现延迟加载?深度探讨 MyBatis 的延迟加载:如何优化数据访问效率
  • springboot系列--web相关知识探索三
  • AI冲击下的编程职业未来:你缺的不是技术,而是跨学科思维!
  • 是否是 2 的幂次方
  • 音视频入门
  • C++随心记 续一
  • 消息中间件:RabbitMQ
  • sql-labs:42~65
  • KaTeX.js渲染数学公式
  • 算法训练营打卡Day19
  • H.264编解码工具 - FFmpeg
  • 60 序列到序列学习(seq2seq)_by《李沐:动手学深度学习v2》pytorch版
  • elementPlus的tree组件点击后有白色背景
  • 【Git】Git在Unity中使用时的问题记录
  • python学习记录6
  • MongoDB 的基本使用
  • 数据揭秘:分类与预测技术在商业洞察中的应用与实践
  • 学MybatisPlus
  • 如何使用工具删除 iPhone 上的图片背景
  • 软件工程-数据流图
  • 链式前向星(最通俗易懂的讲解)
  • 【C++设计模式】(四)创建型模式:简单工厂模式,工厂方法模式,抽象工厂模式
  • 浅析Golang的Context
  • 生日礼物C++代码
  • 使用python基于DeepLabv3实现对图片进行语义分割
  • 【漏洞复现】泛微OA E-Office do_excel.php 任意文件写入漏洞
  • 算法(食物链)
  • ubuntu20.04系统安装zookeeper简单教程