python实现pdfs合并
灵感来源于博主正在学408,在搞到视频课对应的ppt.pdf后发现pdf是按小节的,以至于每章有5-10甚至更多,这可太繁琐了,我想要一章一个pdf就可以了,于是浅浅查了几个CSDN发现使用python的要么收费要么要vip,不用py的就是用在线的网站集成的功能,你知道的要充值才能用。算了还是自己搞吧。
由于博主的目标资源是ppt结成图片形成的pdf,也就是要合并的那些pdf文件的内容啊都是图片形式的,不包含字符,大家区分借鉴。
代码如下:
from PyPDF2 import PdfMerger
import osdef merge_pdfs_with_pypdf2(input_folder, output_file):merger = PdfMerger()# 获取文件夹中所有PDF文件pdf_files = [f for f in os.listdir(input_folder) if f.endswith('.pdf')]pdf_files.sort() # 按文件名排序for pdf in pdf_files:file_path = os.path.join(input_folder, pdf)merger.append(file_path)# 输出合并后的PDFmerger.write(output_file)merger.close()print(f"PDFs合并完成,输出文件: {output_file}")# 使用示例
merge_pdfs_with_pypdf2(r'存放pdfs的文件夹路径', "最终输出合并后结果的pdf文件路径/merged.pdf")
注意默认按照文件名的排序进行合并,如有其它想法的可以提前手动编号。