当前位置: 首页 > news >正文

Python 图片处理

Step1

提取PDF中的图片,并另存

Step2

去除灰色纸张背景

import PyPDF2
from PIL import ImageEnhance,Image,ImageFilter
import cv2
import numpy as np
from skimage.filters import unsharp_mask
from skimage.filters import gaussian
from skimage.restoration import denoise_tv_chambollelocal = './'pdf_file = open(local+'001.pdf', 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)num_pages = len(pdf_reader.pages)
print("num : "+str(num_pages))
pic_n=0
# 遍历每一页
for page_num in range(num_pages):# 获取当前页对象page_obj = pdf_reader.pages[page_num]# 获取当前页中的所有对象page_objs = page_obj['/Resources']['/XObject'].get_object()# 遍历每个对象for obj_name in page_objs:# 判断对象是否为图片if page_objs[obj_name]['/Subtype'] == '/Image':# 获取图片对象img_obj = page_objs[obj_name]# 获取图片数据img_data = img_obj.get_data()# 将图片数据保存为文件with open(local+"/99_tmp.jpg", 'wb') as img_file:img_file.write(img_data)
###################################################################################### 图片处理image = Image.open(local+"/99_tmp.jpg")#饱和度enhancer = ImageEnhance.Color(image)C_image = enhancer.enhance(0.001)C_image.save("./0_tmp.jpg")img = cv2.imread('./0_tmp.jpg')# 对每个像素进行对比度调整 alpha=对比度  beta=亮度img_contrast = cv2.convertScaleAbs(img, alpha=1.4, beta=0)####################################################################################pnum=str(page_num).zfill(4)pic_str=str(pic_n).zfill(4)img_path ="./image_heibai/"+ pic_str + "_" +"page_"+pnum + '.jpg'cv2.imwrite(img_path,img_contrast) print("image : "+img_path)pic_n=pic_n+1

Step3 

去除黑色边框

Step4

去除阴影部分,字清晰

http://www.lryc.cn/news/160079.html

相关文章:

  • 信道估计 | 信道
  • 腾讯发布超千亿参数规模的混元大模型;深度学习与音乐分析与生成课程介绍
  • [html]当网站搭建、维护的时候,你会放个什么界面?
  • javaee spring aop 的五种通知方式
  • 【Redis】3、Redis主从复制、哨兵、集群
  • vcpkg方式安装zlmediakit
  • 【大数据】基于 Flink CDC 高效构建入湖通道
  • 微信小程序开发---网络数据请求
  • vulkan学习路径
  • NIFI使用InvokeHTTP发送http请求
  • Spire.xls+excel文件实现单据打印
  • win10系统配置vmware网络NAT模式
  • 什么是数据中台,关于数据中台的6问6答6方法
  • 什么是机器学习中的目标函数和优化算法,列举几种常见的优化算法
  • Edge被2345浏览器劫持 解决方法
  • uni-app:重置表单数据
  • 全球城市汇总【最新】
  • Java jvm 内存溢出分析
  • Qt CMake 中国象棋程序实现
  • ArcGIS 10.3安装教程!
  • Kafka的文件存储与稀疏索引机制
  • windowsxp下的mysql集群技术
  • 微信小程序开发---小程序的页面配置
  • 2023数学建模国赛B题完整论文来啦!(含一二问求解代码及三四问仿真模拟代码)
  • ERROR: your rosdep installation has not been initialized yet
  • python 文创产品商城推荐网上购物系统设计与实现vue
  • [lammps教程]OVITO绘制原子运动轨迹线
  • 2037:【例5.4】约瑟夫问题
  • 小节2:Python数学运算
  • 查看Oracle_表名、字段名、注释、进程及杀进程等常用语句