当前位置: 首页 > news >正文

解决selenium使用chrome下载文件(如pdf)时,反而打开浏览器的预览界面

文章目录

  • 解决方法
  • 完整的配置

解决方法

在初始化浏览器的时候,添加以下配置即可:

    option = webdriver.ChromeOptions()prefs = {"profile.managed_default_content_settings.images": 2,  # 禁止加载图片# 'permissions.default.stylesheet': 2,  # 禁止加载css# ====== 配置下载 ====='profile.default_content_settings.popups': 0,  # 取消下载确认弹窗# 默认下载路径'download.default_directory': r"C:\Users\User4\Downloads", # 这个是自定义的下载路径"profile.default_content_setting_values.automatic_downloads": 1,  # 允许多文件下载"download.prompt_for_download": False,  # To auto download the file"download.directory_upgrade": True,"plugins.always_open_pdf_externally": True}option.add_experimental_option("prefs", prefs)browser = webdriver.Chrome(options=option)

完整的配置

使用如下程序初始化,可以避免很多问题:

from selenium import webdriver
def get_browser():option = webdriver.ChromeOptions()option.add_argument('--disable-gpu')option.add_argument('lang=zh_CN.UTF-8')# option.add_argument('headless')  # 无界面prefs = {"profile.managed_default_content_settings.images": 2,  # 禁止加载图片# 'permissions.default.stylesheet': 2,  # 禁止加载css# ====== 配置下载 ====='profile.default_content_settings.popups': 0,  # 取消下载确认弹窗# 默认下载路径'download.default_directory': r"C:\Users\User4\Downloads","profile.default_content_setting_values.automatic_downloads": 1,  # 允许多文件下载"download.prompt_for_download": False,  # To auto download the file"download.directory_upgrade": True,"plugins.always_open_pdf_externally": True}option.add_experimental_option("prefs", prefs)browser = webdriver.Chrome(options=option)browser.implicitly_wait(10)  # 等待元素最多10sbrowser.set_page_load_timeout(10)  # 页面10秒后强制中断加载return browser

在需要下载文件时,只需要直接browser.get(网络文件URL)即可直接下载文件到配置的"C:\Users\User4\Downloads"路径下:

    browser = get_browser()browser.get("http://xxxx/xxx.pdf") # 这里会直接下载
http://www.lryc.cn/news/238564.html

相关文章:

  • 2024年山东省职业院校技能大赛中职组“网络安全”赛项竞赛试题-C
  • 基于Python实现用于实时监控和分析 MySQL 服务器的性能指标和相关信息工具源码
  • Android 10-13鼠标右键返回功能适配
  • 51单片机/STM32F103/STM32F407学习1_点亮LED灯
  • (Transfer Learning)迁移学习在IMDB上训练情感分析模型
  • 蓝桥杯每日一题2023.11.20
  • 【迅搜02】究竟什么是搜索引擎?正式介绍XunSearch
  • 【Sql】sql server还原数据库的时候,提示:因为数据库正在使用,所以无法获得对数据库的独占访问权。
  • 【Go语言实战】(26) 分布式搜索引擎
  • 【理解ARM架构】不同方式点灯 | ARM架构简介 | 常见汇编指令 | C与汇编
  • JS服务端技术—Node.js知识点锦集
  • 界面控件DevExpress WPF流程图组件,完美复制Visio UI!(一)
  • 为什么选择B+树作为数据库索引结构?
  • 什么是神经网络(Neural Network,NN)
  • 15 Go的并发
  • 管理体系标准
  • 【Java 进阶篇】揭秘 Jackson:Java 对象转 JSON 注解的魔法
  • ②【Hash】Redis常用数据类型:Hash [使用手册]
  • 十七、SpringAMQP
  • Java虚拟机(JVM)的调优技巧和实战
  • idea中的sout、psvm快捷键输入,不要太好用了
  • shell脚本字典创建遍历打印
  • 【设计模式】聊聊职责链模式
  • 【C++进阶之路】第五篇:哈希
  • CentOS基Docker容器时区配置解决方案
  • 探索 Material 3:全新设计系统和组件库的介绍
  • 《多GPU大模型训练与微调手册》
  • 【C++】const与类(const修饰函数的三种位置)
  • 深度学习在图像识别中的革命性应用
  • R语言读文件“-“变成“.“