当前位置: 首页 > news >正文

python+playwright 学习-88 禁止加载图片等资源

前言

对于爬虫的小伙伴来说,有时候只需抓取页面的文本,不用加载图片,可以加快操作页面速度,那么我们可以设置禁止加载图片等资源。

禁止图片加载

根据url地址的后缀,图片资源后缀一般是png,jpg,jpeg,gif等格式。

from playwright.sync_api import sync_playwrightwith sync_playwright() as p:browser = p.chromium.launch(headless=False)context = browser.new_context()page = context.new_page()# 方法1 根据url地址后缀page.route("**/*.{png,jpg,jpeg,gif}", lambda route: route.abort())page.goto('https://www.cnblogs.com/yoyoketang')page.pause()

运行效果如下,会看到图片没加载

根据资源类型禁用

资源类型一般有 “document”, “stylesheet”, “script”, “image”, “font”, “xhr” 等。

from playwright.sync_api import sync_playwright
http://www.lryc.cn/news/340856.html

相关文章:

  • Linux:Redis7.2.4的简单在线部署(1)
  • HackMyVM-Connection
  • Prometheus接入AlterManager配置邮件告警(基于K8S环境部署)
  • find方法
  • TLS v1.3 导致JetBrains IDE jdk.internal.net.http.common CPU占用高
  • 计算机网络 2.2数据传输方式
  • 陇剑杯 流量分析 webshell CTF writeup
  • 【测试开发学习历程】python常用的模块(下)
  • GCDAsynSocket之TCP简析
  • 大型网站系统架构演化实例_1.单体架构和垂直架构
  • 2024蓝桥杯——宝石问题
  • three.js加载模型报错,Error: THREE.GLTFLoader: No DRACOLoader instance provided.
  • Spring VS Spring Boot
  • Linux入门(Linux介绍,安装,常用命令,防火墙的设置,注意事项)
  • vue2创建项目的两种方式,配置路由vue-router,引入element-ui
  • MySql 表中的id突然变很大,如何给id重新排序
  • leetcode练习——哈希表
  • 配置交换机 SSH 管理和端口安全
  • 基于SpringBoot+Vue的装饰工程管理系统(源码+文档+包运行)
  • vue3中axios添加请求和响应的拦截器
  • <router-link>出现Error: No match for {“name“:“home“,“params“:{}}
  • prompt 工程整理(未完、持续更新)
  • 兼容性测试用例
  • 阿里云4核8G云服务器价格多少钱?700元1年
  • ts 中的keyof 和typeof
  • 每日一题:买卖股票的最佳时机II
  • nginx安装在linux上
  • ENSP-旁挂式AC
  • 如何获取手机root权限?
  • 2023年全国青少年信息素养大赛(Python)海南赛区复赛真题