当前位置: 首页 > news >正文

解决无法直接抓取链接地址

当我们在爬取一些文章列表的时候,可能无法从接口或者html界面上获取到文章的详细列表

这个时候我们可以通过模拟点击且重写window.open方法,将跳转的地址捕获,并且放到html中去。

这样我们就可以获取到某个文章的详细地址了

    // 保存原始的 window.open 方法const originalOpen = window.open;// 重写 window.open 方法window.open = function(url, target, features) {{// 在这里执行你的自定义操作document.querySelector('.login').url = url;console.log("Intercepted URL:", url);// 不再调用原始的 window.open 方法// return originalOpen(url, target, features);}};
http://www.lryc.cn/news/355654.html

相关文章:

  • java面对对象编程-多态
  • 【Sql Server】随机查询一条表记录,并重重温回顾下自定义函数的封装和使用
  • 基于C#开发web网页管理系统模板流程-主界面管理员录入和编辑功能完善
  • K8s证书过期处理
  • 刷题之路径总和Ⅲ(leetcode)
  • MongoDB 原子操作:确保数据一致性和完整性的关键
  • 2024上半年软考高级系统架构设计师回顾
  • SQL注入绕过技术深度解析与防御策略
  • Redis教程(十六):Redis的缓存穿透、缓存击穿、缓存雪崩
  • 如何实现一个高效的单向链表逆序输出?
  • 使用 Go 实现 HelloWorld 程序,并分析其结构
  • 机器学习:在Python中sklearn库的使用,纯干货!12个小时的整理!
  • XSS 攻击
  • .Net Core 中间件与过滤器
  • 【ARMv7-A】——WFI(wait for interrupt)
  • 92. 反转链表 II
  • Modbus工业网关
  • c++——模板初始识
  • 帆软生成csv文件
  • 12.Redis之补充类型渐进式遍历
  • 品牌做电商控价的原因
  • 安全面试中的一个基础问题:你如何在数据库中存储密码?
  • 【python深度学习】——torch.min()
  • 华为校招机试 - 最久最少使用缓存(20240508)
  • 第三部分:领域驱动设计之分析模式和设计模式应用于模型
  • PID传感器在光电显示行业VOC气体检测的应用
  • iOS推送证书过期处理
  • 蓝海卓越计费管理系统 agent_setstate.php SQL注入漏洞复现
  • 【leetcode2765--最长交替子数组】
  • java文档管理系统的设计与实现源码(springboot+vue+mysql)