当前位置: 首页 > article >正文

简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 “高级配置” 选项卡 ==》把 “只获取网址” 勾去不选择 ==》提取值类型选择 “节点属性” ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 “日期等正则提取” 选项卡 ==》正则捕获组处填写  openW\('(.*)'\)  ==》测试 ==》没问题,保存

四、结果

http://www.lryc.cn/news/2400625.html

相关文章:

  • React 性能监控与错误上报
  • AI 如何改变软件文档生产方式?
  • 激光干涉仪:解锁协作机器人DD马达的精度密码
  • Windows如何定制键盘按键
  • go语言学习 第1章:走进Golang
  • 使用Prometheus+Grafana+Alertmanager+Webhook-dingtalk搭建监控平台
  • HOPE800系列变频器安装到快速调试的详细操作说明
  • vCenter与ESXi主机每分钟周期性断连修复
  • JMeter函数整理
  • Sql Server 中常用语句
  • web3-区块链困境破解指南:从数字化签名到Rollup 到分片
  • 李飞飞World Labs开源革命性Web端3D渲染器Forge!3D高斯溅射技术首次实现全平台流畅运行
  • 小鹏汽车5月交付新车33525台 同比增长230%
  • OpenCV——Mat类及常用数据结构
  • 深入解析FutureTask:原理与实战
  • 每天总结一个html标签——Audio音频标签
  • 使用 React Native 开发鸿蒙(HarmonyOS)运动健康类应用的系统化准备工作
  • web3-Remix部署智能合约到“荷兰式”拍卖及以太坊gas费机制细讲
  • 网络编程及原理(一)
  • superior哥AI系列第9期:高效训练与部署:从实验室到生产环境
  • 【Linux】进程 信号保存 信号处理 OS用户态/内核态
  • [ Qt ] | 与系统相关的操作(一):鼠标相关事件
  • stm32使用hal库模拟spi模式3
  • 安装 Nginx
  • Vue-1-前端框架Vue基础入门之一
  • OurBMC技术委员会2025年二季度例会顺利召开
  • postman自动化测试
  • 力扣热题100之二叉树的直径
  • 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)
  • c++ 命名规则