当前位置: 首页 > news >正文

爬虫中XPath语法四个重要概念及示例

一、根节点与非根节点

1、/div :选择div节点,只有当它是文档的根节点时。

2、//div:选择文档中所有的div节点(包括非根节点)。

二、通过属性选择节点

1、//@href:选择带href属性的所有节点。

2、//a[@href='http://baidu.com']:选择页面中所有指向网站的链接。

三、通过位置选择节点

1、//a[3]:选择文档中的第三个链接。

2、//a[position()<3]:选择文档中的前三个链接。

3、//table[last()]:选择文档中的最后一个表。

四、星号(*)匹配任意字符或节点,可在不同条件下使用

1、//table/tr/*:选择所有表格行tr标签的所有的子节点。

2、//div[@*]:选择带任意属性的所有div标签。

http://www.lryc.cn/news/246580.html

相关文章:

  • MySQL-03-索引
  • CSS-长度单位篇
  • 自己动手实现一个深度学习算法——七、卷积神经网络
  • office word 使用笔记
  • vue中下载文件后无法打开的坑
  • 【追求卓越04】数据结构--栈与队列
  • 基于SpringBoot的超市信息管理系
  • 【计算机组成原理】存储系统
  • 基于SSM的旅游管理系统设计与实现
  • JeecgBoot3.0 漏洞升级 — 快速文档
  • 6.一维数组——用冒泡法,选择法将5个整数由大到小排序
  • YOLOv8 onnx 文件推理多线程加速视频流
  • CVE-2017-12615 文件上传
  • c++没有返回值的返回值
  • 全网最全卡方检验汇总
  • Java基础-中级-高级面试题汇(一)
  • 数据结构 / day04 作业
  • Java核心知识点整理大全20-笔记
  • Spark---转换算子、行动算子、持久化算子
  • 什么是关系型数据库?
  • 【LeetCode】挑战100天 Day12(热题+面试经典150题)
  • ArcGIS10.x系列 Python工具箱教程
  • 【蓝桥杯】刷题
  • 软件产品登记的材料条件
  • 春节后跟进客户开发信模板?外贸邮件模板?
  • 个人财务管理软件CheckBook Pro mac中文版特点介绍
  • rfc4301- IP 安全架构
  • 【数据结构/C++】线性表_双链表基本操作
  • 前端已死?看看我的秋招上岸历程
  • Flink Flink中的合流