当前位置: 首页 > article >正文

Selenium-Java版(css表达式)

css表达式

前言

根据 tag名、id、class 选择元素

tag名 

#id 

.class

选择子元素和后代元素 

定义 

语法

根据属性选择 

验证CSS Selector 

组选择 

按次序选择子节点 

父元素的第n个子节点 

父元素的倒数第n个子节点 

父元素的第几个某类型的子节点 

父元素的倒数第几个某类型的子节点 

奇数节点和偶数节点 

兄弟节点选择 


前言

参考教程:Python + Selenium Web自动化 2024版 - 自动化测试 爬虫_哔哩哔哩_bilibili

上期文章: Selenium-Java版(操作元素)-CSDN博客

根据 tag名、id、class 选择元素

tag名 

List<WebElement> elements = wd.findElements(By.cssSelector("div"));

等价于 

List<WebElement> elements = wd.findElements(By.tagName("div"));

#id 

WebElement element = wd.findElement(By.cssSelector("#searchtext"));

等价于

WebElement element = wd.findElement(By.id("searchtext"));

.class

List<WebElement> elements = wd.findElements(By.cssSelector(".animal"));

等价于

List<WebElement> elements = wd.findElements(By.className("animal"));

选择子元素和后代元素 

定义 

在这段HTML代码中:

id为layer1layer2的两个元素是id为container的元素的直接子元素

id为inner11inner12的两个元素是id为layer1的元素的直接子元素

id为inner21div元素是id为layer2的div元素的直接子元素

id为inner11、id为inner12和id为inner21的元素以及两个span元素id为container的div元素的后代元素

语法

如果元素2元素1的直接子元素,需要选择元素2

元素1 > 元素2

可以套娃,选择元素4 

元素1 > 元素2 > 元素3 > 元素4

如果元素2元素1的后代元素,需要选择元素2,中间用空格 

元素1   元素2

也可以套娃,选择元素4  

元素1   元素2   元素3  元素4

大于号和空格还可以混用

示例 

List<WebElement> elements = wd.findElements(By.cssSelector("#container>#layer1 span"));

根据属性选择 

除了id、class这种web元素的常用属性,css 选择器支持通过任何属性来选择元素,语法是用一个方括号 [] 

运行代码

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.edge.EdgeDriver;import java.time.Duration;
import java.util.Scanner;public class Main {public static void main(String[] args) {// 创建WebDriver对象WebDriver wd = new EdgeDriver();wd.manage().timeouts().implicitlyWait(Duration.ofSeconds(10));// 打开网页wd.get("https://www.byhy.net/cdn2/files/selenium/sample1.html");// 根据属性选择元素WebElement element = wd.findElement(By.cssSelector("[href='http://www.miitbeian.gov.cn']"));// 打印出元素对应的htmlSystem.out.println(element.getAttribute("outerHTML"));// 创建Scanner对象等待用户输入Scanner scanner = new Scanner(System.in);System.out.println("等待回车键结束程序");scanner.next();// 关闭浏览器wd.quit();}
}

输出结果

前面可以加上标签名的限制,中间不能有空格,否则代表的是上级的标签名

WebElement element = wd.findElement(By.cssSelector("a[href='http://www.miitbeian.gov.cn']"));

表示选择所有标签名为a,href属性值为http://www.miitbeian.gov.cn的元素。 

也可以不指定属性值,直接[href],表示选择所有具有属性名为href 的元素,不管属性值。 

还可以选择属性值包含某个字符串的元素

如:选择a节点里面的href属性包含了miitbeian字符串的元素

a[href*='miitbeian']

还可以选择属性值以某个字符串开头的元素 

a[href^='http']

还可以选择属性值以某个字符串结尾的元素 

a[href$='gov.cn']

如果一个元素有多个属性,可以指定同时具有多个属性的限制, 如:

div[class='misc'][ctype='gun'] 

验证CSS Selector 

打开开发者工具栏后,按ctrl+f可以打开搜索框 

有高亮显示元素,说明CSS语法正确

组选择 

选择所有 id 为 t1 里面的spanp元素,使用逗号

#t1 > span , #t1 > p

 不能这样写,因为这样是选择所有idt1里面的span所有的p元素 

#t1 > span,p

注意:组选择结果列表中的排序,不是组表达式的次序,而是元素在HTML文档中的出现的次序。 

按次序选择子节点 

父元素的第n个子节点 

    <body>  <div id='t1'><h3> 唐诗 </h3><span>李白</span><p>静夜思</p><span>杜甫</span><p>春夜喜雨</p>              </div>      <div id='t2'><h3> 宋词 </h3><span>苏轼</span><p>赤壁怀古</p><p>明月几时有</p><p>江城子·乙卯正月二十日夜记梦</p><p>蝶恋花·春景</p><span>辛弃疾</span><p>京口北固亭怀古</p><p>青玉案·元夕</p><p>西江月·夜行黄沙道中</p></div>             </body>

选择唐诗和宋词的第一个作者,也就是说选择的是第2个子元素,并且是span类型

span:nth-child(2)

如果不加节点类型限制,写成这样

:nth-child(2)

就是选择所有位置为第2个的所有元素,不管是什么类型,这里就会把id='t2'整个元素选进去。 

如果这样写,只选到李白

#t1>:nth-child(2)

父元素的倒数第n个子节点 

选择的是父元素的倒数第一个子节点,并且是p元素

p:nth-last-child(1)

父元素的第几个某类型的子节点 

同样选择李白和苏轼 

span:nth-of-type(1)

如果选择杜甫和辛弃疾

span:nth-of-type(2)

父元素的倒数第几个某类型的子节点 

选择静夜思和青玉案·元夕

p:nth-last-of-type(2)

奇数节点和偶数节点 

选择的是父元素的偶数节点  

p:nth-child(even)

选择的是父元素的数节点 

p:nth-child(odd)

选择的是父元素的某类型偶数节点 

p:nth-of-type(even)

选择的是父元素的某类型奇数节点  

p:nth-of-type(odd)

兄弟节点选择 

选择李白和苏轼,就是选择h3后面紧跟着的兄弟节点span 

h3 + span

选择所有作者,就是选择h3后面所有的兄弟节点span 

h3 ~ span

也可以在前面加父元素的tag名或者属性,更精确查找

http://www.lryc.cn/news/2379323.html

相关文章:

  • 产品更新丨谷云科技 iPaaS 集成平台 V7.5 版本发布
  • 深度学习让鱼与熊掌兼得
  • TDuckX 2.6 正式发布|API 能力开放,核心表单逻辑重构,多项实用功能上线。
  • LeetCode Hot100刷题——除自身以外数组的乘积
  • JAVA EE(进阶)_进阶的开端
  • PDF批量合并拆分+加水印转换 编辑 加密 OCR 识别
  • Go语言交替打印问题及多种实现方法
  • ArcGIS Pro调用多期历史影像
  • 10.11 LangGraph多角色Agent开发实战:生产级AI系统架构与性能优化全解析
  • 组态王|组态王中如何添加西门子1200设备
  • 发布时将多个bpl 打包成一个bpl的方法,或者说:不需要vcl60.bpl情况下 18.5K的exe 照常可以运行。
  • 6.2.2邻接表法-图的存储
  • C++23 放宽范围适配器以允许仅移动类型(P2494R2)
  • 【技海登峰】Kafka漫谈系列(十一)SpringBoot整合Kafka之消费者Consumer
  • Spring Boot三层架构设计模式
  • 在Java中调用Ant命令
  • WebRTC技术下的EasyRTC音视频实时通话SDK,助力车载通信打造安全高效的智能出行体验
  • 数据科学和机器学习的“看家兵器”——pandas模块 之二
  • 本地部署Firecrawl+Dify调用踩坑记录
  • MySQL--day2--基本的select语句
  • 什么是dom?作用是什么
  • Trae - 国人Cursor的免费平替产品
  • 自动化:批量文件重命名
  • Jsoup库和Apache HttpClient库有什么区别?
  • 学习!FastAPI
  • Linux 安装 Unreal Engine
  • 【第三十六周】LoRA 微调方法
  • 什么是 Boosting
  • Redis 数据类型与操作完全指南
  • Digi XBee XR 系列介绍