当前位置: 首页 > news >正文

Python|爬虫和测试|selenium框架的安装和初步使用(一)

前言:

Python作为一门胶水语言来说,可以说是十分的优秀,什么事情都可以干,并且在某些领域还能干的非常不错,尤其是在爬虫和测试领域,该语言可以说是没有对手。

这么说的原因是因为如果你要使用爬虫爬取某些东西或者对于某些项目做一些测试工作,并且这个测试工作还是比较繁琐的时候,那么,Python可以帮助你实现完全的自动化,从而解放双手和大脑,而你并不会去考虑其它的任何语言,虽然这些功能其它语言是能够实现的,例如,测试工作,Java语言可以实现,js语言也可以实现,如果从开发效率这个维度来看的话,开发效率会是Python的几分之一甚至是十几分之一,如果从运行效率这个维度来看的话,那么,其它的语言可能会比Python快上那么一丢丢,但,who  care呢?

单纯的从测试这个工作的视角来看,现在有很多的工具可以实现,例如jmeter,ab,selenium,TestDirector ,silktest,apifox,loadrunner等等工具,这些工具按类型可以分为压力测试,性能测试,功能测试等等。

那么,功能测试里selenium是比较好的一款软件了,只是它需要使用Python语言开发,使用上是有一定的难度的(接近前端的底层,完全在代码层面控制操作)

而selenium可以做压力测试,功能测试和性能测试,但主要集中在性能测试上,突出的优点是该软件由于是完全模拟人工点击,因此它的准确率是非常高的。

那么,本文将介绍如何安装部署selenium以及selenium模拟登录的一个演示,也就是一个基本的性能测试。

一,

selenium框架的架构

selenium框架可以运行在Python2或者Python3下,基本是不挑Python版本的,这一点是比较友好的地方。

其次,需要一个浏览器,比如,谷歌浏览器,Firefox浏览器,eg浏览器,IE浏览器等等,一般支持的是这四种常用的浏览器,但浏览器的版本最好是不要太高,接近用户所使用的浏览器版本即可。

最后呢,就是selenium需要浏览器的驱动,一般谷歌浏览器的驱动下载地址:CNPM Binaries Mirror   这里需要特别注意,驱动的版本和浏览器的版本最好是一致的,不能相差太大,否则selenium可能会启动报错。

如果selenium成功的启动,它将会通过驱动,打开一个浏览器的实例,并按照你代码内的定义动作进行点击或者输入,例如自动登录某个网站(这个网站可能会是你的项目的入口),当然了,随着技术的进步,高版本的selenium会在后台打开一个无头浏览器,也就是说这个浏览器你是看不到的,但它会做你定义的动作。

特别说明:

测试工作一般是在应用端,也可以理解为客户端工作(也就是b端),而百分之九十的项目是部署在Linux端(一般需要测试的项目是b/s架构的),但客户端一般都是使用Windows的,因此,selenium也主要是安装在Windows端,前面刚开始学习的时候就犯糊涂了,在Linux下安装selenium,通常是不需要这样做的。

本次实验用的Python版本是3.8.1,谷歌浏览器版本是86版本

 

驱动下载一定要注意是win32的 

 

二,

Windows部署环境

非常的简单,没什么好说的,Python安装都不好意思说了,非常的简单,傻瓜化的下一步就完事。

selenium也是非常的简单,一条命令就可以了:pip install selenium  ,这里只是需要注意一点,由于Python的安装包基本都是国外的,因此需要本地化处理一下:

严谨点,在资源管理器栏输入命令 :%appdata%,该命令是定位该文件夹,在此目录内新建文件夹名称为pip,在该新建文件夹内新建文本文档名称为pip.ini。写入如下内容:

[global]
index-url=http://mirrors.aliyun.com/pypi/simple/
timeout = 6000
[install] 
trusted-host=mirrors.aliyun.com

打开cmd,执行上面的安装命令pip install selenium 

注意了哈,这里安装的selenium是4.11.2版本,4.0版本以上和4.0版本以下selenium的用法是有很多差异的,本例以4.0版本以上为例,就不说4.0版本以下了 

三,

运行第一个selenium,打开百度的首页

需要先把谷歌浏览器的驱动放置到Python的可执行文件同层目录下,具体步骤如下:

1,

查询Python的安装位置

2,

chromedriver_win32.zip这个文件解压出来的驱动放置到上面查询的目录下即可 

3,

编写Python文件,文件内容如下:

from selenium import webdriver# 初始化浏览器为chrome浏览器
browser = webdriver.Chrome()# 访问百度首页
browser.get(r'https://www.baidu.com/')# 关闭浏览器
browser.close()

4,

cmd窗口内运行此Python文件

如果谷歌浏览器版本和驱动的版本不匹配将会报错如下:

(我是使用了114的驱动,但谷歌浏览器的版本是86,因此报错)

 正常的无报错的运行:

 四,

保持selenium的窗口是打开的状态

代码内增加一个无限循环:

from selenium import webdriver# 初始化浏览器为chrome浏览器
browser = webdriver.Chrome()
while 2>0:# 访问百度首页browser.get(r'https://www.baidu.com/')# 关闭浏览器
browser.close()

效果如下图:

那么这个方式是比较粗暴的,有没有优雅一些的方法呢?

from selenium import webdriver# 获取配置对象 => 什么样的浏览器就选择什么浏览器配置
option = webdriver.ChromeOptions()
option.add_experimental_option("detach", True)# 获取driver对象, 并将配置好的option传入进去
driver = webdriver.Chrome(options=option)
driver.get('https://www.baidu.com')

五,

关于谷歌浏览器和谷歌浏览器的驱动问题

首先,谷歌浏览器和它的驱动是必须要强对应的,比如,谷歌浏览器版本是版本 89.0.4389.128(正式版本) (64 位),那么,驱动应该是下图那样的

 

 其次,是谷歌浏览器会自动更新升级,而自动更新升级是比较难以关闭的,因此,可以选择谷歌的离线安装版本,这样可以规避谷歌浏览器的自动升级,因此,本文将谷歌浏览器的离线安装包分享出来,大家根据自己情况使用:

链接:https://pan.baidu.com/s/1ba74wDCYT5TY1uocxjFyBA?pwd=kkey 
提取码:kkey 

OK,如果谷歌浏览器是正常安装的话,selenium会自动的找到它,如果是离线安装的,比如,我后面将谷歌浏览器安装在了桌面,这个时候自然是找不到谷歌浏览器了,怎么办呢?

代码里指定谷歌浏览器的位置:

注:需要多导一个模块,也就是第三行,第四行指定谷歌浏览器的执行文件,第五行表示程序执行完不关闭浏览器

#codding=utf-8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
options = Options()
options.binary_location = "C:\\Users\\Administrator\\Desktop\\chrome\\Chrome-bin\\chrome.exe"
options.add_experimental_option("detach", True)
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

同时指定驱动的位置:

#注:增加第四行,变量path的值是驱动的路径,在后面的对象中引用即可。

#codding=utf-8
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service
options = Options()
options.binary_location = "C:\\Users\\Administrator\\Desktop\\chrome\\Chrome-bin\\chrome.exe"
options.add_experimental_option("detach", True)
path=Service('f:\\chromedriver.exe')
driver = webdriver.Chrome(options=options,service=path)
driver.get("http://www.baidu.com")

OK,selenium暂时调试好了,下一篇文章将讲述如何实际应用此框架。

http://www.lryc.cn/news/148143.html

相关文章:

  • SAP FI之定义财务年和财务年度变式(Fiscal Year Variants)
  • 关于SAM中decomposed Relative Positional Embeddings的理解
  • 1、Spring是什么?
  • 【华为OD机试python】阿里巴巴找黄金宝箱(IV)【2023 B卷|200分】
  • 操作系统复习总结5
  • 【LeetCode】406.根据身高重建队列
  • 渗透测试漏洞原理之---【任意文件包含漏洞】
  • day28 异常
  • Pico使用C/C++选择使用哪个I2C控制器,以及SDA和SCL针脚
  • C++动态内存管理
  • SpringBoot—日志
  • 如何在,Linux中安装Luajit2.*
  • 单片机-如何让数码管动态显示
  • 在Visual Studio 2017上配置并使用OpenGL
  • 【C++】多态学习
  • 大数据之Maven
  • 自制centos7.9的wsl发行版
  • 使用VisualStudio制作上位机(五)
  • ChatGPT在医疗领域可应用于改善与患者的沟通
  • 直播预告|博睿学院第四季即将开讲:博睿数据资深运维团队现身说法!
  • 端到端自动驾驶综述
  • mysql索引、事务、存储引擎
  • 【CMU15445】Fall 2019, Project 2: Hash Table 实验记录
  • PMP证书是不是烂大街了?
  • Mac下Docker Desktop安装命令行工具、开启本地远程访问
  • Java实现根据商品ID获取京东商品详情数据,1688商品详情接口,1688API接口封装方法
  • element-plus指定el-date-picker的弹出框位置
  • 游戏陪玩语音聊天系统3.0商业升级独立版本源码
  • TCP/IP网络江湖武艺传承:物理层与通信江湖的幕后(物理层中篇:物理层与现代通信技术)
  • Nuxt 菜鸟入门学习笔记三:视图