当前位置: 首页 > news >正文

【爬虫】web自动化和接口自动化

 专栏文章索引:爬虫

目录

一、介绍

二、推荐

1.接口自动化

2.Web自动化


一、介绍

爬虫技术一般可以分为两种类型:接口自动化和web自动化。下面是它们的简要介绍:

1.接口自动化

接口自动化技术的主要目的是通过模拟HTTP请求来实现自动化,通常用于测试web API和抓取数据。接口自动化爬虫可以直接访问数据接口获取数据,它可以通过发送规范的HTTP请求来实现数据的抓取和操作。接口自动化技术适用于需要大量抓取数据的需求,以及在抓取时对页面交互没有要求的场景。

综上所述,根据不同的需求和场景,可以选择适合自己的爬虫类型,分别应用Web自动化或接口自动化技术来进行网页数据的抓取和处理。

2.Web自动化

Web自动化技术旨在模拟人类操作浏览器来实现自动化,通常用于对网页进行操作和抓取数据。Web自动化爬虫可以通过自动化浏览器驱动,模拟人类的行为来实现数据的抓取和操作。Web自动化技术可以模拟页面操作、登陆、填表、拖拽等操作,非常适合于需要登录并模拟用户操作的网站、复杂的网页交互以及需要抓取动态网页数据的需求。

二、推荐

1.接口自动化

  • requests库

python的第三方库,目前使用比较多

2.Web自动化

  • Selenium

初学者可以先学习这个工具

  • DrissionPage

语法跟Selenium类似,由于出现的比较晚,检测还不是很严格

  • SaossionPage

DrissionPage的plus版


http://www.lryc.cn/news/322274.html

相关文章:

  • 哔哩哔哩后端Java一面
  • Vue.js前端开发零基础教学(二)
  • Bert模型输出:last_hidden_state转换为pooler_output
  • Docker Compose 基本语法
  • 【算法集训】基础算法:贪心
  • Centos7部署单节点MongoDB(V4.2.25)
  • 隐私计算笔记(1)
  • 查询方法需要使用事务吗?
  • 剑指offer面试题40 数组中只出现一次的数字
  • gitLab server version 13.12.1 is not supported
  • 如何在 iPhone 上使用蓝牙鼠标
  • matlab simulink 电力系统同步发电机励磁系统的建模与仿真
  • AI新工具(20240320) AI创作一首属于自己的音乐; 轻松制作具有透明背景的高质量图像
  • IT服务ITIL4 认证:助力企业数字化转型的必杀技!
  • 微软聘请了谷歌DeepMind的联合创始人
  • JavaMySQL高级一(下)
  • HCIA复习
  • 5G里面NR,gNB,en-gNB,ng-eNB是什么意思
  • android 网络检测简单方法
  • 列表(list)篇(二)
  • Python的反射机制
  • Python数学建模-2.9Matplotlib库
  • 【MySQL】数据库的基础概念
  • Linux:离线安装 jdk-8(配置Java环境)
  • 【DP】第十三届蓝桥杯省赛C++ B组《李白打酒加强版》(C++)
  • 数据结构试卷第九套
  • 【Linux第三课-基础开发工具的使用】yum、vim、gcc/g++编译器、gdb、Make/Makefile编写、进度条程序、git命令行简单操作
  • Redis:ClassCastException【bug】
  • JSON 配置文件
  • 由浅到深认识Java语言(6):控制流程语句