当前位置: 首页 > news >正文

爬虫入门——Request请求

 

目录

 

前言

一、Requests是什么?

二、使用步骤

1.引入库

2.请求

3.响应

三.总结


 

 


前言

上一篇爬虫我们已经提及到了urllib库的使用,为了方便大家的使用过程,这里为大家介绍新的库来实现请求获取响应的库。

 

一、Requests是什么?

 

Requests is an elegant and simple HTTP library for Python, built for human beings.

翻译过来就是;Requests 是一个为人类所搭建的PythonHTTP文库,具有优雅而简洁的特点。

 

二、使用步骤

 

1.引入库

 

代码如下(示例):

import requests

 

2.请求

代码如下(示例):

url='https://www.baidu.com'
headers={'User-Agent':'这里加入你自己的UA'
}
response=requests.get(url=url,headers=headers)

 只需要用库去用GET方法即可,体现出了elegant。

96a47384cb5c438b920d15ae4d4886d1.png

复习一下:首先要定制请求头,讲要请求的URL写到变量里方便get或者post方法的运用,那么对于get或者post请求的选择,具体看开发者工具里“网络”中的请求方式。

 

3.响应

代码如下(示例):

response.encoding='utf-8'
content=response.text

 为了能让我们看懂源代码,我们要对响应的结果进行编码('utf-8'),若不是响应结果不是二进制内容,例如图片的存储形式就是二进制,我们就可以用text获取源代码。


*tips

有些网站的反爬处理会十分的严格,一个ip若访问请求了十几次就会对你的ip进行一个封禁,而一些免费的ip并没有起到多大的作用,这里介绍一个提供IP池业务的商家,希望能够帮到大家:

52ec2b20b31c40cc82124eafed501d03.jpeg

三.总结

以上就是今天要讲的内容,本文仅仅简单介绍了requests的使用,而提供了大量能使我们快速便捷地处理数据的函数和方法。大多数内容跟urllib是没太大区别的,甚至还精简很多,对于爬虫玩家来说是十分友好的,希望你能去尝试一下,巩固一下,这里再做一个预告,在下一次我们将介绍如何使用Xpath对爬到的源代码进行解析,来获取我们想要的内容,敬请期待吧。

 

 

http://www.lryc.cn/news/340959.html

相关文章:

  • 创建一个javascript公共方法的npm包,js-tool-big-box,发布到npm上,一劳永逸
  • 【在线OJ系统】自定义注解实现分布式ID无感自增
  • 35. UE5 RPG制作火球术技能
  • 计算机网络 TCP/IP体系 物理层
  • 微服务相关
  • 虚拟机下如何使用Docker(完整版)
  • asp.net core 依赖注入后的服务生命周期
  • 交换排序:冒泡排序和快速排序
  • 聊天机器人ChatGPT指导下的论文写作
  • 康谋技术 | 深入探讨:自动驾驶中的相机标定技术
  • 如何在 Ubuntu 上启用 IPv6
  • Mac电脑上有什么好玩的格斗游戏 《真人快打1》可以在苹果电脑上玩吗
  • 【leetcode面试经典150题】55. 逆波兰表达式求值(C++)
  • 云轴科技ZStack入选中国信通院《高质量数字化转型产品及服务全景图(2023年度)》
  • Workerman开启ssl方法如下
  • 如何防止服务器被攻击
  • 18 统计网站每日的访问次数
  • Java PDF文件流传输过程中速度很慢,如何解决?
  • MCU最小系统晶振模块设计
  • ELK及ELFK排错
  • 『Django』创建app(应用程序)
  • Docker安装(一)
  • 由于bug发现的现象
  • ES源码四:网络通信层流程
  • 贝锐蒲公英自研异地组网新技术:远程视频监控,流畅度、清晰度大幅提升
  • C# aspose word实现模板方式打印及打印速度慢解决方法
  • java纯文字游戏
  • mac IDEA激活 亲测有效
  • 视频怎么去水印,轻松去视频水印的方法
  • vue3+element+AntDesign(自动导入)+pina+vite+js+pnpm搭建项目框架