当前位置: 首页 > news >正文

requests爬虫详解

Requests

安装
 

pip install requests



示例

from fake_useragent import UserAgent
import requestsdef cra1_1():
url = 'http://xx/front/website/findAllTypes'
headers = {'User-Agent': UserAgent().chrome}
resp = requests.get(url, headers=headers)
result = resp.json()if __name__ == '__main__':
cra1_1()          

发送请求

GET请求

resp = requests.get(url,headers= headers,params=params1) #headers,params1是字典



POST请求

resp = requests.post(url,headers=headers,data=data) #headers,data是字典

获取响应信息

获取响应信息
resp.status_code  获取状态码
resp.text    获取响应内容 (以字符串)
resp.json()    获取响应内容【python数据,可直接用jsonpath解析】
resp.content    获取响应内容(以字节的方式)
resp.headers    获取响应头内容
resp.url    获取访问地址
resp.encoding    获取网页编码
resp.request.headers    请求头内容
resp.cookie    获取cookie
        

功能

代理访问

proxies = {"http": "http://10.10.1.10:3128","https": "https://10.10.1.10:1080",}
requests.get("http://www.zhidaow.com", proxies=proxies)



设置超时时间

requests.get('http://github.com', timeout=0.001)



session自动保存cookies

s = requests.Session() # 创建一个session对象
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789') # 用session对象发出get请求,设置cookies



ssl验证

requests.packages.urllib3.disable_warnings() # 禁用安全请求警告
resp = requests.get(url, verify=False, headers=headers)


        

http://www.lryc.cn/news/172865.html

相关文章:

  • oracle的正则表达式(regular expression)
  • sh脚本 单独可以执行,放到crontab中不执行(定时清空redis)
  • mysql 半同步复制模式使用详解
  • 以太坊代币标准ERC20、ERC721
  • 编写基于冒泡排序算法的qsort函数
  • 有什么推荐使用的企业上网行为管理软件?
  • 机器学习第五课--广告点击率预测项目以及特征选择的介绍
  • 细说tcpdump的妙用
  • 【深度学习实验】前馈神经网络(七):批量加载数据(直接加载数据→定义类封装数据)
  • 气体放电模拟装置中1Pa~101kPa范围内的真空度控制技术
  • 华为OD机试 - 构成正方形的数量 - 数据结构map(Java 2023 B卷 100分)
  • sql on条件判断是要注意null值
  • 9.22(一):数组扁平化
  • 【vue2第十九章】手动修改ESlint错误 和 配置自动化修改ESlint错误
  • 计算机网络常见面试题
  • springboot整合MeiliSearch轻量级搜索引擎
  • 禁用鼠标的侧边按键
  • 【C语言】数组和指针刷题练习
  • 2023年中国研究生数学建模竞赛D题解题思路
  • 在编译源码的环境下,搭建起Discuz!社区论坛和WordPress博客的LNMP架构
  • 腾讯面试题:无网络环境,如何部署Docker镜像?
  • 医学影像信息(PACS)系统软件源码
  • 【01】FISCOBCOS的系统环境安装
  • flutter 权限和图片权限之前的冲突
  • OpenCV(四十八):读取视频和保存视频
  • 如何在react/next.js app中的同级组件间传递数据
  • 软件需求文档、设计文档、开发文档、运维文档大全
  • 排序算法-----归并排序
  • docker 配置 gpu版pytorch环境--部署缺陷检测--Anomalib
  • 为什么定时发朋友圈会更有效呢?