当前位置: 首页 > news >正文

【Python】爬虫使用代理IP

1、代理池

IP 代理池可以理解为一个池子,里面装了很多代理IP。

  • 池子里的IP是有生命周期的,它们将被定期验证,其中失效的将被从池子里面剔除
  • 池子里的ip是有补充渠道的,会有新的代理ip不断被加入池子中
  • 池子中的代理ip是可以被随机取出的

2、为什么要用代理池

一些大型的网站(尤其是电商类网站),为了禁止爬虫获取数据,会采取限制同一个IP地址的网络请求数量、请求频率等方式,进行网站反扒。

而使用IP代理池后的爬虫,就可以隐藏自己IP,并且随机更换请求时的IP地址,绕过该反爬机制,快速获取大量数据。

在这里插入图片描述

3、代理IP获取

一些网站提供免费的代理IP,这个不稳定,并且很多都不能用。

收费的网站(如需求量不大,白嫖注册赠送的 IP 即可):

  • 巨量IP => 注册赠送 1000 IP

4、代理IP使用

获取代理IP(以巨量IP为例):

动态代理(包时) - 生成提取链接

在这里插入图片描述

代码:

    api_url = 'http://v2.api.juliangip.com/dynamic/getips...'username = '13255667788'password = '123456'proxy_ip_list = requests.get(api_url).json()['data']['proxy_list']for proxy_ip in proxy_ip_list:proxies = {"http": "http://%(user)s:%(pwd)s@%(proxy)s/" % {"user": username, "pwd": password, "proxy": proxy_ip},"https": "http://%(user)s:%(pwd)s@%(proxy)s/" % {"user": username, "pwd": password, "proxy": proxy_ip},}target_url = 'https://myip.ipip.net/'resp = requests.get(target_url, proxies=proxies)print(f'{proxy_ip} ------ {resp.text}')

10、资料

  • python爬虫 - 代理ip正确使用方法
  • 『python爬虫』巨量http代理使用 每天白嫖1000ip(保姆级图文)
http://www.lryc.cn/news/483792.html

相关文章:

  • 金融机构-业务架构方案(高光版)
  • ubuntu内核切换network unclaimed 网卡丢失
  • 【人工智能】揭秘可解释性AI(XAI):从原理到实战的终极指南
  • 小面馆叫号取餐流程 佳易王面馆米线店点餐叫号管理系统操作教程
  • 图形 2.6 伽马校正
  • LLM - 计算 多模态大语言模型 的参数量(Qwen2-VL、Llama-3.1) 教程
  • 数据可视化这样做,汇报轻松拿捏(附免费好用可视化工具推荐)
  • 杂七杂八之基于JSON Web Token (JWT) 进行API认证和鉴权(Java版)
  • 建设展示型网站企业渠道用户递达
  • 如何通过AB测试找到最适合的Yandex广告内容
  • AI写作(四)预训练语言模型:开启 AI 写作新时代(4/10)
  • 解决Anaconda出现CondaHTTPError: HTTP 000 CONNECTION FAILED for url
  • 员工绩效统计出现很多小数点,处理方法大全
  • 【启明智显分享】5G CPE为什么适合应用在连锁店中?
  • 十大经典排序算法-希尔排序与归并排序
  • gitlab和jenkins连接
  • Qt Event事件系统小探2
  • [2024最新] java八股文实用版(附带原理)---java集合篇
  • pytorch tensor在CPU和GPU之间转换,numpy之间的转换
  • 【电压分层控制】光储三相并网下垂控制,直流微电网协调母线电压分层控制
  • 【CSS】absolute定位的默认位置
  • 遗传算法与深度学习实战——利用进化计算优化深度学习模型
  • 计算机视觉 ---图像读取与显示(OpenCV与Matplotlib)
  • XML Schema 字符串数据类型
  • Spring Boot 读取 yml 并映射至实体
  • /// ts中的三斜线指令 | 前端
  • 什么岗位需要学习 OpenGL ES ?说说 3.X 的新特性
  • 【插件】多断言 插件pytest-assume
  • ctfshow DSBCTF web部分wp
  • 三维点云 和模型转换的问题