当前位置: 首页 > news >正文

python爬虫之创建属于自己的ip代理池

在后续需求数据量比较大的情况下,自建一个ip代理池可以帮助我们获得更多的数据。

下面我来介绍一下整个过程

1.找到目标代理网站

https://www.dailiservers.com/go/webshare
https://proxyscrape.com/
https://spys.one/
https://free-proxy-list.net/
http://free-proxy.cz/en/
https://www.proxynova.com/proxy-server-list/
https://github.com/clarketm/proxy-list
https://github.com/opsxcq/proxy-list

2.解析网站获得免费的代理ip列表

使用解析网站或者是发送网络请求都可以

3.使用request中的参数proxies

如果代理不需要密码和用户名

prox = {"http":"http://ip地址:端口号","https":"http://ip地址:端口号"
}

如果代理需要密码和用户名

prox = {"http":"http://用户名:用户密码@ip地址:端口号","https":"http://用户名:用户密码@ip地址:端口号"
}

注意如果当你的格式 填写不正确的时候,也是会出现请求成功的,但是使用的是自己本机的ip,所以请注意使用时的格式填写

prox的使用

直接在requests中填写参数请求,proxies = prox

4.进行代理验证

大部分免费的代理都是不可以使用的,这里可以使用telnetlib进行验证

使用方法

 try:telnetlib.Telnet(ip, port=端口号, timeout=3)
except:print('ip无效!')
else:print("有效)

建议将可以使用的ip储存到文件中,以便后续的使用,可以减少筛选的事件。

http://www.lryc.cn/news/252069.html

相关文章:

  • 又添三位“信伙伴”,亚信安慧AntDB数据库与南京一鸣、广东鸿数、北京数见完成兼容互认
  • Linux --- 进程控制
  • SVG-椭圆弧-参数转换-计算公式-标准解读
  • 利用 LD_PRELOAD劫持动态链接库,绕过 disable_function
  • 网件R8500 trojan
  • 实现校园网开机自启动部署
  • pycharm 创建vue并实现简易路由功能
  • 2023年关于爬取Bilibili(B站)视频的一些最新资源和案例
  • HyperBDR云容灾v4.10.1发布,划重点:支持UCloud云平台自动化容灾+新增可灵活定义的备份策略
  • 第四十一篇,一次matlab与spdlog的合作
  • 【苍穹外卖】——第一天
  • 解决SecureFX的中文乱码问题
  • 【字符串匹配】【KMP算法】Leetcode 28 找出字符串中第一个匹配项的下标☆
  • 《洛谷深入浅出进阶篇》模意义下的乘法逆元+洛谷P3811
  • clickhouse -- clickhouse解析复杂JSON数组
  • 算法leetcode|91. 解码方法(rust重拳出击)
  • zabbix配置snmp trap--使用snmptrapd和Bash接收器(缺zabbix_trap_handler.sh文中自取)--图文教程
  • vue: 线上项目element-ui的icon偶尔乱码问题
  • fpga rom 初始化文件的一些心得
  • 从零构建属于自己的GPT系列3:模型训练2(训练函数解读、模型训练函数解读、代码逐行解读)
  • Python词频统计(数据整理)
  • 基本面选股的方法
  • 应用密码学期末复习(3)
  • PAD平板签约投屏-高端活动的选择
  • 分布式架构demo
  • TA-Lib学习研究笔记(二)——Overlap Studies上
  • 牛客java基础考点1 标识符和变量
  • Qt将打印信息输出到文件
  • 【risc-v】易灵思efinix FPGA sapphire_soc IP配置参数分享
  • 直播的种类及类型