当前位置: 首页 > news >正文

构建个人代理池:使用GitHub项目proxy_pool的搭建配置及代码接口详解

手把手教你搭建代理IP池:

项目简介:

​ 爬虫代理IP池项目,主要功能为定时采集网上发布的免费代理验证入库,定时验证入库的代理保证代理的可用性,提供API和CLI两种使用方式。同时你也可以扩展代理源以增加代理池IP的质量和数量。

GitHub地址:

​ jhao104/proxy_pool: Python ProxyPool for web spider (github.com)

部署安装流程:

​ 首先需要将git源码克隆到本地:

git clone git@github.com:jhao104/proxy_pool.git

在这里插入图片描述

​ 重新创建一个python虚拟环境,防止包依赖冲突:

conda create -n env_name python=x.x
conda create -n pc python=3.8

在这里插入图片描述

查看当前所有环境:

conda env list 

在这里插入图片描述

进入某个环境:

conda activate 环境名
conda activate pc

在这里插入图片描述

安装相关包:

找到项目所在的requirements.txt 所在的目录:

我的在:‪D:\Git_local\proxy_pool\requirements.txt

在这里插入图片描述

然后在环境里面输入:

pip install D:\Git_local\proxy_pool\requirements.txt

环境部署就成功了,很多GitHub的项目如果需要在本地运行都需要这样的操作,因为python的库之前存在依赖,必须是某个版本的才可以,不然就会冲突。

数据库配置:

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

开启redis数据库:

注意先开启服务端,在开启客户端

在这里插入图片描述

在这里插入图片描述

启动项目:

在这里插入图片描述

# 如果已经具备运行条件, 可用通过proxyPool.py启动。
# 程序分为: schedule 调度程序 和 server Api服务# 启动调度程序
python proxyPool.py schedule# 启动webApi服务
python proxyPool.py server
python proxyPool.py schedule

在这里插入图片描述

python proxyPool.py server

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

成功!!!

代码接口:

import requestsdef get_proxy():return requests.get("http://127.0.0.1:5010/get/").json()def delete_proxy(proxy):requests.get("http://127.0.0.1:5010/delete/?proxy={}".format(proxy))# your spider codedef getHtml():# ....retry_count = 5proxy = get_proxy().get("proxy")while retry_count > 0:try:html = requests.get('http://www.example.com', proxies={"http": "http://{}".format(proxy)})# 使用代理访问return htmlexcept Exception:retry_count -= 1# 删除代理池中代理delete_proxy(proxy)return None
http://www.lryc.cn/news/248956.html

相关文章:

  • Pytorch进阶教学——训练一个图像分类模型(GPU)
  • Docker Swarm总结+CI/CD Devops、gitlab、sonarqube以及harbor的安装集成配置(3/5)
  • Linux:windows 和 Linux 之间文本格式转换
  • VBA技术资料MF88:测试Excel文件名是否有效
  • u8g2图形库——丝滑菜单制作
  • Go 异常处理流程
  • ubuntu20.04安装tensorRT流程梳理
  • 数字孪生技术:提升UI交互性与个性化设计
  • 外包干了5个月,技术退步明显.......
  • 嵌入式常见的几种接口
  • 基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖(七)
  • Grafana采用Nginx反向代理,部分功能报错‘Origin not allowed’ behind proxy
  • 请大数据把奥威BI分析工具推给每一个财务!
  • 知乎禁止转载的回答怎么复制做笔记?
  • pta找鞍点—C语言
  • 编程零基础算法 | 四、循环和选择结构——1572. 矩阵对角线元素的和
  • ubantu配置网卡ip
  • 增加F110 付款方式的乱记录
  • 软件系统安全漏洞检测应该怎么做?靠谱的软件安全检测公司推荐
  • 单片机学习12——电容
  • 淘宝平台商品详情平台订单接入说明
  • Linux文件截断命令(truncate head tail dd)
  • Armbian安装python环境和pip国内源
  • 宿主Linux——KVM安装Windows7系统
  • Mysql更新Blob存储的Josn数据
  • C语言——指针(三)
  • VIR-SLAM代码分析3——VIR_VINS详解之estimator.cpp/.h
  • 大模型的RPA应用 | 代理流程自动化(APA),开启智能自动化新纪元
  • 爬虫学习 异步爬虫(五)
  • 【Openstack Train安装】六、Keystone安装