当前位置: 首页 > news >正文

Python自动获取海量ip,再也不用愁被封啦~

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!


本次网站:

本文所有模块\环境\源码\教程皆可点击文章下方名片获取此处跳转

开发环境:

  • python 3.8 运行代码

  • pycharm 2022.3 辅助敲代码

模块使用:

  • import parsel >>> pip install parsel

  • import requests >>> pip install requests

如何安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

代码展示

导入模块

import requests
import parsel

采集多页

for page in range(1, 2953):

请求链接

    url = f'http://www.****.cn/{page}.html'

发送请求

    response = requests.get(url=url)

解决乱码

    response.encoding = 'gb2312'

打印数据

    html_data = response.text

解析数据

    select = parsel.Selector(html_data)trs = select.css('#main > div.containerbox.boxindex > div.layui-row.layui-col-space15 > div > table tr')for tr in trs[1:]:ip = tr.css('td::text').getall()[0]port = tr.css('td::text').getall()[1]

保存数据

        text = 'IP地址:'+ip+'-----port端口号:'+port+'\n'open('ip.txt', mode='a', encoding='utf-8').write(text)


尾语 💝

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

http://www.lryc.cn/news/19609.html

相关文章:

  • XLua学习笔记 { }
  • 推荐程序员收藏的几个技术社区以及工具网站
  • StopWatch计时器
  • 常见web安全漏洞-暴力破解,xss,SQL注入,csrf
  • 11个案例讲透 Python 函数参数
  • 《分布式技术原理与算法解析》学习笔记Day21
  • 开源shell脚本系列-检查etcd集群可用性
  • 资源限制类题目七大技巧 解决所有大数据资源限制类问题
  • adb命令导出手机已安装的android应用apk文件
  • 华为CT6100双千M路由记录
  • 【AcWing-Python-785】快速排序
  • 从 JDK 8 到 JDK 18,Java 垃圾回收的十次进化
  • 虚拟机VMware Workstation Pro环境搭建
  • 【华为OD机试模拟题】用 C++ 实现 - 敏感字段加密(2023.Q1)
  • 关于Java方法重写的一些反思
  • 【C语言进阶】文件的顺序读写、随机读写、文本文件和二进制文件、文件读取结束的判定以及文件缓冲区相关知识
  • 图形编辑器:拖拽阻塞优化
  • c++ 的 Eigen库写 AX=XB的矩阵求解代码
  • 正点原子linux驱动篇
  • MATLAB绘制雷达图/蜘蛛图
  • 算法入门,十字路口选择的案例,如果是南方,则向前行
  • 父传子与子传父步骤
  • Java concurrency - Task Execution
  • 浅谈BOM
  • 每日学术速递2.24
  • SpringBoot 面试问答总结(VIP典藏版)
  • CSS 定位网页元素【快速掌握知识点】
  • 构建Docker基础镜像(ubuntu20.04+python3.7.1+chrome101+chromedriver101)
  • 最新最全Java面试知识
  • 个人电脑需求严重疲软,联想集团财务前景仍不乐观