当前位置: 首页 > news >正文

python爬虫-某政府网站加速乐(简单版)实例小记

# -*- coding:utf-8 -*-
# @Time : 2023/10/23 17:06
# @Author: 水兵没月
# @File : 哈哈哈哈.py
# @Software: PyCharm
####################import random
import requests# 代理
def get_proxy(proxy_type=random.choice([1,2,3,4,5])):url = "http://ZZZZZZZZZZZZZZZZZZ"url = "http://XXXXXXXXXXXXXXXXpayload={"proxy_type": proxy_type,"spider_type": 2,}response = requests.request("POST", url, data=payload)proxies = response.json()['msg'][0]return proxies#  记录
url = 'aHR0cDovL3N0aGp0LmppYW5nc3UuZ292LmNuL2NvbC9jb2w4MzU2OC9pbmRleC5odG1sP3VpZD0zNTEwODUmcGFnZU51bT0xMjE='
headers = {"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7","Accept-Encoding": "gzip, deflate","Accept-Language": "zh-CN,zh;q=0.9","Cache-Control": "no-cache","Connection": "keep-alive","Host": "sthjt.jiangsu.gov.cn","Pragma": "no-cache","Upgrade-Insecure-Requests": "1","User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36",}
res = requests.session().get(url, headers=headers, proxies=get_proxy(1) )
res.encoding = 'UTF-8'
cookies = res.cookies.items()
cookie = ''
for name, value in cookies:cookie += '{0}={1};'.format(name, value)
headers['Cookie'] = cookie
print(headers)
url = 'aHR0cDovL3N0aGp0LmppYW5nc3UuZ292LmNuL21vZHVsZS93ZWIvanBhZ2UvZGF0YXByb3h5LmpzcD9zdGFydHJlY29yZD0xJmVuZHJlY29yZD0xMjAmcGVycGFnZT00MCcrJyZjb2w9MSZhcHBpZD0xJndlYmlkPTE0JnBhdGg9JTJGJmNvbHVtbmlkPTgzNTY4JnNvdXJjZUNvbnRlbnRUeXBlPTEmdW5pdGlkPTM1MTA4NSZ3ZWJuYW1lPSVFNiVCMSU5RiVFOCU4QiU4RiVFNyU5QyU4MSVFNyU5NCU5RiVFNiU4MCU4MSVFNyU4RSVBRiVFNSVBMiU4MyVFNSU4RSU4NSZwZXJtaXNzaW9udHlwZT0w'res = requests.session().get(url, headers=headers, proxies=get_proxy())
res = res.text
print([res])
print('========================')

某网站cookie 反爬为创宇盾加速乐,测试了翻页对和刷新页面cookie的情况,无变化。因此解决这个网址的加速乐。先请求提供的第一步网址,拿到cookie,直接将cookie 用在目标网址请求中即可。亲测可用,但是即使加上代理也很容易被请求限制,建议使用time.sleep(3),防止请求频繁

http://www.lryc.cn/news/208580.html

相关文章:

  • stable diffusion简介和原理
  • 【机器学习】模型平移不变性/等变性归纳偏置Attention机制
  • c++的4中类型转换操作符(static_cast,reinterpret_cast,dynamic_cast,const_cast),RTTI
  • CNN实现与训练--------------以cifar10数据集为例进行演示(基于Tensorflow)
  • YOLOv5算法改进(21)— 添加CA注意力机制 + 更换Neck网络之BiFPN + 更换损失函数之EIoU
  • 面对6G时代 适合通信专业的 毕业设计题目
  • 使用Python实现一个简单的斗地主发牌
  • Linux系统之file命令的基本使用
  • 【智能大数据分析】实验1 MapReduce实验:单词计数
  • KV STUDIO的安装与实践(一)
  • matlab simulink ADRC控制样例
  • 我是如何走上测试管理岗的
  • 回溯法:雀魂启动!
  • 新的iLeakage攻击从Apple Safari窃取电子邮件和密码
  • Java练习题2021-1
  • 微信小程序input输入字母自动转大写不生效问题解决
  • jmeter报Java.NET.BindException: Address already in use: connect
  • 2023手工测试转自动化测试后,薪资可以达到多少?
  • 01 _ 为什么要学习数据结构和算法?
  • C语言 每日一题 PTA 10.27 day5
  • Unity Shader当用户靠近的时候会出现吃鸡一样的光墙
  • Xcode iOS app启用文件共享
  • STM32H750之FreeRTOS学习--------(二)任务的创建和删除
  • Kafka - 3.x Producer 生产者最佳实践
  • 对于多分类问题,使用深度学习(Keras)进行迁移学习提升性能
  • Python----break关键字对while...else结构的影响
  • js实现将文本生成二维码(腾讯云cos)
  • 机架式服务器介绍
  • 解决github有时能访问有时不能访问的问题2
  • Go实现网络通信