当前位置: 首页 > news >正文

用不同的url头利用Python访问一个网站,把返回的东西保存为txt文件

这个需要调用requests模块(相当于c++的头文件)

import requests 

 还需要一个User-Agent头(这个意思就是告诉python用的什么系统和浏览器)

Google Chrome(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36

Mozilla Firefox(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.

Microsoft Edge(Windows):

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63

这仨是常用的,谷歌 火狐  Edge, 我这里使用的是edge 

headers_list =  {'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.774.63 Safari/537.36 Edg/89.0.774.63'}

 找到网页后就可以扒内容了

with open('response.txt', 'w', encoding='utf-8') as file:  

    for headers in headers:  

        # 发送请求  

        response = requests.get(url, headers=headers)  

        # 打印状态码  

        print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

        # 如果请求成功,保存返回内容  

        if response.status_code == 200:  

            file.write(f'Response with header: {headers["User-Agent"]}\n')  

            file.write(response.text )  

        else:  

            file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  

print('请求成功!')

完整代码如下

import requests  # 定义要访问的URL  
url = 'http://baidu.com'  # 请替换为你要访问的网站  # 定义User-Agent头  
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0',
}
# 创建一个TXT文件来保存返回的内容  
with open('response.txt', 'w', encoding='utf-8') as file:  for headers in headers:  # 发送请求  response = requests.get(url, headers=headers)  # 打印状态码  print(f'Sent request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  # 如果请求成功,保存返回内容  if response.status_code == 200:  file.write(f'Response with header: {headers["User-Agent"]}\n')  file.write(response.text)  else:  file.write(f'Failed request with header: {headers["User-Agent"]}, Status code: {response.status_code}')  print('请求成功!')  

 结果如下

 

 文本如下

http://www.lryc.cn/news/403963.html

相关文章:

  • 一文掌握Prometheus实现页面登录认证并集成grafana
  • 欢迎来到 Mint Expedition:Web3 和 NFT 的新时代开始
  • 针对环境构图的全局一致性扫描点云数据对齐(Graph SLAM)
  • Matlab学习笔记01 - 基本数据类型
  • 基于重要抽样的主动学习不平衡分类方法ALIS
  • Python爬虫(基本流程)
  • primeflex教学笔记20240720, FastAPI+Vue3+PrimeVue前后端分离开发
  • 移动设备安全革命:应对威胁与解决方案
  • 【C语言】 链表实现学生管理系统(堆区开辟空间)
  • STM32实战篇:按键(外部输入信号)触发中断
  • Android SurfaceView 组件介绍,挖洞原理详解
  • day2加餐 Go 接口型函数的使用场景
  • 摄像头 RN6752v1 视频采集卡
  • 记录vivado自带IP iBert眼图近端回环
  • js | Core
  • Log4J reminder
  • Unity XR Interaction Toolkit(VR、AR交互工具包)记录安装到开发的流程,以及遇到的常见问题(一)!
  • MongoDB文档整理
  • 【AI学习】关于Scaling Law的相关学习
  • 学习小记-Kafka相较于其他MQ有啥优势?
  • 技能 | postman接口测试工具安装及使用
  • 移动UI:任务中心的作用,该如何设计更合理?
  • pytorch学习(十)优化函数
  • Ubuntu22.04:安装Samba
  • Powershell 使用介绍
  • 【Langchain大语言模型开发教程】记忆
  • 最新Qt6的下载与成功安装详细介绍
  • LeetCode 热题 HOT 100 (001/100)【宇宙最简单版】
  • Ubantu 使用 docker 配置 + 远程部署 + 远程开发
  • 应用层自定义协议与序列化