当前位置: 首页 > news >正文

python爬虫加入进度条

安装tqdm和requests库

pip install tqdm -i  https://pypi.tuna.tsinghua.edu.cn/simplepip install requests -i  https://pypi.tuna.tsinghua.edu.cn/simple

带进度条下载

import time  # 引入time模块,用于处理时间相关的功能
from tqdm import *  # 从tqdm包中引入所有功能,tqdm用于在循环中显示进度条
import requests  # 引入requests模块,用于发起网络请求# 设置请求头信息,模拟浏览器访问
headers = {"accept": "*/*",  # 接受任何类型的返回数据"accept-language": "zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6",  # 设置接受的语言类型和优先级"cache-control": "no-cache",  # 通知服务器不使用缓存,获取最新的数据"pragma": "no-cache",  # 与cache-control类似,某些服务器可能会用到"priority": "i",  # 请求的优先级"range": "bytes=2523136-",  # 请求部分内容,从指定字节开始到结束"referer": "https://v.jstv.com/",  # 通知服务器该请求是从哪个页面来的"sec-ch-ua": "\"Not/A)Brand\";v=\"8\", \"Chromium\";v=\"126\", \"Microsoft Edge\";v=\"126\"",  # 安全相关的客户端信息"sec-ch-ua-mobile": "?0",  # 是否为移动设备"sec-ch-ua-platform": "\"Windows\"",  # 客户端平台"sec-fetch-dest": "video",  # 请求的目的地,这里是视频"sec-fetch-mode": "no-cors",  # 请求模式,不进行跨域资源共享(CORS)预检请求"sec-fetch-site": "same-site",  # 请求的站点,这里是同站请求"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0"  # 用户代理,模拟浏览器信息
}# 视频文件的URL
url = "https://vod.v.jstv.com/2024/07/08/JSTV_JSGGNEW_1720439020421_QW5qn10_1879.mp4"# 发起网络请求,获取视频文件流,并设置请求头
response = requests.get(url, stream=True, headers=headers)# 获取视频文件的大小,并转换为MB或GB单位显示
contant_size = int(response.headers['content-length']) / 1024 / 1000  # 从响应头中获取内容长度,并转换为MB
if contant_size > 1000:print("视频大小", '{:.2f}'.format(contant_size / 1000), "gb")  # 如果大于1000MB,则显示为GB
elif contant_size > 1:print("视频大小", '{:.2f}'.format(contant_size), "mb")  # 如果大于1MB,则显示为MB
elif contant_size < 1:print("视频大小", '{:.2f}'.format(contant_size * 1000), "kb")  # 如果小于1MB,则显示为KB# 打开一个名为"测试.mp4"的文件,以二进制写模式
with open(r"测试.mp4", "wb") as file:# 使用tqdm进度条显示下载进度for data in tqdm(iterable=response.iter_content(1024 * 1000),  # 每次读取1024KB数据total=contant_size,  # 进度条的总长度为文件大小postfix='带带爬虫',  # 进度条后缀unit='mb',  # 显示单位为MBdesc="视频下载"):  # 进度条前缀描述file.write(data)  # 将读取到的数据写入文件

在这里插入图片描述

http://www.lryc.cn/news/396591.html

相关文章:

  • 力扣844.比较含退格的字符串
  • 用户特征和embedding层做Concatenation
  • Ubuntu20.04下修改samba用户密码
  • PHP老照片修复文字识别图像去雾一键抠图微信小程序源码
  • 识别色带详解解释
  • 如何用 Python 绕过 cloudflare(5秒盾) 抓取数据:也不是很难嘛!
  • 掌握Conda配置术:conda config命令的深度指南
  • MySQL:left join 后用 on 还是 where?
  • openfoam生成的非均匀固体Solid数据分析、VTK数据格式分析、以及paraview官方用户指导文档和使用方法
  • JVM:类的生命周期
  • 几种不同的方式禁止IP访问网站(PHP、Nginx、Apache设置方法)
  • 经典 SQL 数据库笔试题及答案整理
  • JS代码动态打印404页面源码
  • 从“钓”到“管”:EasyCVR一体化视频解决方案助力水域安全管理
  • springboot大学生竞赛管理系统-计算机毕业设计源码37276
  • 提高LabVIEW软件的健壮性
  • 不同深度的埋点事件如何微妙地改变广告系列的成本
  • Perl 语言进阶学习
  • el-input-number @input.native触发,修改值失效
  • 这些实用工具函数都撕不明白还敢说自己是高级前端
  • git 如何查看 commit 77062497
  • 纯CSS瀑布流
  • vue3 路由跳转新页面并传递参数与获取参数
  • NSAT-8000电源检测软件测试砖式电源模块的方案及优势
  • 短链接服务Octopus-搭建实战
  • STM32(二):STM32工作原理
  • 真实工作项目Java使用apache.poi生成word
  • [Python自动化办公]--从网页登录网易邮箱进行邮件搜索并下载邮件附件
  • mysql8多值索引
  • MT3055 交换排列