当前位置: 首页 > news >正文

05、Python -- 爬取ts文件格式视频思路

目录

  • 第一步:爬取一段5秒视频
    • 找url
    • 代码
    • 结果
  • 第二步:下载整个视频的所有片段
    • 代码:
    • 结果:
  • 第三步:合成视频
    • 安装模块
    • 代码:
    • 结果
  • 简洁代码
    • 代码:
    • 结果:
  • 最终代码
    • 简洁前代码
    • 简洁后代码

思路:
1、爬取视频,但是每次只能爬取一段5秒的视频。
2、一个视频有很多秒,所以需要爬取很多片段的视频
3、把所有爬取下来的片段视频合成导出。

4、最后再简洁代码

第一步:爬取一段5秒视频

找url

首先,找到需要爬取的视频,选择如图,找到对应的URL。
在这里插入图片描述

代码

然后最简单的四行爬取代码
在这里插入图片描述

结果

爬取的结果如图,里面视频只有5秒
在这里插入图片描述

第二步:下载整个视频的所有片段

代码:

在这里插入图片描述

结果:

在这里插入图片描述
把该视频所有片段都下载下来了
在这里插入图片描述

第三步:合成视频

安装模块

命令:pip install moviepy -i https://mirrors.aliyun.com/pypi/simple/

在这里插入图片描述

代码:

在这里插入图片描述

结果

在这里插入图片描述

完整合成视频并下载下来
在这里插入图片描述

简洁代码

代码:

在这里插入图片描述

结果:

在这里插入图片描述
如图:每个视频只由4秒
在这里插入图片描述

在这里插入图片描述

最终代码

简洁前代码

这里我把原本存放视频的文件夹名由《视频》改成《视频片段》
在这里插入图片描述
所以这里的【视频】,后面写代码的时候也应该改成【视频片段】
在这里插入图片描述

# 导入模块
import requestsnumber = 0
# 循环下载视频片段
while True:format_num = '{:05d}'.format(number)# f'' --> 用于在字符串中添加执行表达式url = f'https://xxxxxxxxxx.{format_num}.ts?pkexxxxxxxxxxxxx'res = requests.get(url)# 遇到404,就跳出循环if res.status_code == 404:breakopen(f'视频片段/{format_num}.ts', 'wb').write(res.content)print(f'已经下载了 {format_num}.ts文件')number += 1print(f'一共下载了 {number} 个视频 , 准备合成,请稍等几分钟')# 合成
#从moviepy这个模块的子模块editor里面导入所有的功能
from moviepy.editor import *# 列表 把这些视频加载到程序中来,保存在一个列表中
clip_list = []
for i in range(number):format_num = '{:05d}'.format(i)clip = VideoFileClip(f'视频片段/{format_num}.ts')clip_list.append(clip)# 最终视频合成
lastVideo = concatenate_videoclips(clip_list)
# 视频下载写出地址
lastVideo.write_videofile('完整视频/最终视频.mp4')

简洁后代码

# 导入模块
import requests
#从moviepy这个模块的子模块editor里面导入所有的功能
from moviepy.editor import *
number = 0
# 列表, 用于把所有片段视频加载到程序中来,保存在一个列表中
clip_list = []
# 循环下载视频片段
while True:format_num = '{:05d}'.format(number)# f'' --> 用于在字符串中添加执行表达式url = f'https://xxxxxxxhevc_1.{format_num}.ts?pkexxxxxxxxxxxxxxxxxxxxxx'res = requests.get(url)# 遇到404,就跳出循环if res.status_code == 404:break# 视频片段 就是存放一段段视频的文件夹名open(f'视频片段/{format_num}.ts', 'wb').write(res.content)clip = VideoFileClip(f'视频片段/{format_num}.ts')clip_list.append(clip)print(f'已经下载了并且加载了 {format_num}.ts文件')number += 1
print(f'一共下载了 {number} 个视频 , 准备加载,请稍等几分钟')
# 最终视频合成
lastVideo = concatenate_videoclips(clip_list)
# 视频下载写出地址
lastVideo.write_videofile('完整视频/最终视频.mp4')
http://www.lryc.cn/news/205068.html

相关文章:

  • 【QT】其他常用控件2
  • django报错--Not Found The requested URL was not found on the server.
  • VLOOKUP函数的使用方法
  • 关于前端如何下载后端接口返回content-type为application/octet-stream的文件
  • 报错:SSL routines:ssl3_get_record:wrong version number
  • Flask后端开发(一)-基础知识和前期准备
  • 基于SSM的幼儿园管理系统
  • 互联网Java工程师面试题·Spring篇·第三弹
  • 前端(二十三)——轮询和长轮询
  • uniapp把文件中的内复制到另一个文件中
  • 什么是蓝桥杯?什么是蓝桥STEMA考试?
  • 快递排序Java
  • Spark简单回顾
  • DDD与微服务的千丝万缕
  • S32K324 UDS Bootloader开发-需求篇
  • 【前端设计模式】之调停者模式(中介者模式)
  • 【MySQL架构篇】SQL执行流程与缓冲池
  • [support2022@cock.li].faust、[tsai.shen@mailfence.com].faust勒索病毒数据怎么处理|数据解密恢复
  • 力扣学习笔记——49. 字母异位词分组
  • 五、Qt中的常用类
  • CentOS 7.9.2009 数据盘挂载
  • cv::solvePnP使用方法及注意点详解(OpenCV/C++)
  • DevOps持续集成-Jenkins(4)
  • 【数据仓库-零】数据仓库知识体系 ing
  • css3 3D 转换 技巧详细解析与代码实例
  • [Unity]给场景中的3D字体TextMesh增加描边方案一
  • TDengine(taos)数据库导出历史数据
  • 算法进修Day-37
  • 服务器之日常整活
  • 交互式 Web 应用 0 基础入门