当前位置: 首页 > news >正文

如何使用断点续传上传大文件

概念

大文件上传的需求介绍

不管怎样简单的需求,在量级达到一定层次时,都会变得异常复杂。
文件上传简单,文件变大就复杂
上传大文件时,以下几个变量会影响我们的用户体验

  • 服务器处理数据的能力
  • 请求超时
  • 网络波动
    上传时间会变长,高频次文件上传失败,失败后又需要重新上传等等,为了解决上述问题,我们需要对大文件上传单独处理,这里涉及到分片上传及断点续传两个概念。

分片上传

分片上传,就是将所要上传的文件,按照一定的大小,将整个文件分割成多个数据块(Part)来进行分片上传
如下图
在这里插入图片描述一般实现方式有两种:

  • 服务器端返回,告知从哪开始
  • 浏览器端自行处理
    上传完之后再由服务端对所有上传的文件进行汇总整合成原始文件
    大致流程如下:
    1,将需要上传的文件按照一定的分割规则,分割成相同大小的数据块。
    2,初始化一个分片上传任务,返回本次分片上传唯一标识。
    3,按照一定的策略(串行或并行)发送各个分片数据块。
    4,发送完成后,服务端根据判断数据上传是否完整,如果完整,则进行数据块合成得到原始文件

断点续传

断点续传指的是在下载或上传时,将下载或上传任务人为的划分为几个部分(分片)
每一个部分采用一个线程进行上传或下载,如果碰到网络故障,可以从已经上传或下载的部分开始继续上传下载未完成的部分
,而没有必要从头开始上传下载。从而让用户节省时间,提高速度。
一般实现方式有两种:

  • 服务器端返回,告知从哪开始
  • 浏览器端自行处理

上传过程中将文件在服务器写为临时文件,等全部写完了(文件上传完),将此临时文件重命名为正式文件即可

如果中途上传中断过,下次上传的时候根据当前临时文件大小,作为在客户端读取文件的偏移量,从此位置继续读取文件数据块,上传到服务器从此偏移量继续写入文件即可

实现思路

获取文件之后,保存文件唯一性标识,使用Blob.slice切割文件,分段上传,每次上传一段,根据唯一标识判断文件上传进度,直到文件的全部片段上传完毕
具体如下图在这里插入图片描述

总结

在获取文件之后,使用Blob.slice方法将大文件切割成多个切片,并将文件唯一标识(一般指的md5)与切片下标组合成切片的hash,从而让上传切片的时候不仅能保证每个切片的唯一性还可以保证后端能够识别切片顺序,然后借助http的可并发性,同时上传多个切片,这样从原本传一个大文件,变成了同时传多个小的文件切片,从而大大减少上传时间。并且为了保证上传的可连续性,可以让服务端保存已上传的切片hash,前端每次上传前向服务端获取已上传的切片hash,通过切片hash获取上传进度,从而实现断点续传功能,进而避免了重复上传。

http://www.lryc.cn/news/11785.html

相关文章:

  • 【图神经网络】图拉普拉斯滤波器如何实现全通、低通、高通滤波
  • python操作mysql数据库详解
  • netty群聊系统
  • Android 初代 K-V 存储框架 SharedPreferences,旧时代的余晖?
  • 在windows中使用tomcat搭建Jenkins
  • Linux系统
  • Mel Frequency Cepstral Coefficients (MFCCs)
  • 第七讲---贪心(上课)
  • 计算机如何思考与图灵完备
  • 惠普LaserJet M1005 MFP报错b2
  • 网络协议(TCP/IP)
  • 2023河南省第二届职业技能大赛郑州市选拔赛“网络安全” 项目比赛样题任务书
  • 6、流程控制
  • Linux中最基本常见命令总结
  • Python学习-----模块2.0(常用模块之时间模块-->time)
  • XXL-JOB分布式任务调度框架(二)-策略详解
  • JAVA练习54-最小栈
  • Redis-哨兵模式以及集群
  • 过滤器和监听器
  • Acwing 第 91 场周赛
  • JavaEE|套接字编程之UDP数据报
  • 如何使用Python创建一个自定义视频播放器
  • Elasticsearch进行优化-使用索引拆分(Split)和索引收缩(shrink )
  • 数论 —— 高斯记号(Gauss mark)
  • 【随笔】程序员眼中的 CPU,“没有灵魂的躯体”
  • 算法的时间复杂度
  • 华为OD机试 - 叠放书籍(Python) | 机试题算法思路 【2023】
  • 进程间通信(重点)
  • Reverse入门[不断记录]
  • 如何实现外网访问内网ip?公网端口映射或内网映射来解决