当前位置: 首页 > news >正文

minio下载文件速度很慢的原因分析与说明

文章目录

  • 1.实战背景
  • 2.问题描述
  • 3.问题分析
  • 4.问题解决

1.实战背景

最近在做一个项目,需要用到minio来搭建文件系统,先简单说一下我在项目中设置的上传文件流程:

  1. 前端将分块文件逐一传给后端,后端再存储到 linux服务器的minio 当中。
  2. 所有分块文件存储完毕,后端从 minio 下载所有的分块文件到本地磁盘中。
  3. 后端进行合并文件处理,将合并后的文件通过上传到minio(SDK-Minio Java Client有自带分块上传方法)

我在当前的项目开发阶段,java后端服务是直接在本地进行运行,而minio服务则是在购买的轻量服务器中运行

2.问题描述

在上传文件流程的过程二中,我发现一个2MB的分块文件下载到本地磁盘需要两到三秒,而一个大文件肯定会有许多分块文件,这就导致了当前端向后端发送合并文件请求,后端需要花费大量的时间来处理,主要就是花费在了从Minio下载分块文件到本地磁盘上。

  • 一方面导致前端请求超时,无法获取到后端的处理后结果。
  • 另一方面长时间的等待后端处理,严重影响了用户的体验。

image-20230211033601239

3.问题分析

1️⃣ 首先我怀疑是使用的服务器本身性能的问题,于是又换了一个新的服务器(6Mbps宽带)用来只运行minio服务,然后发现没卵用,分块文件下载到本地速度还是一样慢。

2️⃣ 然后我做了许多的demo来进行下载测试,在这里我给出比较有代表性的测试案例:

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId><version>2.6.3</version>
</dependency>
<dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.3.0</version>
</dependency>
<dependency><groupId>me.tongfei</groupId><artifactId>progressbar</artifactId><version>0.5.3</version>
</dependency>
<dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.8.1</version>
</dependency>
import io.minio.GetObjectArgs;
import io.minio.MinioClient;
import org.apache.tomcat.util.http.fileupload.IOUtils;import java.io.FileOutputStream;
import java.io.InputStream;/*** @author 狐狸半面添* @create 2023-02-11 3:47*/
public class MinioFileDownLoadTest {private final static MinioClient minioClient;static {minioClient = MinioClient.builder()// 指定连接的ip和端口(轻量服务器).endpoint("http://1.14.94.100:9000")// 指定 访问秘钥(也称用户id) 和 私有秘钥(也称密码).credentials("admin", "12345678").build();}public static void main(String[] args) throws Exception {// 平均用时:14036mstest01();}public static void test01() throws Exception {Long start = System.currentTimeMillis();// 拿到输入流,我存放在minio的该文件为 10.1 MB 大小InputStream inputStream = minioClient.getObject(GetObjectArgs.builder().bucket("waveedu").object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3").build());// 拿到输出流,用于下载到本地,命名为 lucky.mp3FileOutputStream outputStream = new FileOutputStream("D:\\lucky.mp3");// 用于拷贝流IOUtils.copy(inputStream, outputStream);Long end = System.currentTimeMillis();System.out.println("用时:" + (end - start) + "ms");}
}

test01()就是我在项目中使用的下载分块文件的方式。我进行了多次测试执行该方法,可以看出确实很慢,10.1MB的文件也要14秒左右。

于是小可爱的我换了一种下载方式:

    public static void test02() throws Exception {Long start = System.currentTimeMillis();// 使用minio客户端提供的downloadObject方法进行下载minioClient.downloadObject(DownloadObjectArgs.builder()// 指定 bucket 存储桶.bucket("waveedu")// 指定 哪个文件.object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3")// 指定存放位置与名称.filename("D:\\lucky.mp3").build());Long end = System.currentTimeMillis();System.out.println(end - start);}

我发现第一次执行该test02()方法下载的耗时和test01()的耗时一样,但之后再执行test02()时发现都只需要0.2秒!

于是我天真的以为就是不应该使用流拷贝的方式,而是应该使用test02()的方式。但修改项目中的下载方式后,几番折腾下来下载分块代码的时间和原来还是一样,依旧2MB的分块文件下载到本地磁盘需要两到三秒。我真哭醉了😭😭😭。

3️⃣ 于是又几番demo测试和源码分析后,我发现了为什么test02()第一次执行的耗时和test01()一样。

我们先看看 downloadObject 方法的对我们而言的关键源码:

image-20230211043521167

简单点说,实际上就是 downloadObject 方法中也是使用流拷贝方式进行下载,但在下载之前先会去判断 D:\lucky.mp3 是否已经在本地磁盘存在,如果存在并且与minio中 waveedu 桶的文件 林屿森LIN - 小幸运【吉他】 (伴奏).mp3 所占字节大小一致,就认为是相同文件,没必要再从minio下载。因此第一次执行完test02()方法后之后再执行都是会直接判断出 fileSize == stat.size()为true ,就return了,不会再流拷贝。

而我的test01()是没有走这个判断的,不管本地指定位置存不存在,都会进行流拷贝从minio下载文件。

4️⃣ 发现了不是项目所用的下载方法的原因后,我开始思考是不是人品的问题,于是进行反复无脑愚蠢的重启服务器和重启项目,很显然,没得屁用。

5️⃣ 再到最后,我开始考虑是不是由于对轻量服务器是外网访问,而导致传输速度很慢,因此我依旧使用test01()的方法,在我本地linux虚拟机中启动minio服务,来测试下载速度:

import io.minio.GetObjectArgs;
import io.minio.MinioClient;
import org.apache.tomcat.util.http.fileupload.IOUtils;import java.io.FileOutputStream;
import java.io.InputStream;/*** @author 狐狸半面添* @create 2023-02-11 15:10*/
public class NativeLinuxTest {public static void main(String[] args) throws Exception {MinioClient minioClient = MinioClient.builder()// 指定连接的ip和端口(该ip是本地虚拟机的虚拟Ip).endpoint("http://192.168.65.130:9000")// 指定 访问秘钥(也称用户id) 和 私有秘钥(也称密码).credentials("minioadmin", "minioadmin").build();Long start = System.currentTimeMillis();// 拿到输入流,我存放在minio的该文件为 10.1 MB 大小InputStream inputStream = minioClient.getObject(GetObjectArgs.builder().bucket("waveedu").object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3").build());// 拿到输出流,用于下载到本地,命名为 lucky.mp3FileOutputStream outputStream = new FileOutputStream("D:\\lucky.mmp3");// 用于拷贝流IOUtils.copy(inputStream, outputStream);Long end = System.currentTimeMillis();// 平均用时 0.2 到 0.3 秒System.out.println("用时:" + (end - start) + "ms");}
}

可以看到每次调用该拷贝流的方法都是只需要 0.2 到 0.3 秒左右,因此这也就证明了是由于后端项目启动在本地,而minio服务放在了轻量服务器,后端项目从minio下载文件必须外网访问的缘故。

4.问题解决

但这个问题在我们项目部署后肯定不存在的,因为我们的项目,也包括数据库、minio服务、redis服务肯定都是部署在同一局域网中(如果项目不大的话,简单点操作就是将所有服务放在一台服务器上)。这样的好处就是可以极大的加快数据传输速率。

http://www.lryc.cn/news/3114.html

相关文章:

  • 基于comsol软件弯曲单模光纤模拟仿真
  • 如何开启多个独立Chrome浏览器
  • erp5开源制造业erp主要业务会计分录处理
  • 技能树基础——17四平方和(拉格朗日定理,嵌套循环)
  • JPA、EJB、事物管理---相关内容整理
  • C语言学习笔记(一):了解C语言
  • 回头看——《智能家居项目小结》
  • 社交登陆OAuth2.0
  • C++005-C++选择与分支2
  • IPFS 简介及概述
  • 初学者必读:讲解 VC 下如何正确的创建、管理及发布项目
  • 剑指offer(中等)
  • 微软发布会精华回顾:“台式电脑”抢了风头
  • CF1561C Deep Down Below 题解
  • 秒杀项目之服务调用分布式session
  • 聊聊什么是架构,你理解对了吗?
  • java多线程开发
  • 杂记7--opencv的ar码模块学习
  • [项目设计]高并发内存池
  • 28岁才转行软件测试,目前32了,我的一些经历跟感受
  • Python导入模块的3种方式
  • select 与 where、order by、limit 子句执行优先级比较
  • Linux内核并发与竞争-原子操作
  • Java笔记-泛型的使用
  • 特斯拉无人驾驶解读
  • 生物素-琥珀酰亚胺酯Biotin-NHS;CAS号:35013-72-0;可对溶液中的抗体,蛋白质和任何其他含伯胺的大分子进行简单有效的生物素标记。
  • Maven_第五章 核心概念
  • 【深度学习】人脸识别工程化落地
  • AOP面向切面编程思想。
  • 实验7-变治技术及动态规划初步