当前位置: 首页 > news >正文

TCGA数据集下载工具gdc-client下载慢解决方案

文章目录

  • 前言
  • gdc-client工具安装
  • 数据下载步骤
  • 引用链接

前言

使用TCGA数据集,一般直接下载很难成功下载,大部分需要使用官方的GDC-Client下载工具。

gdc-client工具安装

下载地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool
下完之后,是一个压缩包,需要自己进行解压缩。解压缩之后只有一个gdc-client.exe文件。
这个时候需要打开环境变量,如下图
在这里插入图片描述
双击PATH之后,进入到下面页面,点击新建,输入gdc-client.exe所在的目录。
在这里插入图片描述
找到gdc-client.exe所在的目录,创建一个与gdc-client.exe同级的文件。
创建my-dtt-config.dtt文件,可以先写成txt的形式,用记事本打开,添加完下面的内容之后(全部复制即可)再改回dtt形式。

[download]
dir = . 
save_interval = 1073741824
http_chunk_size = 4096
no_segment_md5sums =False
no_file_md5sum = False
no_verify = True
no_related_files = False
no_annotations = False
no_auto_retry = False
retry_amoumt = 6
wait_time = 25.0
latest = False
server =https://api.gdc.cancer.gov
n_processes = 4

数据下载步骤

需要去TCGA官网找到想要下载的数据集,这边以乳腺癌为例.
在这里插入图片描述
在这里插入图片描述
找到你要下载的数据集,也可以搜索栏搜索,找到之后勾选。
在这里插入图片描述
点击Save New Cohort,会让你输入一个名字,随便即可。
在这里插入图片描述
在这里插入图片描述
选中你刚才创建的Cohort,这边我选的是CESC。
在这里插入图片描述
然后点击Repository。
在这里插入图片描述
在这边你可以选择你想要下载的关于乳腺癌的各种数据,这边以乳腺癌的WSI为例。在右侧栏中找到下面的内容并勾选:
Experimental Strategy:Tissue Slide
Data Type:Slide Image
在这里插入图片描述
上面就是svs的数据集,你可以全部下载,也可以下载一部分,这边就下载2个为例。点击左侧的购物车,就会加入到队列中。
添加完之后,回到购物车,如下图。
在这里插入图片描述
在这里插入图片描述
把下载完的这个文件放到和gdc-client.exe同目录下。
然后win+R,输入cmd,打开终端。
进入到gdc-clinet.exe所在的文件夹下,输入gdc-client.exe download --config gdc-client.dtt -m gdc_manifest.txt命令行,即可下载数据集,此时这个数据集被下载到与gdc-client.exe同目录下。
此时下载的速度是很快的,不会有限制,不用科学上网,如果很慢就换个网络,我是用自己的流量测试的很快。

引用链接

https://www.jianshu.com/p/bea374ce82b3

http://www.lryc.cn/news/617804.html

相关文章:

  • 掘金数据富矿,永洪科技为山东黄金定制“数智掘金”实战营
  • JavaScript let的使用
  • macos彻底删除vscode
  • 2025年农业工程与环境预防国际会议(ICAEEP 2025)
  • k8s 部署mysql主从集群
  • 用AListLite让安卓手机成为NAS实现文件共享
  • 基于开源模型构建医疗疾病大模型:从理论到实践
  • 2025牛客多校第八场 根号-2进制 个人题解
  • USB 基本描述符
  • TRL - Transformer Reinforcement Learning SFTTrainer 和 SFTConfig
  • AI(2)-神经网络(激活函数)
  • 当生产环境卡成 PPT:Spring Boot 线程 Dump 捉妖指南 - 第544篇
  • 【09-神经网络介绍2】
  • 数据结构-排序(2)
  • 【排序算法】⑦归并排序
  • 用Python从零开始实现神经网络
  • 【08-神经网络介绍】
  • STM32 HAL库 HAL_TIM_OC_Start函数解读
  • maven项目打包成sdk后在别的项目使用
  • 深度解析三大HTTP客户端(Fetch API、Axios 和 Alova)——优劣与选择策略
  • 【03】厦门立林科技——立林科技 嵌入式 校招笔试,题目记录及解析
  • REDIS 各种数据结构有什么作用?都能干什么?
  • 写一篇Ping32和IP-Guard的对比,重点突出Ping32
  • 使用行为树控制机器人(一) —— 节点
  • 芯片学习 8 :IP集成、cluster、lint
  • 大语言模型(LLM)核心概念与应用技术全解析:从Prompt设计到向量检索
  • AI入门学习--如何写好prompt?
  • MySQL 数据操作全流程:创建、读取、更新与删除实战
  • 高精度蓝牙定位:技术、应用与未来发展
  • 【Docker实战进阶】Docker 实战命令大全