当前位置: 首页 > news >正文

10.windows ubuntu 组装软件:spades,megahit

      Spades 是一种用于组装测序数据的软件,特别适用于处理 Illumina 测序平台产生的数据。它的全称是 "St. Petersburg genome assembler",是一款广泛使用的基因组组装工具。 

第一种:wget https://cab.spbu.ru/files/release3.15.3/SPAdes-3.15.3-Linux.tar.gz #下载SPAdes
tar -zxvf SPAdes-3.15.3-Linux.tar.gz

添加环境变量到~/.bashrc

第二种方法:conda install -c bioconda spades -y

#spades.py基础应用
spades.py -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz -o out -t 20 --isolate  #需要把输出目录清空,否则会报错 

#一些参数的含义。

-1, --pe1-1: 包含第一对端(pair-end)测序数据的文件。

-2, --pe1-2: 包含第二对端(pair-end)测序数据的文件。

--s1: 包含单端测序数据的文件。

-o, --output: 指定输出目录的路径。

-t, --threads: 指定要使用的线程数。

--meta: 指示 Spades 使用元基因组学模式进行组装。

--plasmid: 指示 Spades 寻找和组装质粒DNA序列。

--careful: 启用谨慎模式,以提高组装的准确性。

--only-assembler: 只运行组装步骤,而不运行错误矫正。

--cov-cutoff: 根据覆盖度进行组装的最低值。

-k :kmer数,一次可以输入多个,用逗号分隔,数值从小到大排列,kmer最大为127,数值必须是奇数,一般自动选择即可,--sc 参数,则默认值为 21,33,55 。若没有 --sc 参数,则程序会根据 reads 长度自动选择 k-mer 参数

--plasmid:从WGS数据集组装质粒

--metaplasmid:从宏基因组组装体中提取染色体外元素,如质粒

#megahit安装

conda install -c bioconda megahit -y

#基础使用

sudo /home/guozihan/miniconda3/envs/spades_env/bin/python /home/guozihan/miniconda3/envs/spades_env/bin/megahit -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz --num-cpu-threads 20 --out-dir megahit_out --tmp-dir /tmp --out-prefix A1

#使用中遇到三个问题,1.--out-dir 输出路径需要目录不存在任何内容。2.--tmp-dir 临时文件保留路径在ubuntu中好像只能设/tmp路径,设置其它路径,否则会报错没有操作权限。3.要指定python程序的路径,要用根用户权限,即sudo /home/guozihan/miniconda3/envs/spades_env/bin/python。

#命令行各参数的作用

sudo: 在Linux系统中,sudo命令用于以超级用户或其他用户的身份运行命令。以超级用户权限运行命令可能需要输入密码进行确认。

/home/guozihan/miniconda3/envs/spades_env/bin/python: 指定要使用的 Python 解释器的路径,用于执行 Megahit 软件。

/home/guozihan/miniconda3/envs/spades_env/bin/megahit: 指定要执行的 Megahit 可执行文件的路径。

-1 read_hont_removed_1.fastq.gz: 指定包含第一端测序数据的 fastq 文件。

-2 read_hont_removed_2.fastq.gz: 指定包含第二端测序数据的 fastq 文件。

--num-cpu-threads 20: 指定要使用的CPU线程数,这里设置为 20 个线程,用于加速程序运行。

--out-dir megahit_out: 指定输出结果的目录,Megahit 运行后生成的结果文件将保存在该目录中。

--tmp-dir /tmp: 指定临时文件存储的目录,Megahit 运行过程中生成的临时文件将保存在该目录中。

--out-prefix A1: 指定输出文件的前缀,生成的汇总文件和结果文件会以该前缀开头命名。

http://www.lryc.cn/news/329280.html

相关文章:

  • K8S之Secret的介绍和使用
  • git下载安装教程
  • 《剑指 Offer》专项突破版 - 面试题 98、99 和 100 : 和动态规划相关的矩阵路径问题(C++ 实现)
  • KY145 EXCEL排序(用Java实现)
  • 属性选择器
  • 软考 - 系统架构设计师 - 关系模型的完整性规则
  • 写了几个难一点的sql
  • 【JDK常用的API】包装类
  • Android Q(10)黑暗模式适配的实现
  • 【git】git使用手册
  • unity中判断方向 用 KeyVertical ,KeyHorizontal 判断ui物体的 方向
  • 前端a4纸尺寸转像素尺寸
  • Android 中 调试和减少内存错误
  • 证券市场概述
  • 什么是数据结构
  • 基于springboot+vue实现的学校田径运动会管理系统
  • HarmonyOS 应用开发之FA模型绑定Stage模型ServiceExtensionAbility
  • Java 中的单例模式
  • 鸿蒙OS开发实例:【ArkTS类库多线程I/O密集型任务开发】
  • OpenStack部署
  • Java中的多线程和线程安全问题
  • java Web会议信息管理系统 用eclipse定制开发mysql数据库BS模式java编程jdbc
  • lock4j学习记录
  • 【C++庖丁解牛】自平衡二叉搜索树--AVL树
  • ES5和ES6的深拷贝问题
  • 阿里云发送短信配置
  • axios封装,请求取消和重试,请求头公共参数传递
  • 隐私计算实训营学习五:隐语PSI介绍及开发指南
  • ES的RestClient相关操作
  • linux通用命令 ssh命令连接慢问题排查