当前位置: 首页 > news >正文

Skewer v0.2.2安装与使用-生信工具43

01 Skewer 介绍

Skewer(来自于 SourceForge)实现了一种基于位掩码的 k-差异匹配算法,专门用于接头修剪,特别设计用于处理下一代测序(NGS)双端序列。

fastp安装及使用-fastp v0.23.4(bioinfomatics tools-002)-CSDN博客

特性

  • 检测并去除接头序列
  • 支持模式匹配中的插入和删除
  • 适用于单端、双端(PE)和长配对(LMP)读取
  • 对带条形码的测序结果进行去重
  • 支持多线程
  • 基于 Phred 质量分数进行修剪
  • 支持条形码和接头中的 IUPAC 字符
  • 支持压缩输入和输出
  • 支持从二进制文件安装
02 安装
2.1 从二进制文件安装
  1. 将 skewer 复制到你喜欢的 BIN 目录,并确保正确设置 PATH 环境变量。例如:

    $ mkdir -p ~/bin
    $ cp -p skewer ~/bin/
    $ echo 'export PATH=~/bin:$PATH' >> ~/.bashrc
    $ source ~/.bashrc
    
2.2 从源代码安装
  1. 进入源代码目录,然后运行以下命令:

    $ make
    $ sudo make install
    
03 Skewer 使用说明

Skewer(一个快速且精确的接头修剪工具,适用于双端读取)

使用方法:

skewer [options] <reads.fastq> [paired-reads.fastq]或者
skewer [options] - (从 STDIN 获取输入)选项说明(括号中的数字为默认值):
接头:
-x <str>:接头序列/文件(默认:AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)
-y <str>:双端读取的接头序列/文件(默认:AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA),如果只指定 -x,则隐式使用。
-M, --matrix <str>:指示有效接头配对的文件(所有为 1 的矩阵)。
-j <str>:Nextera Mate Pair 读取的接头序列/文件(默认:CTGTCTCTTATACACATCTAGATGTGTATAAGAGACAG)。
-m, --mode <str>:修剪模式;
单端:head:5' 端;tail:3' 端;any:任何位置(默认:tail)
双端:pe:双端;mp:mate-pair;ap:amplicon(默认:pe)
-b, --barcode:根据接头/引物去重条形码(默认:no)
容错:
-r <num>:允许的最大错误率(标准化错误数/对齐区域长度)[0, 0.5](默认:0.1)
-d <num>:允许的最大插入/删除错误率(默认:0.03)
-k <int>:接头检测的最小重叠长度 [1, inf);(单端的最大值:max(1, int(4-10*r));mate-pair的值为<junction length>/2)
修剪:
-c, --cut <int>,<int>:强制修剪掉 5' 端引物作为条形码(在放大模式下)(默认:no)
-e, --cut3:如果读取长度大于指定的最大长度,则强制修剪掉 3' 端尾部碱基(默认:no)
过滤:
-q, --end-quality <int>:修剪 3' 端直到达到指定的质量值(默认:0)
-Q, --mean-quality <int>:修剪前允许的最低平均质量值(默认:0)
-l, --min <int>:修剪后允许的最小读取长度(默认:18)
-L, --max <int>:修剪后允许的最大读取长度(默认:no limit)
-n:是否过滤掉高度退化的(包含许多 N)读取(默认:no)
-u:是否过滤掉未确定的 mate-pair 读取(默认:no)
-N, --fillNs:是否将修剪的碱基替换为 N(在 b 或 -m mp 情况下无效)(默认:no)
输入/输出:
-f, --format <str>:FASTQ质量值的格式:sanger|solexa|auto(默认:auto)
-o, --output <str>:输出文件的基本名称(默认:<reads>.trimmed)
-z, --compress:以 GZIP 格式压缩输出(默认:no)
-1, --stdout:重定向输出到 STDOUT,禁止使用 -b、-o 和 -z 选项(默认:no)
--qiime:为 QIIME 处理准备“barcodes.fastq”和“mapping_file.txt”(默认:no)
--quiet:不显示进度更新(默认:not quiet)
-A, --masked-output:为修剪后的读取写输出文件(修剪后的碱基转换为小写)(默认:no)
-X, --excluded-output:为被排除的读取写输出文件(默认:no)
其他:
-i, --intelligent:在 mate-pair 模式下,是否根据接头信息重新分配读取(默认:no)
-t, --threads <int>:并发线程数 [1, 32](默认:1)
    04 常用示例
    skewer -Q 9 -t 2 -x adapters.fa sample.fastq -o trimmed
    skewer -x AGATCGGAAGAGC -q 3 sample-pair1.fq.gz sample-pair2.fq.gz
    skewer -x TCGTATGCCGTCTTCTGCTTGT -l 16 -L 30 -d 0 srna.fastq
    skewer -m mp -i lmp-pair1.fastq lmp-pair2.fastq
    skewer -m ap --cut 0,6 --qiime -x forward-primers.fa -y reverse-primers.fa mix-pair1.fastq mix-pair2.fastq
    
     05 引用

    Jiang, H., Lei, R., Ding, S.W. and Zhu, S. (2014) Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads. BMC Bioinformatics15, 182.

    http://www.lryc.cn/news/530519.html

    相关文章:

  • C语言:链表排序与插入的实现
  • 【Elasticsearch】doc_values 可以用于查询操作
  • 深度学习深度解析:从基础到前沿
  • JVM的GC详解
  • 【开源免费】基于Vue和SpringBoot的校园网上店铺系统(附论文)
  • 测压表压力表计量表针头针尾检测数据集VOC+YOLO格式4862张4类别
  • Vue 3 30天精进之旅:Day 12 - 异步操作
  • 【网络】3.HTTP(讲解HTTP协议和写HTTP服务)
  • [paddle] 矩阵相关的指标
  • docker部署SpringBoot项目简单流程
  • Python学习——函数参数详解
  • Chromium132 编译指南 - Android 篇(一):编译前准备
  • .Net / C# 繁体中文 与 简体中文 互相转换, 支持地方特色词汇
  • Java泛型深度解析(JDK23)
  • 【贪心算法篇】:“贪心”之旅--算法练习题中的智慧与策略(一)
  • AJAX XML
  • 踏入编程世界的第一个博客
  • 2025年1月22日(网络编程 udp)
  • 数据结构与算法之栈: LeetCode 641. 设计循环双端队列 (Ts版)
  • 从零开始学 HTML:构建网页的基本框架与技巧
  • 一些杂记2
  • C语言 --- 分支
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.10 ndarray内存模型:从指针到缓存优化
  • 【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.6 广播机制核心算法:维度扩展的数学建模
  • K8S极简教程(4小时快速学会)
  • 系统URL整合系列视频二(界面原型)
  • 虚幻浏览器插件 UE与JS通信
  • OpenAI深夜反击:o3-mini免费上线,能否撼动DeepSeek的地位?
  • Golang 应用的 Docker 部署方式介绍及使用详解
  • deep seek R1本地化部署及openAI API调用