当前位置: 首页 > news >正文

tombo resquiggle

Re-squiggle 算法

简介

纳米孔读取产生的电流信号水平数据称为squiggle。将这些squiggle信息进行基底呼叫通常与参考序列相比会包含一些错误。Re-squiggle算法定义了从squiggle到参考序列的新分配,即重新squiggle。

Re-squiggle算法是Tombo框架的基础。该算法输入包含原始信号和相关基底呼叫的读取文件(FAST5格式)。基底呼叫映射到基因组或转录组参考,然后根据预期的电流水平模型将原始信号分配给参考序列。

快速概述

  • 必须在修改基底检测或其他Tombo命令之前,在一组读取上运行tombo resquiggle命令。

  • 必须提供包含FAST5读取文件和基因组/转录组参考的目录。

    • 参考序列可能是之前已知的,或者是从这个样本中发现的。
  • 重要的是,参考序列被假定为正确,因此通过抛光创建个性化参考可能会改善性能,特别是对于分歧样本或组装不良的参考。

  • 原始读取FAST5文件必须包含基底呼叫。

    • 使用tombo preprocess annotate_raw_with_fastqs命令从FASTQs集合中添加基底呼叫到原始读取文件。
    • 读取文件不需要包含Events数据(由albacore的fast5模式输出)。
  • Tombo目前仅支持DNA和RNA数据(包括R9.4和R9.5;1D和1D2数据;R9.*.1化学)等。其他数据可能会产生次优结果(例如R9.0或R7数据)。

  • DNA和RNA读取将自动检测并相应处理(使用--dna--rna显式设置)。

    • Tombo不执行拼接映射。因此,对于RNA样本,必须向re-squiggle命令传递转录组参考。有关Tombo RNA处理的更多详细信息,请参见:doc:rna部分。
  • 使用--processes选项在多个核心上运行tombo resquiggle

算法细节

Re-squiggle算法分为以下五个主要步骤:

  1. 基因组映射
  2. 信号归一化
  3. 事件检测
  4. 序列到信号分配
  5. 解决跳过的碱基

基因组映射

基因组映射通过Python API minimap2mappy python package <https://pypi.python.org/pypi/mappy>_)执行。

FAST5文件中读取基底呼叫序列的位置由命令行选项--basecall-group--basecall-subgroups定义。这些参数的默认值指向albacore或tombo preprocess annotate_raw_with_fastqs的默认基底呼叫位置。

成功映射的读取的基因组序列随后传递到:ref:seqeunce_to_signal阶段。

信号归一化

在事件检测和信号到序列分配步骤的第一次迭代之前,使用中值偏移和MAD(中值绝对偏差)比例参数对读取的原始信号进行归一化。

[ NormSignal = \frac{RawSignal - Shift}{Scale} ]

截至Tombo版本1.3,在第一次迭代之后,通过匹配预期信号水平与从信号到序列分配的第一次迭代观察到的信号水平&#

http://www.lryc.cn/news/423537.html

相关文章:

  • vue3获取vue实例 并注册全局属性方法
  • function calling后,如何让大模型进行自然语言输出?
  • Android笔试面试题AI答之Kotlin(8)
  • LVS服务的搭建之NAT模式、DR模式的搭建实战
  • Raft分布式存储
  • 【Linux】使用nm命令查看动态库包含的符号表
  • 你还不知道苹果手机截长图的方法?4 种方法都可以
  • C++选择题带答案
  • Unity动画模块 之 简单创建一个序列帧动画
  • 学会高效记录并整理编程学习笔记
  • Llama 3.1中文微调数据集已上线,超大模型一键部署
  • css实现太极图
  • Android 13 移植EthernetSettings/Ethernet更新
  • 极狐GitLab 如何设置访问令牌前缀?
  • leetcode日记(72)最大矩形
  • 自驾畅游保定:参观总督署,品美食文化
  • 我常用的几个傻瓜式爬虫工具,收藏!
  • 数据分析2 Numpy+Scipy+Matplotlib+Pandas
  • 手机IP地址:是根据网络还是设备决定的?
  • 数据结构-常见的七大排序
  • 离线安装部署springboot+vue系统到服务器
  • 【STM32】ADC模拟数字转换(规则组单通道)
  • WPF 数据模板DataTemplate、控件模板ControlTemplate、Style、ItemsPreseter
  • Windows下搭建Telegraf+Influxdb+Grafana(详解一)
  • 同城搭子社交系统开发同城搭子群活动APP圈子动态小程序
  • 大厂最佳实践 | Stripe 如何防止重复付款
  • Raspberry Pi Pico 2 上实现:实时机器学习(ML)音频噪音抑制功能
  • 安全自动化和编排:如何使用自动化工具和编排技术来提高安全操作效率。(第二篇)
  • HarmonyOS WebView
  • 解决elementUI表格里嵌套输入框,检验时错误信息被遮挡