当前位置: 首页 > article >正文

bismark OT CTOT OB CTOB 以及mapping后的bam文件中的XG,XR列的含义

首先,OT,OB,CTOT,CTOB都是描述测序reads的,而不是描述参考基因组的。

bisul-fate建库会将DNA双链文库中非甲基化的C转化成U。转化结束后,被转化的U和互补链的G并不配对。此时正链(+,OT,original top strand)和反链(-,OB,original bottom strand)中,均为C to T转换的原始reads。

上述的reads经过PCR扩增后,正反单链均产生完全互补链。OT的互补链为CTOT(Complementary original top strand),OB的互补链为CTOB(Complementary bottom strand)。可知CTOT和CTOB均为GA转换。

图片引用自:

https://zhuanlan.zhihu.com/p/163495878

  • 正链(+):是指 FASTA 文件中提供的原始序列本身,即参考基因组中记录的那条链。

  • 负链(-):是指 FASTA 文件中记录的序列的反义链,也就是将参考序列取反向互补得到的链。

关于bismark比对,可以参考这篇:

https://www.zxzyl.com/archives/759/

比对生成的bam文件中,XR字段如果是CT,表示该reads是经过CT变换后匹配到了基因组中,即该reads属于OB或者OT;此时若XG字段为GA,表示它mapping到了参考基因组正链中的GA变换也就是反链中的CT变换,即表示它属于反链,即OB。如上图,即(2)对应的情况(reads上的C全部转换成T,然后mapping到了基因组正链GA转换。)

列个表供参考:

XRXG说明Strand
CTCTread 是 C→T(OB或者OT),基因组是 C→T(OT或CTOT)OT
CTGAread 是 C→T(OB或者OT),基因组是 G→A(OB或CTOB)OB
GACTread 是 G→A(CTOT或者CTOB),基因组是 C→T(OT或CTOT)CTOT
GAGAread 是 G→A(CTOT或者CTOB),基因组是 G→A(OB或CTOB)CTOB
http://www.lryc.cn/news/2396856.html

相关文章:

  • new语法
  • npm、yarn幽灵依赖问题
  • Android Native 之 adbd进程分析
  • CAN通讯协议中各种参数解析
  • 网络攻防技术三:网络脆弱性分析
  • (八)登录认证与学生写作画像
  • Netty学习example示例
  • 几种常用的Agent的Prompt格式
  • 数据库运维管理系统在AI方向的实践
  • [RoarCTF 2019]Easy Calc
  • [Windows]在Win上安装bash和zsh - 一个脚本搞定
  • ubuntu系统上运行jar程序输出时间时区不对
  • React 播客专栏 Vol.18|React 第二阶段复习 · 样式与 Hooks 全面整合
  • 从认识AI开始-----解密LSTM:RNN的进化之路
  • leetcode0513. 找树左下角的值-meidum
  • 命令行式本地与服务器互传文件
  • MPTCP 聚合吞吐
  • JavaScript性能优化实战技术文章大纲
  • LabelImg: 开源图像标注工具指南
  • 计算机网络 TCP篇常见面试题总结
  • 树欲静而风不止,子欲养而亲不待
  • Kotlin中的::操作符详解
  • 【Linux】(1)—进程概念-③Linux进程概念与PCB
  • 神经网络中的梯度消失与梯度爆炸
  • 深入详解编译与链接:翻译环境和运行环境,翻译环境:预编译+编译+汇编+链接,运行环境
  • 系统架构设计师案例分析----经典架构风格特点
  • 基于大模型的急性乳腺炎全病程风险预测与综合治疗方案研究
  • HTML实战:爱心图的实现
  • 定时任务:springboot集成xxl-job-core(二)
  • DeviceNET转EtherCAT网关:医院药房自动化的智能升级神经中枢