当前位置: 首页 > news >正文

论文解析-基因序列编码算法DeepSEA

论文解析-DeepSEA

  • 参考
  • 亮点
    • 功能
  • 方法
  • 数据集
    • 来源
    • 数据
  • 实验评估
    • 评估DeepSEA预测染色质特征的性能
    • 评估DeepSEA在变异序列上的DHS预测性能
      • 数据集
      • 结果

参考

Zhou, J., Troyanskaya, O. Predicting effects of noncoding variants with deep learning–based sequence model. Nat Methods 12, 931–934 (2015). https://doi.org/10.1038/nmeth.3547

亮点

  1. 从大范围上下文序列中整合信息(变异位点附近的系列决定变异的调控属性)
  2. 使用分层架构在多个空间尺度上学习序列代码
  3. 共享预测特征的不同染色质因子的多任务联合学习(一个序列特征可以同时用于识别指定TF的结合位点,及预测TF的物理交互)

功能

基于基因序列预测基因序列的非编码变异的功能影响,具体包括预测非编码区域的调控信息、疾病或性状相关的SNP、非编码eQTLs等。
数学建模为每个输入序列的多标签任务,每个标签为当前任务的候选染色质特征,用预测结果的概率表示该序列具有该特征的可能性。
在这里插入图片描述

方法

在这里插入图片描述

数据集

来源

数据库 ENCODE 和项目 Roadmap Epigenomics projects

数据

包括160个不同TF的690个TF结合谱,125个DNase I敏感位点(DHS)图谱,104个组蛋白标记谱。

实验评估

评估DeepSEA预测染色质特征的性能

这里的染色质特征包括基于序列预测TF 结合位点、DNase-seq图谱、组蛋白标志图谱;结果表明,DeepSEA对这3钟预测任务均达到较高AUC
在这里插入图片描述

评估DeepSEA在变异序列上的DHS预测性能

数据集

来自ENCODE的等位基因失衡信息的DNase-seq数据,包括35种细胞类型的57,407个等位基因失衡的SNPs,其中28,918个是参考等位基因偏差的变异、28,489个替代等位基因偏差的变异。
等位基因失衡:当在单细胞类型的杂合位点观察到一个等位基因明显高于另一个等位基因时,表明两个等位基因的 DNase I 敏感性不同。

结果

图b种横(纵)轴表示DeepSEA预测的替代(参考)等位基因偏差的变异为DHS的概率,蓝色(红色)表示实验确定的替代(参考)等位基因偏差,黑线为确定预测可信度的阈值。
图c蓝色线表示单种细胞类型中DeepSEA预测DHS的准确率,红色为35种细胞类型的平均值。可以看出,随着可信度阈值的提高,DeepSEA的准确度明显提高。
在这里插入图片描述
此外,作者还证明DeepSEA可以高置信度地预测SNPs在TF结合位点的影响(多分类问题)、非编码调控突变、非编码eQTLs、非编码性状相关SNP

http://www.lryc.cn/news/166538.html

相关文章:

  • 计组与操作系统
  • Pytorch中张量矩阵乘法函数(mm, bmm, matmul)使用说明,含高维张量实例及运行结果
  • 如何在matlab绘图的标题中添加变量?变量的格式化字符串输出浅析
  • Spring MVC 八 - 内置过滤器
  • @Change监听事件与vue监听属性:watch的区别?
  • C++面试记录之中望软件
  • 多功能翻译工具:全球翻译、润色和摘要生成 | 开源日报 0914
  • 在 Vue.js 中,使用 watch 监听data变量如:对象属性/data变量
  • vue中预览xml并高亮显示
  • MFC中嵌入显示opencv窗口
  • 金鸣识别网页版:轻松实现表格识别的神器
  • DasViewer可以设置打开指定文件吗?
  • uniapp微信小程序用户隐私保护指引弹窗组件
  • Java的反射应用(Method和Class)
  • Java之泛型系列--Class使用泛型的方法(有示例)
  • 【【无用的知识之串口学习】】
  • 9月13日上课内容 第三章 ELK日志分析系统
  • 不知道有用没用的Api
  • (2023,LENS 视觉模型 LLM)迈向可见的语言模型:通过自然语言的镜头来看计算机视觉
  • 线段树上树剖再拿线段树维护:0914T4
  • 互联网医院系统|互联网医院探索未来医疗的新蓝海
  • Acrel-2000系列监控系统在亚运手球比赛馆建设10kV供配电工程中的应用
  • c++中遇到一个不了解的函数,查看能用的接口功能
  • windows linux子系统 docker无法启动
  • 【Redis】深入探索 Redis 的数据类型 —— 无序集合 Set
  • 可变参数JAVA
  • Zabbix监控平台部署流程
  • 重磅!文晔以38亿美元收购富昌电子 | 百能云芯
  • Multimodel Image synthesis and editing:The generative AI Era
  • Linux——(第十章)进程管理