当前位置: 首页 > news >正文

Biopython序列比对

从InterPro网站(https://www.ebi.ac.uk/interpro/download/Pfam/)下载多序列比对文件Pfam-A.seed.gz(含多个多序列比对)

​wget https://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.seed.gz

解压,取第一个多多序列比对文件

cat Pfam-A.seed | while read line; do if [[ ${line} != "//" ]]; then echo ${line}; else; echo ${line}; break; fi; done > Pfam-A-1.seed

InterPro 通过将蛋白质分类为家族并预测结构域和重要位点,对蛋白质进行功能分析。为了以这种方式对蛋白质进行分类,InterPro 使用了由组成 InterPro 联盟的几个不同数据库(称为成员数据库)提供的预测模型(称为特征)。我们将这些成员数据库中的蛋白质特征整合到一个单一的可搜索资源中,利用它们各自的优势来生成一个强大的集成数据库和诊断工具。

from Bio import AlignIO
align_file = "/path_to_file/Pfam-A-1.seed"
### 1. 读取序列比对文件
## read方法用于读取给定文件中可用的单个比对数据。
# 文件格式为 Stockholm
align = AlignIO.read(open(align_file), "stockholm")
# 常见的多序列比对格式还有 "clustal" "phylip"等
print("Alignment length %i" % align.get_alignment_length())
for record in align:print(record.seq + " " + record.id)## parse方法返回可迭代的对齐对象,可以对其进行迭代以获得实际的对齐方式
alignments = AlignIO.parse(open(align_file), "stockholm") 
print(alignments) for alignment in alignments: print(alignment)### 2. 双序列比对
from Bio import pairwise2
from Bio.Seq import Seq 
seq1 = Seq("ACCGGT") 
seq2 = Seq("ACGT")alignments = pairwise2.align.globalxx(seq1, seq2)
print(alignments)for alignment in alignments: print(alignment)## 格式化输出
from Bio.pairwise2 import format_alignment 
alignments = pairwise2.align.globalxx(seq1, seq2) 
for alignment in alignments: print(format_alignment(*alignment)) ### 3. Biopython通过Bio.Align.Applications模块为许多序列比对工具提供接口。
from Bio.Align.Applications import ClustalwCommandline

参考
https://www.yiibai.com/biopython/biopython_sequence_alignments.html
https://biopython.org/wiki/AlignIO

http://www.lryc.cn/news/118658.html

相关文章:

  • 无法坚持运动?解密肠道菌群影响运动积极性
  • 4-5-tablewidget
  • 前端基础第一天-html-综合案例
  • PDF Expert 3.3 for mac
  • 【腾讯云 Cloud Studio 实战训练营】深度体验 | 使用腾讯云 Cloud Studio 快速构建 Vue + Vite 完成律师 H5 页面
  • Word转PDF在线转换如何操作?分享转换技巧
  • 只需5步 真·双开电脑版微信
  • 如何将JSON字符串转化成对象
  • 计算机网络 运输层 UDP和TCP对比
  • Zebec Protocol 将进军尼泊尔市场,通过 Zebec Card 推动该地区金融平等
  • stm32项目(8)——基于stm32的智能家居设计
  • 边缘计算:连接智能世界的变革之力
  • 多货币多汇率跨境电子商城建设(仓储管理、网络安全)
  • 笔记,ubuntu22安装header问题
  • 领航优配:股票分红为什么股价下降?分红有什么好处?
  • Spark(38):Streaming DataFrame 和 Streaming DataSet 转换
  • 设计模式之六:命令模式(封装调用)
  • git删除历史提交中的某些文件
  • Java List(列表)
  • 虚拟机的创建与使用
  • springboot传给前端日期少了八小时
  • 链表数组OJ题汇总
  • 中间人攻击与 RADIUS 身份验证
  • 虚拟机安装国产操作系统的方法
  • 【Linux】云服务器自动化部署VuePress博客(Jenkins)
  • Golang字符串处理深入解析:探索 strings 标准库的全部方法
  • 如何在群辉NAS系统下安装cpolar套件,并使用cpolar内网穿透?
  • opencv基础57-模板匹配cv2.matchTemplate()->(目标检测、图像识别、特征提取)
  • 搜索插入位置
  • Centos Linux快速复制文件并查看进度的方法(保留文件原始时间戳等属性)