【深度学习新浪潮】什么是蛋白质反向折叠模型?
蛋白质反向折叠模型(Inverse Folding Model)是一种通过给定蛋白质三维结构来设计或预测其氨基酸序列的计算方法,属于基于结构的蛋白质设计领域。其核心目标是解决“逆向折叠问题”——即如何从目标结构出发,找到能稳定折叠成该结构的氨基酸序列。这一模型的应用场景广泛,包括酶工程、药物设计、疫苗开发以及新型蛋白质材料的研发等。
一、解决的核心问题
-
突破传统实验限制
传统蛋白质设计依赖耗时的实验试错(如定向进化),而反向折叠模型通过计算模拟大幅缩短设计周期。例如,中国科学家开发的新型蛋白质改造方法利用现有反向折叠模型,无需单独训练AI即可实现高效进化模拟,实验验证中成功改造了8种功能蛋白(如基因编辑工具脱氨酶)。 -
优化序列设计的准确性
蛋白质结构与序列的关系高度复杂(同一结构可能对应多种序列),反向折叠模型通过学习天然蛋白质的构造规律,能捕捉进化形成的序列特征,提升设计成功率。例如,PiFold模型在CATH 4.2数据集上的序列恢复率