当前位置: 首页 > news >正文

Nat Mach Intell | AI分子对接算法评测

《Nature Machine Intelligence》发表重磅评测,系统评估AI与物理方法在虚拟筛选(VS)中的表现,突破药物发现效率瓶颈。

核心评测体系:三大数据集

研究团队构建了三个新型测试集

  1. TrueDecoy:含147个靶点,活性分子与真实实验验证的低活性分子(活性-非活性比例1:40),模拟高挑战性筛选场景(图a,c)。

  2. RandomDecoy:活性分子取自TrueDecoy,非活性分子随机选自商业库(比例1:100或1:300),贴近真实药物筛选(图b,d)。

  3. MassiveDecoy:扩展至700万分子库,验证算法在大规模VS中的实用性。

AI与物理方法的对决

1. 对接准确性

  • AI工具:CarsiDock(成功率86.4%)和KarmaDock(76.2%)在RMSD <2Å时超越所有传统方法。

  • 物理方法:LeDock在RMSD <1Å时准确率最高,显示局部构象优化优势。

2. 结构合理性

  • 物理方法稳胜:Glide等生成复合物的分子间有效性(Intermolecular validity)达90%以上。

  • AI的短板:CarsiDock在分子间碰撞检查中合格率仅50%,FlexPose甚至低于20%。研究者指出,AI方法多关注配体构象,忽视蛋白-配体空间冲突。

3. 虚拟筛选表现

TrueDecoy测试:物理方法Glide联合RTMScore在区分微弱活性分子时最佳(EF_1%=5.69)。

RandomDecoy测试:CarsiDock全面胜出(EF_1%=43.5),显示AI在真实化学库筛选中的潜力。

技术瓶颈深度解析

1. 数据依赖性

去除PDBbind重复数据后,AI工具成功率下降30%,而物理方法稳定,提示现有AI模型泛化能力不足。

2. 后处理策略的局限性

RDKit几何优化(FF)仅提升配体内部合理性(Intramolecular validity),但恶化分子间相互作用

构象对齐(Align)反而导致RMSD升高,削弱筛选性能。

3. 效率与精度的平衡

KarmaDock单次对接仅需0.017秒(GPU加速),适合千万级库初筛;CarsiDock精度高但耗时较长(1.7秒/分子),需级联策略提速。

未来方向与实战策略

1. 层次化筛选方案

两步走策略:先用KarmaDock初筛百万库,再以CarsiDock优化前10万分子。在八类靶点测试中,该策略显著提升活性分子召回率。

2. AI算法革新

  • 将分子间几何约束(如氢键网络、疏水接触)融入神经网络架构;

  • 开发统一评分框架,整合物理参数与深度学习特征。

3. 数据建设标准化

  • 制定更严格的复合物合理性评价指标;

  • 构建靶点依赖性更弱的广谱训练集。

主编视点

"AI对接工具的崛起并非替代传统方法,而是扩展药物发现的策略维度。此项研究揭示:

  • 在初筛阶段,AI凭借速度优势可快速缩小化学空间;

  • 在先导化合物优化时,物理方法对结合模式合理性的把控不可替代。

未来,嵌入物理规则的混合模型或成突破关键——既要让AI'理解'能量最小化原理,也要保留其探索未知空间的能力。"

参考资料

Gu, S., Shen, C., Zhang, X. et al. Benchmarking AI-powered docking methods from the perspective of virtual screening. Nat Mach Intell (2025).

代码链接:https://github.com/shukai1997/VSDS-VD

http://www.lryc.cn/news/547290.html

相关文章:

  • 【自学笔记】Hadoop基础知识点总览-持续更新
  • 【Linux】使用问题汇总
  • (二 十 二)趣学设计模式 之 备忘录模式!
  • 交叉编译openssl及curl
  • 【每日八股】计算机网络篇(三):IP
  • Gartner:数据安全平台DSP提升数据流转及使用安全
  • 从vue源码解析Vue.set()和this.$set()
  • 深入浅出:UniApp 从入门到精通全指南
  • DeepSeek未来发展趋势:开创智能时代的新风口
  • 阻塞队列的实现(线程案例)
  • http status是什么?常见的http状态码指的是什么意思?
  • react组件分离,降低耦合
  • 【AI】AI白日梦+ChatGPT 三分钟生成爆款短视频
  • MYSQL的安装教程
  • 深入解析 C# 中的泛型:概念、用法与最佳实践
  • NUMA架构介绍
  • 数据安全VS创作自由:ChatGPT与国产AI工具隐私管理对比——论文党程序员必看的避坑指南
  • python爬虫:python中使用多进程、多线程和协程对比和采集实践
  • 《OpenCV》—— dlib库
  • Linux搜索---find
  • python之爬虫入门实例
  • Blender常用快捷键的汇总
  • 鸿蒙启动页开发
  • Unity 文字高度自适应
  • Teaching Small Language Models Reasoning throughCounterfactual Distillation
  • 快速开始React开发(一)
  • 2025最新Transformer模型及深度学习前沿技术应用
  • 极狐GitLab 正式发布安全版本17.9.1、17.8.4、17.7.6
  • [环境搭建篇] Windows 环境下如何安装Docker工具
  • JavaScript 数组和字符串方法详解