当前位置: 首页 > news >正文

【文献阅读】【NMI 2022】LocalTransform :基于广义模板的有机反应性准确预测图神经网络

预测有机反应产物是有机化学的一个基本问题。基于成熟有机化学知识,化学家现在能够设计实验来制造用于不同目的的新分子。但是,它需要经验丰富的专业化学家来准确预测化学反应的结果。为了进一步帮助有机化学家并在数字化学时代实现全自动发现,机器智能可以准确预测有机反应的产物,大大加快新分子的设计过程。最近,已经提出了几种基于机器学习的方法来预测有机反应产物,但仍然需要改进反应预测模型才能达到足够的准确性,与普通有机化学家相当或更好。由于几种基于模板的方法的覆盖范围和可扩展性问题,科学家们提出了使用基于序列的模型或基于图模型的无模板方法。尽管这些方法在公共反应数据集上表现出有希望的准确性,但当前最先进的方法仍然以机械方式预测有机反应的产物,要么翻译化学语言,要么按顺序编辑分子图。相比之下,知识渊博的化学家通常通过识别反应中心并应用所学化学知识来预测有机反应性来和预测反应产物(In contrast, it is common practice for knowledgeable chemists to predict the reaction products by identifying the reaction centre and applying learnt chemistry knowledge such as named reactions to predict the organic reactivity.

研究人员设计了广义反应模板(GRT, generalized reaction template)一种仅描述基于原子映射的反应前后原子构型的局部变化但没有特定原子类型或官能团信息的反应模板,并提出了一个基于图机器智能的LocalTransform框架来预测反应产物。LocalTransform 通过识别反应中心以及要应用的 GRT 来预测反应产物。它通过全局注意力机制学习根据局部化学环境和选择性识别反应原子。最终反应转化由反应模板分类器预测,该分类器为预测的化学反应中心建议最可能的 GRT。

LocalTransform 在预测有机反应方面的三个重要突破:

  • GRT 在化学上是直观的和通用的。当前100 个最流行的反应模板可以描述所有训练反应的 94.6%,我们的 GRT 可以描述所有测试反应的 99.7%,从而解决了以前基于模板的方法的覆盖率和可扩展性问题。

  • 证明了 LocalTransform top-k 产物预测精度,与以前的基于图的方法相比有显著改进。

  • 由于模型是一种基于分类的方法,具有很强的分数-准确性相关性,它使用户能够理解不确定性并信任机器预测。(Since our model is a classification-based method with strong score–accuracy correlation, it enables the user to understand the uncertainty and trust the machine predictions. 什么意思?

所用数据集:

USPTO:  410,000 reactions in the training set, 30,000 reactions in the validation set and 40,000 reactions in the test set.

All the reactions in the USPTO-480k dataset are atom mapped, which indicates the atom position before and after the reaction. With annotated atom mapping, we are able to track 
the transformation of the atoms participating in the reaction and derive the GRTs.

USPTO是一个监督数据集,包含了反应前后的原子位置。

通过学习这种反应前后的原子位置的变化,我们能够学习到化学反应前后的原子转换规则从而推导出GRTs。

Nature子刊:机器学习助力化学家精准预测有机反应结果

Nat. Mach. Intel. | 基于广义模板的图形神经网络用于准确的有机反应性预测

http://www.lryc.cn/news/185130.html

相关文章:

  • QQ浏览器怎么才能设置默认搜索引擎为百度
  • Go Gin Gorm Casbin权限管理实现 - 3. 实现Gin鉴权中间件
  • js 封装一个异步任务函数
  • 目标检测YOLO实战应用案例100讲-基于无人机航拍图像的目标检测
  • PyQt5配置踩坑
  • 内网渗透笔记之内网基础知识
  • vue3+elementPlus:el-select选择器里添加按钮button
  • Android 模拟点击
  • css自学框架之选项卡
  • Element Plus组件库中的input组件如何点击查看按钮时不可编辑,点击编辑时可编辑使用setup
  • 小米、华为、iPhone、OPPO、vivo如何在手机让几张图拼成一张?
  • 物联网AI MicroPython传感器学习 之 WS2812 RGB点阵灯环
  • 【GPU常见概念】GPU常见概念及分类简述
  • JVM篇---第九篇
  • 探索 GAN 和 VAE 之外的 NLP 扩散模型
  • 发现很多人分不清 jwt session token 的区别?
  • GPT系列论文解读:GPT-3
  • 神经网络中的知识蒸馏
  • jmeter利用自身代理录制脚本
  • 【漏洞复现】时空智友企业流程化管控系统 session泄露
  • 获取泛型的类型
  • [Python进阶] Pyinstaller打包问题
  • 计算机竞赛 题目:基于机器视觉opencv的手势检测 手势识别 算法 - 深度学习 卷积神经网络 opencv python
  • 竞赛选题 机器学习股票大数据量化分析与预测系统 - python 竞赛选题
  • 智慧驿站:为城市带来全新智慧公厕未来形态
  • Java获取汉字首字母
  • 基于or-tools的人员排班问题建模求解(JavaAPI)
  • 设备管理团队如何做好停机维护工作_基于PreMaint设备数字化平台
  • c++ qt--线程(二)(第九部分)
  • ​企业数据泄露不断,深信服EDR助企业构建数据“安全屋”