近日,百度在生物计算领域的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,登上了国际顶级学术期刊《Nature》子刊《Nature Machine Intelligence》!
论文提出“基于空间结构的化合物表征学习方法”,即“几何构象增强 AI 算法”(Geometry Enhanced Molecular Representation Learning,GEM 模型),将化合物的几何结构信息引入自监督学习和分子表示模型,对化合物进行“3D 建模”,以预测化合物分子的性质属性。
在药物筛选上的应用,可在数小时内完成传统仿真方法1年的工作量,效率提升上千倍,有望大幅降低药物研发的时间投入和成本投入。这是百度在 AI 赋能药物研发领域的又一项重磅成果。
化合物的性质和其三维空间结构密切相关,为了更好地预测化合物性质,亟需引入化合物的三维空间信息。百度此次提出的“基于空间结构的化合物表征学习方法”,即 GEM 模型,在这一点上实现了重大突破,在全球范围内开创性地将化合物性质预测从“2D 建模”推进到“3D 建模”。
同时,引入 AI 领域迅速发展的预训练技术,利用大量无标注的化合物数据,通过自监督学习,构建 GEM 模型的底层能力,有望能成为小分子药物研发领域的模型底座,解决小分子药物活性预测,成药性预测,药物设计等核心问题,真正加速药物,特别是全新药物(First In Class)的发现过程。