News

Date: 2025-11-26

沐曦股份科学计算团队近期取得突破性进展,成功将主流分子动力学模拟引擎GROMACS中的FEP计算全流程部署于GPU执行,并实现2.5倍性能提升,相关成果获得GROMACS官方团队的高度认可,该GPU加速功能将在GROMACS 2026官方版本中正式发布,核心论文已发表于国际权威期刊 ACS Omega。同时,团队自主研发的FEP工作流自动化管理工具MetaxFEP相关论文已正式发表在BIBE2025生物信息工程和生物医学会议论文集中,并在ICBBS会议上荣获分会最佳口头报告奖。这些成果的取得,标志着国产GPU加速技术在计算机辅助药物发现领域,已初步形成从算法优化到工具开发、再到实际工作流支撑的完整技术链条,为行业提供了切实可行的高效计算解决方案。


计算机辅助药物发现流程通常涵盖多个关键环节,包括分子表征、靶标蛋白结构预测、分子对接,以及基于动力学模拟的自由能预测等。其中,对配体-蛋白质结合自由能的精准预测通常采用自由能微扰(Free Energy Perturbation, FEP)方法,通过分子动力学模拟加以实现。FEP方法凭借其在预测结合自由能方面的高精度,被广泛视为药物筛选流程中最终阶段精细筛选与先导化合物优化的“金标准”工具。


然而,传统FEP应用长期面临两大关键瓶颈:一是计算速度缓慢,庞大的计算需求导致模拟耗时过长,严重制约了药物研发的迭代效率;二是操作流程复杂,涉及体系准备、拓扑生成、中间态窗口设置、平衡与采样以及数据分析等多个步骤,手动操作不仅费时,且容易引入误差。沐曦股份科学计算团队近期开展的一系列研究工作,正是为了系统性地应对上述挑战

沐曦股份曦云C500上蛋白质和配体的分子动力学模拟


1. GROMACS模拟引擎中FEP计算的GPU加速研究


GROMACS是一款由瑞典皇家理工学院(KTH)开发的开源分子动力学模拟引擎。凭借出色的性能与完善的功能,它在全球范围内拥有大量活跃用户,并常年位列世界各大超级计算机上使用最广泛的前三大科学计算应用之一。在制药领域,GROMACS常被用于FEP计算,以预测分子间相互作用的自由能变化。然而,目前其官方版本中的FEP计算仅支持在CPU上运行,这严重限制了整体模拟效率。


针对这一瓶颈,沐曦股份科学计算团队实现了FEP算法在GPU上的完整移植与优化。该GPU加速版本能够将FEP模拟全流程部署于GPU执行,使整体性能提升至原版的2.5倍。此项工作获得了GROMACS官方团队的高度认可,相关代码现已正式合入GROMACS官方代码仓库,计划纳入其2026年首版发布中。相关研究成果已发表于美国化学会旗下期刊 ACS Omega,全文开放获取,欢迎感兴趣的读者查阅下载。


论文链接:https://pubs.acs.org/doi/10.1021/acsomega.5c00151


核心贡献


  • GPU算法设计与优化:开发了基于GPU的自由能微扰(FEP)作用力计算算法,并针对不同GPU硬件架构进行了深度优化,包括任务划分逻辑、数据交换机制与内存排布策略等,充分发挥GPU并行计算效能。
  • 全流程GPU化实现:在完成FEP作用力计算加速的基础上,进一步将积分与状态更新等关键步骤移植至GPU,实现了FEP模拟全流程的GPU运行,大幅减少了CPU与GPU之间的数据传输开销,使整体性能达到原版的2.5倍。
  • 计算精度严格验证:优化后的代码通过了多阶段严谨验证,在多个测试数据集上的计算结果均达到化学精度(误差<2.0 kcal/mol),有力保障了模拟结果的可靠性与科学性。


2. MetaxFEP: 基于沐曦股份GPU的FEP工作流自动化管理工具


沐曦股份科学计算团队自研的MetaxFEP工具可以实现自动化高效的FEP流程构建、执行和管理。MetaxFEP 针对性地解决了FEP研究领域存在的可复现性和易用性问题。用户仅需提供目标蛋白结构和配体分子的文件,MetaxFEP 即可智能解析并自动构建完整的FEP计算工作流,涵盖从预处理到结果分析的所有必要环节。同时,整个工作流在沐曦GPU上执行,实现了从数据准备到核心计算的全流程GPU深度加速。最终,平台会精准预测目标蛋白与配体间的结合自由能变化,并将可靠的计算结果以清晰易用的CSV格式文件输出。


MetaxFEP的计算可靠性和卓越性能已通过严谨的基准测试得到充分验证。其预测结果与实验测量值之间的误差小于2.0 kcal/mol,达到化学精度;同时,测试得到的Pearson秩相关系数(R2)大于0.6,有效证明了其出色的排序能力。在性能方面,凭借着前文中介绍的FEP计算的全程GPU优化,MetaxFEP 展现出显著优势。在单张沐曦曦云C500 GPU上执行FEP计算,其速度可达到128核CPU服务器的3倍以上。当扩展到配备8张曦云C500 GPU的高性能服务器时,完成一组典型的蛋白质-配体自由能计算任务所需时间大幅缩短至仅约10小时。相较于同等规模的128核CPU计算资源,整体效率提升高达17倍,从而极大加速了药物研发周期。


MetaxFEP相关论文发表在BIBE2025生物信息工程和生物医学会议论文集中。在BIBE2025和ICBBS2025会议上,沐曦股份科学计算团队向行业专家和学者做了MetaxFEP的学术报告,并在ICBBS会议中获得分会最佳口头报告奖项


MetaxFEP学术论文链接:https://www.vde-verlag.de/books/566630/bibe-2025.html


MetaxFEP获得ICBBS分会最佳报告奖


以上工作均是沐曦股份“AI for Drug Discovery (AI4DD)”计算平台构建中的关键组成部分。沐曦股份致力于打造一条完整、高效、由AI驱动并全面GPU加速的药物研发工作流。该平台深度整合传统计算工具与前沿AI模型,为用户提供高性能、一体化研发解决方案,实现从靶点发现到先导化合物优化的全流程加速。

  • Business CooperationBusiness@metax-tech.com
  • Investor Relationsir@metax-tech.com