News
时间:2025-09-30
长期以来,在科学计算这一关键领域,核心软件与硬件大多依赖国外生态体系。这一现状,不仅在性能优化上存在掣肘,也让国产科研面临“算力不可控”的现实挑战。如何让国产软件在国产硬件上高效运行,构建真正自主可控的科学计算生态,成为科研界与产业界共同关注的焦点课题。
最近,国产开源密度泛函理论软件——原子算筹(ABACUS)发布了最新迭代版v3.9.0.14和v3.9.0.15。值得关注的是,在这些更新中,沐曦科学计算团队首次以开发者身份正式加入 ABACUS 社区。
这不仅是一项功能优化的升级,更是国产 GPGPU 与国产科学计算软件深度融合的重要体现,标志着国产算力生态正在走向新的发展阶段。
兼容国际主流GPU软件生态:使原代码应用能够轻松在沐曦GPGPU 上运行,为国产科学计算软件的迁移和适配提供便利。
自研高性能数学库:包括mcBLAS、mcFFT等,为科学计算提供核心算力保障。
AI4Science支撑[2]:依托MXMACA,在AI4Materials[3]领域,沐曦已覆盖从第一性原理计算、分子动力学到 AI 融合的材料科学应用场景,为 AI4Materials 提供全面支持。
凭借出色的软件生态兼容性与深厚的团队开发和优化能力,沐曦正在加速推动科学计算领域的国产化进程。
ABACUS(中文名:原子算筹)[4,5]作为一款基于第一性原理方法的开源材料计算平台,由中国科学技术大学、中科院物理研究所、北京大学、北京科学智能研究院、合肥综合性科学中心人工智能研究院等多家单位共同开发维护,拥有完全自主的知识产权,主要面向凝聚态材料及高温高压物质模拟计算功能支持:
ABACUS 还具备良好的扩展性:
ABACUS不仅是一款科学计算软件,更是国产开源科学计算生态的重要基石。
在 ABACUS 最新版本(v3.9.0.14和v3.9.0.15)的开发中,沐曦科学计算团队首次以开发者身份正式加入社区[8-10],并取得了显著成果:
快速适配:得益于MXMACA 出色的软件生态兼容性,ABACUS在沐曦GPU上无需改动一行源码即可顺利运行,平面波的CG或Davidson方法求解特征值、LCAO基组求解Kohn-Sham方程等主流算法均已支持。
深度优化:通过沐曦自研求解器实现 DAV 特征值求解,大幅提升求解效率;在沐曦 C 系列硬件的高带宽架构支持下,性能进一步释放。
社区贡献:沐曦科学计算团队积极提交 PR,不仅带来性能优化,也完成了部分 Bug 修复,为 ABACUS 的稳定发展贡献力量。
在处理超大原子体系时,部分软件可能因使用 32 位整型(int)作为数组索引或计数器,在体系规模超过一定阈值后触发整数溢出,进而导致计算崩溃。这一问题通常在显存容量较大的 GPU 上才会暴露——因为只有当单卡能容纳足够大的体系时,相关数据结构的尺寸才会增长到使 int 索引越界;而在显存较小的 GPU 上,由于体系规模受限,往往无法触发该边界条件,因此问题长期隐藏。
沐曦科学计算团队不仅协助 ABACUS 团队定位并修复了这一关键 Bug,从根本上消除了大体系计算中的稳定性隐患,更充分发挥沐曦 GPGPU 大显存(64 GB)容量优势——单卡即可承载更大规模的体系,无需过早切分到多卡。这不仅显著降低了对分布式内存和通信的依赖,也让用户能在更稳定、更经济的单机多卡配置下高效完成超大体系的第一性原理模拟。
在第一性原理计算中,傅里叶变换(FFT)是连接实空间与倒空间的核心操作,贯穿于电子密度构建、势能计算、波函数更新等多个关键步骤。尤其在平面波或数值原子轨道基组框架下,FFT 的调用频次高、数据规模大,成为影响整体性能的重要瓶颈。为此,沐曦科学计算团队对 ABACUS 中的 FFT 相关流程进行了深度优化:
与此同时,本征态求解是第一性原理计算的另一核心挑战,其算法选择直接影响收敛速度与计算稳定性。相较于传统的共轭梯度(CG)方法,Davidson(DAV)算法往往展现出更优的收敛行为。尽管 DAV 算法在实现上会占用更多显存,但其在 GPU 上的并行潜力巨大。针对这一特点,我们对 DAV 模块进行了优化:
沐曦科学计算团队协同 ABACUS 社区修复多项关键问题,确保生产环境稳定可靠:
——现在,调试与生产环境同样稳健!
沐曦科学计算团队能够高效、快速地向 ABACUS 贡献上述优化与修复,离不开 ABACUS 项目本身卓越的软件工程实践。其代码结构清晰、模块解耦良好,GPU 后端采用高度规范化的模板化设计,接口定义明确,文档完善,使得新功能集成与性能调优工作得以顺畅推进。这种对开发者友好的架构,不仅大幅降低了硬件厂商参与适配的门槛,也为国产科学计算软件的可持续演进树立了标杆。正因如此,沐曦科学计算团队才能在短时间内完成从性能分析、算法优化到代码提交的完整闭环,并顺利合入主干,真正实现“软硬协同,快速迭代”。这不仅是一次适配与优化,更是国产 GPGPU 与国产软件深度融合的缩影。
未来,沐曦将继续携手 ABACUS,共同推动 “国产软件 + 国产硬件” 的科学计算新生态,为 AI4Science 时代的突破性研究提供坚实算力支撑。
[1] 沐曦MetaX | 致力于成为全球一流的GPU企业: https://www.metax-tech.com/index.html
[2] AI4Science - 沐曦开发者: https://developer.metax-tech.com/developer/ai-4science
[3] AI4Materials - 沐曦开发者: https://developer.metax-tech.com/developer/ai-4science/AI4Materials
[4] Abacus: https://abacus.ustc.edu.cn/main.htm
[5] ABACUS Documentation: https://abacus.deepmodeling.com/en/latest/index.html
[6] ABACUS Interfaces to Other Softwares:
https://abacus.deepmodeling.com/en/latest/advanced/interface/index.html
[7] ABACUS Contribution Guide:
https://abacus.deepmodeling.com/en/latest/community/contribution_guide.html
[8] ABACUS v3.9.0.14主要更新列表: https://mp.weixin.qq.com/s/IURTxVzMchITf5_huYra-Q
[9] 感谢一下沐曦的工程师: https://mp.weixin.qq.com/s/b2Dib8unqcPPTyDI5tPTyQ
[10] ABACUS v3.9.0.15主要更新列表: https://mp.weixin.qq.com/s/4jCbfQj4l_pLKUBkc3CTpQ