News
时间:2026-06-03
近日,九源智能计算系统生态联合体旗下InfiniTensor 团队正式发布InfiniCCL v0.1.0 通信框架。这是该项目的首个开源版本,沐曦股份位列首批适配硬件厂商名单内,与框架完成首发适配。
按照官方产品定位,InfiniCCL是一个统一、跨平台、面向异构AI集群的通信库。在目前支撑AI大模型训练、推理的多卡、多节点算力集群场景,InfiniCCL 并不试图替代某一个特定平台的通信实现,而是在更高层提供统一API(基于C语言编写的应用程序编程接口)、统一的运行方式、统一的异构集群编排能力,让上层框架无需再为不同硬件单独维护一套通信逻辑。
了解更多 InfiniCCL 项目详情,欢迎访问:
https://github.com/InfiniTensor/InfiniCCL
AI 基础设施正在进入一个新的竞争维度——过去几年,我们更多关注模型规模、算力规模、单机性能。今天,竞争的主战场正在转向"系统效率"和"生态效应”。“如何提升多卡、多节点的集群系统效率”已经成为核心问题。
然而长期以来,AI 基础设施领域面临一大现实挑战:在异构算力集群系统内部,不同硬件平台之间,缺乏统一的通信。开发者往往需要针对不同芯片、不同 SDK、不同通信后端分别适配,平台切换与多节点部署都伴随着巨大的工程成本。集群通信已经成为直接影响集群系统吞吐、延迟与扩展能力的“隐形瓶颈”。
在算力异构化趋势日益明显的今天,这个问题正变得愈发突出。通信层的统一化、标准化,是AI行业不可绕开的基础工作。
为了这一目标,InfiniCCL团队在多项核心技术上实现创新突破:
接口设计上,InfiniCCL 并没有重新设计新的通信模型,而是选择兼容现有的主流GPU生态开发习惯,提供了统一的C语言 API接口,可降低迁移门槛;
实现了“底层加速器硬件-通信后端-运行环境”的自动感知。项目会根据环境自动启用对应平台支持,使用者不必再去关注每个异构环境的单独维护部署逻辑;
集群部署上,InfiniCCL 提供了配套的智能集群编排工具 icclrun,支持通过 SSH 自动编排多节点、在远程节点自动构建与部署运行环境,将“通信库运行”升级为“异构集群自动化部署框架”。
目前,InfiniCCL v0.1.0 已实现 AllReduce、AllGather、ReduceScatter等六大核心集合通信算子,支持主流的硬件平台,并通过统一 MPI 抽象层兼容 OpenMPI 与 MPICH 两大通信后端,完成了从算子到硬件、从接口到后端的全链路覆盖。
值得关注的是,在 InfiniCCL v0.1.0 已支持的硬件平台列表中,沐曦GPU成为首批适配的硬件平台之一。
这意味着,基于沐曦GPU构建的AI集群,可直接通过InfiniCCL的统一接口完成多节点集合通信,使用与其他平台一致的开发体验,共享相同的通信逻辑与部署工具链。
对于正在构建异构算力基础设施的企业和开发者而言,这一首发兼容具有直接的工程价值:
迁移成本降低:上层框架无需为沐曦平台单独适配通信逻辑;
多平台协同成为可能:在同一套通信抽象下,沐曦 GPU 可与其他硬件平台协同参与分布式训练与推理;
新硬件接入门槛下降:统一抽象层让生态扩展更加顺畅。
回顾国产芯片的发展历程,硬件性能的提升固然重要,但软件生态的完善程度,往往才是规模化落地的门槛。
一款芯片能否被主流框架、主流通信库、主流部署工具顺畅支持,直接决定了它在真实业务场景中的可用性。InfiniCCL 这类开源统一通信库的出现,正在从基础设施层面降低国产算力硬件的适配成本,推动整个生态向着更开放、更统一的方向演进。
一直以来,沐曦股份坚持以自研MXMACA软件栈为核心,构建开放、协同、高效的计算生态,目标是打造人工智能时代的 “Android”。
目前,MXMACA软件栈已经兼容40余种AI框架,覆盖AI训练与推理、科学计算,支持500多款AI模型、4500多个热门开源软件项目的测试。依托突出的兼容性与软硬件协同效率,沐曦GPU此前已经支持国内超25款主流模型的Day0适配,实现即插即用。同时,自2025年2月宣布开源至今,MXMACA软件栈已积累近50万开发者注册侧用户,生态规模日益壮大。
沐曦股份始终相信,硬件能力需要与软件生态协同演进,才能真正释放算力价值,打通算力落地的“最后一公里”。