沐曦股份Day0适配阿里千问Qwen3.6-35B-A3B，与FlagOS合作实现模型多芯部署新闻中心

企业新闻

News

新闻中心

沐曦股份Day0适配阿里千问Qwen3.6-35B-A3B，与FlagOS合作实现模型多芯部署

时间：2026-04-17

阿里巴巴千问模型团队最新宣布，开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型。沐曦股份与FlagOS合作，完成了该模型的Day0 适配。经测试，基于沐曦芯片，实现了“零代码修改”完成 Qwen3.6-35B-A3B 的推理部署及充分验证。这充分展示出了沐曦股份软硬件协同的兼容优势与生态合作的协同作用。

Qwen3.6-35B-A3B是一个完全开源的稀疏 MoE（混合专家）模型，主打轻量高效。模型总参数量为350亿，激活参数只有30亿。据模型研发团队介绍，Qwen3.6-35B-A3B在智能体编程方面表现卓越，大幅超越前代Qwen3.5-35B-A3B，并可与Qwen3.5-27B、Gemma4-31B等稠密模型一较高下。主要特性包括：

卓越的智能体编程能力，可与大得多的模型相媲美

强大的多模态感知与推理能力

沐曦股份此次与FlagOS合作实现Day0适配，主要依靠四项关键技术支撑：

FlagOS 为 vLLM 推理框架打造的专属插件vLLM-plugin-FL。插件可以在完全不改变 vLLM 原生接口与用户使用习惯的前提下，实现Qwen3.6-35B-A3B的多芯片推理部署。

高性能通用大模型算子库FlagGems，核心算子深度适配，释放硬件算力。

统一的AI 编译器 FlagTree，实现一次编写，多芯编译。

模型跨芯迁移发布工具 FlagRelease：半自动实现模型跨芯迁移与版本发布。

目前，FlagOS已经完成针对Qwen3.6-35B-A3B开源模型的多芯适配、精度对齐与部署验证，开发者可直接获取对应芯片的开箱即用方案。

依托“自研GPU硬件+MXMACA软件栈”的软硬一体核心优势，沐曦股份快速响应大模型迭代节奏，高效完成了多款主流模型的适配工作。近一段时间来，公司已累计完成Day 0适配模型超16个，全面覆盖MiniMax、智谱、阿里千问、阶跃星辰、百度飞桨等头部厂商的最新旗舰模型，涵盖语言、多模态、OCR等全品类，在国产GPU Day 0适配赛道持续保持行业领先地位，以全栈技术实力为大模型快速落地筑牢算力支撑。

沐曦股份未来将继续与FlagOS深度合作，以Day 0适配为标准，实现大模型“发布即落地”，共同打造从底层算力到上层应用的无缝衔接生态，加速AI技术在千行百业的规模化部署，共建自主可控的智能计算新底座。

双方合作的模型适配版本链接见下，欢迎体验！

魔搭平台:

https://modelscope.cn/models/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS

HuggingFace:

https://huggingface.co/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS

内容检索

企业新闻

新闻中心

沐曦股份Day0适配阿里千问Qwen3.6-35B-A3B，与FlagOS合作实现模型多芯部署

双方合作的模型适配版本链接见下，欢迎体验！

相关新闻