降低每 Token 成本，攻坚国产推理生态｜沐曦两大赛题登陆 2026 揭榜挂帅擂台赛，诚邀青年共破局！新闻中心

企业新闻

News

新闻中心

降低每 Token 成本，攻坚国产推理生态｜沐曦两大赛题登陆 2026 揭榜挂帅擂台赛，诚邀青年共破局！

时间：2026-05-30

2026 年度中国青年科技创新「揭榜挂帅」擂台赛正式启幕。沐曦股份重磅发布两大 AI 算力硬核榜题，聚焦国产 GPU 大模型推理算子优化，依托硬核赛事搭建科研攻关平台，诚邀全国青年学子、科研人才揭榜攻坚，以技术重构推理效率，用创新拉低每 Token 算力成本！

两大重磅赛题直击推理成本核心痛点

当大模型走进规模化落地，每 Token 推理成本，早已成为制约产业商用、服务扩容、生态自主的核心瓶颈。延迟居高不下、显存占用臃肿、GPU 算力利用率偏低、长上下文推理开销暴涨…… 层层痛点之下，底层算子库性能、国产 GPU 软件栈适配、智能化优化范式，正是压降 Token 成本、夯实 AI 算力底座的关键突破口。

沐曦“揭榜挂帅”两大赛题正是从此发力——

赛题一：基于国产软件栈大模型推理前沿算子优化

当前主流大模型底层代码深度绑定海外生态，国产算力缺少自主可控的核心算子库，成为成本优化与产业安全的双重短板。

本赛题依托国产开源 TileLang语言 + 沐曦 MXMACA 全栈软件栈 + 曦云 C500 算力，聚焦三大业界前沿高价值算子攻坚：

Fused Moe Gemm：优化 MoE 模型稀疏计算，提升算力利用率
MLA（Multi-Head Latent Attention）：适配 DeepSeek V3，压缩 KV Cache 显存，破解长序列成本瓶颈
NSA（Native Sparse Attention）：实现超长文本推理加速，显存节省超 50%

初赛攻坚 Fused Moe Gemm、决赛冲刺 MLA/NSA，全程基于全国产技术栈开发优化，打造自主可控的低成本大模型推理算子底座。

赛题二：基于 AI Agent 开发范式的国产 GPU 大模型推理算子库优化

大模型推理高并发、长序列、高调用频次的特性，让 FlashInfer、FlashAttention、Fused MOE 等核心算子，直接决定吞吐、延迟与显存开销，左右每 Token 的综合成本。

本赛题打破传统人工调优模式，立足AI Agent 开发新范式，面向沐曦国产 GPU 及 MXMACA 软件栈，支持参赛团队构建 / 使用 AI Agent，完成算子迁移、代码理解、性能分析、Kernel 自动优化、Benchmark 迭代全流程。

从底层算子发力，提速推理、节省显存、拉高 GPU 利用率，从根源压缩每 Token 推理成本，筑牢国产算力基础设施底座。

参赛对象

面向全国全日制专科、本科、硕博在校生（非在职），40 周岁以下青年科技人才均可参与；

可个人 / 团队组队（团队≤10 人），跨专业、跨校、跨地域自由组队，最多 3 名指导老师带队。

丰厚赛事激励

现金奖金激励：擂主 10 万元、特等奖 2 万元、一等奖 1 万元、二等奖 0.5 万元、三等奖 0.2 万元

硬件福利加码：擂主直得 2 张沐曦高端 GPU 加速卡、特等奖专属 GPU 加速卡

成长专属权益：优秀获奖者直通“沐曦股份 & 之江实验室”联合培养计划、赛事官方荣誉证书

生态曝光扶持：优秀作品入驻”沐曦开发者社区 & 启悟学习社区”，成果孵化 + 产业落地全方位赋能

全程赛事保障助力全力攻坚

提供曦云 C500 在线算力资源券，无需自备硬件
线上专项技术培训 + 回放文档，零基础也能快速上手
沐曦股份资深技术专家社群常驻答疑，定期解惑攻关难题
官方提供技术文档、算子基线样例、标准测试集与评测脚本

关键时间节点

5月30日 - 6月30日：赛事报名
5月 - 9月：课题攻关
9月：初审
10月 - 11月：终审擂台赛

青年挺膺担当，科创筑梦算力！

加入沐曦股份“揭榜挂帅”赛题，深耕国产 GPU 算子优化，用技术降低每 Token 推理成本，共建自主可控 AI 算力新生态！

报名通道

登录挑战杯官网 https://2026.tiaozhanbei.net 揭榜挂帅入口报名。

赛事技术咨询、组队交流可加入官方答疑社群，深耕算子优化，共赴科创新程！

内容检索

企业新闻

新闻中心

降低每 Token 成本，攻坚国产推理生态｜沐曦两大赛题登陆 2026 揭榜挂帅擂台赛，诚邀青年共破局！

两大重磅赛题直击推理成本核心痛点

赛题一：基于国产软件栈大模型推理前沿算子优化

赛题二：基于 AI Agent 开发范式的国产 GPU 大模型推理算子库优化

参赛对象

丰厚赛事激励

全程赛事保障助力全力攻坚

关键时间节点

报名通道

相关新闻

内容检索

企业新闻

新闻中心

降低每 Token 成本，攻坚国产推理生态｜沐曦两大赛题登陆 2026 揭榜挂帅擂台赛，诚邀青年共破局！

两大重磅赛题 直击推理成本核心痛点

赛题一：基于国产软件栈大模型推理前沿算子优化

赛题二：基于 AI Agent 开发范式的国产 GPU 大模型推理算子库优化

参赛对象

丰厚赛事激励

全程赛事保障 助力全力攻坚

关键时间节点

报名通道

相关新闻

两大重磅赛题直击推理成本核心痛点

全程赛事保障助力全力攻坚