News
时间:2026-04-23
4月23日,腾讯混元团队正式发布并开源Hy3 preview语言模型。沐曦股份旗下曦云 C 系列 GPU已完成Day 0适配,为率先支持该模型的国产算力。
此次针对Hy3 preview的极速适配,核心依托于沐曦自研MXMACA 软件栈的卓越兼容性与深度优化能力。作为沐曦 “自主 GPGPU 硬件 + 全栈软件体系” 的核心枢纽,MXMACA软件栈承担着连接底层算力硬件与上层 AI 应用生态的关键纽带作用。它不仅全链路覆盖底层驱动、用户态接口、MXCC 编译器、算子深度适配、主流训练 / 推理框架对接及行业场景专项优化,已实现对6000+ 国际主流应用、1000+ AI 模型的原生兼容,可将传统模型适配周期从数周压缩至小时级,为沐曦国产GPU快速落地、算力赋能千行百业打下了坚实基础。
截至目前,沐曦股份已经极速适配业内顶尖模型达18个,全面覆盖 MiniMax、智谱、阿里千问 、阶跃星辰、百度等头部厂商最新旗舰模型,品类涵盖语言、多模态、OCR、文生图、3D 生成等全领域。在国产 GPU Day 0 适配赛道,沐曦股份持续领跑行业,以 “硬件算力 + 软件生态” 的全栈技术实力,为国产大模型快速迭代与商业化落地筑牢坚实的算力底座。
未来,沐曦股份将持续深化与国内顶尖 AI 团队的技术协同,依托沐曦自研高性能GPU 与 MXMACA 软件栈的软硬协同优势,加速覆盖更多前沿大模型与创新应用场景,全力构建自主可控、高效繁荣的国产 AI 算力生态。
Hy3 preview 语言模型是一个快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。
多个测评结果显示,Hy3 preview 模型能力全面提升。
在各种真实的生产与生活场景,理解杂乱冗长的上下文并遵从复杂多变的规则是模型的首要挑战。基于腾讯业务场景的灵感,腾讯混元提出了 CL-bench和 CL-bench-Life 来创新性地评估模型的上下文学习能力,并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。
复杂推理能力是模型解决各种问题的基础。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春) 和 全国中学生生物学联赛(CHSBO 2025) 中取得优异成绩,展现了可泛化的强推理能力。
代码和智能体是 Hy3 preview 提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。
除了公开榜单,腾讯混元还进一步构建了多个内部的评测集,对模型在真实开发场景中的表现进行评估。结果表明,无论是在后端工程任务集 Hy-Backend,贴近真实用户开发交互的 Hy-Vibe Bench,还是高难度软件工程开发任务集 Hy-SWE Max 上,Hy3 preview 均体现出了强竞争力。
比较各个开源模型的大小与智能体综合表现,Hy3 preview 展现出高性价比。
Hy3 preview访问:
目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。
开发者可访问以下链接体验:
沐曦开发者社区:developer.metax-tech.com
沐曦量化模型镜像下载(即将上线):
www.modelscope.cn/organization/metax-tech