News
时间:2026-05-29
5 月 29 日,阶跃星辰正式开源面向Agent 生产化阶段推出的新一代 Flash 模型Step 3.7 Flash。沐曦股份率先完成曦云 C 系列GPU Day 0 深度适配,以全栈自研算力底座,为国产 Agent 生态再添核心支撑,持续领跑国产大模型极速适配赛道。
作为国产训推一体 GPU 标杆,曦云 C 系列依托沐曦股份全栈自研MXMACA 软件栈,实现 Step 3.7 Flash 极速部署。MXMACA 软件栈原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架,支持 500+ AI 模型稳定运行,开源社区开发者规模近 50 万人,具备行业领先的模型迁移与底层加速能力。此次适配延续沐曦股份“模型发布即适配” 的 Day 0 极速响应传统,继 Step 3.5 Flash 后,再次实现阶跃星辰旗舰模型的首发适配,验证了 “自研 GPU 硬件 + MXMACA 软件栈” 软硬一体架构的核心优势。
在生态适配领域,沐曦股份已实现对阶跃星辰、智谱、阿里千问、MiniMax、百度文心等国内头部厂商 25 个主流模型的 Day 0 适配,覆盖语言、多模态、OCR、文生图、3D 生成等全品类,构建起 “模型发布 — 芯片适配 — 产业落地” 的高效闭环。
当前,Agent 技术正成为 AI 产业落地的核心方向,Step 3.7 Flash 的开源将进一步加速生产级 Agent 应用的普及。未来,沐曦股份将持续深化与国产大模型企业的协同创新,助力国产大模型技术突破与产业落地,共筑安全、高效、繁荣的国产 AI 算力生态。
Step 3.7 Flash不是单纯追求“更快”或“更便宜”的轻量模型,而是围绕 Agent、Coding、Search 与多模态工作流进行系统优化,在速度、成本、可靠执行和复杂任务完成能力之间力求取得更优平衡。多模、快速、好用、省心!
随着 Agent 从 Demo 走向真实生产环境,模型不只要回答问题,更要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮任务中持续保持执行轨迹。这对底层基础模型提出了完全不同的要求,同时,模型能力的关键指标正在发生变化。Step 3.7 Flash 正是为此而来。
面向生产级 Agent 优化的四大能力:
原生多模态理解与执行:原生理解 UI、图表、文档、图片和应用界面,将复杂视觉信息转化为结构化结果、代码生成和可执行任务。
联网与视觉搜索增强:强化联网检索与图像搜索,使模型在开放信息环境中跨文本与图像主动获取并交叉比对多源证据。
高可靠工具调用与编排:在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具和外部系统,保持任务轨迹一致,降低跑偏和执行失败。
Agent 生态兼容优化:针对主流 Agent 框架(Claude Code / KiloCode / RooCode / OpenCode / Hermes Agent / OpenClaw 等)、MCP/Skills 等工具调用协议和开发链路进行兼容优化,降低模型接入和工作流编排成本。
Flash 模型正在进入新的阶段。它不再只是大模型的“更快、更便宜替代品”,而是在 Agent 生产化阶段承担越来越关键的基础模型角色。
当 Agent 开始进入企业流程、开发流程、知识工作和自动化系统,模型需要同时满足多种要求:足够快、足够稳、足够便宜、足够可靠,也要足够容易被开发者集成和部署。
这也是 Step 3.7 Flash 的核心方向:不是只追求单点速度,而是提升真实任务完成效率;不是只服务单轮问答,而是服务多轮、工具化、上下文丰富、多模态的 Agent 工作流。
Model Page:
https://static.stepfun.com/blog/step-3.7-flash/
GitHub:
https://github.com/stepfun-ai/Step-3.7-Flash
Huggingface:
https://huggingface.co/stepfun-ai/Step-3.7-Flash
Modelscope:
https://modelscope.cn/models/stepfun-ai/Step-3.7-Flash
Studio平台在线体验:
studio.stepfun.com
沐曦开发者社区:
developer.metax-tech.com