News

新闻中心

时间:2026-01-30

近日,腾讯混元团队宣布开源混元图像3.0图生图版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 24小时内完成适配,为国内首批适配该模型的国产算力


此次高效适配得益于沐曦自研MXMACA软件栈的良好兼容性和适配能力。作为沐曦“自主GPGPU硬件+全栈软件体系”的关键协同载体,MXMACA承担着连接硬件算力单元与上层应用生态的核心纽带作用,覆盖底层驱动用户态接口、编译器、算子适配、训练框架、推理框架行业场景优化等全链路能力,是支撑国产GPU生态落地与行业赋能的算力基座。


关于腾讯混元图像3.0图生图


混元图像3.0图生图支持多样化的图片编辑与多图融合能力,包括增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑功能,以及将多张照片中的元素提取出来合成新图片的能力。对于普通用户,该模型可用于制作表情包、虚拟人物合拍、社交分享等日常场景。对于专业用户,它能够助力电商海报设计、游戏角色定制、创意图片制作等专业领域,显著提升创作效率。


混元图像3.0图生图版本基于混元图像3.0的原生多模态架构构建,将文本理解、视觉理解与图像生成深度融合于同一模型中。作为原生多模态模型,混元图像3.0图生图核心创新在于其“先思考,后编辑”的工作流程。当接收到用户输入的图片和提示词后,模型会首先理解图像内容,然后基于提示词进行推理,确定需要编辑的区域、详细步骤以及需要保留的区域,最终形成更加详细的编辑指令。


混元图像3.0图生图基于80B总参数规模(激活参数约13B)的混合专家原生多模态架构,在处理图像编辑任务时展现出强大的推理能力和精准的编辑效果。训练过程中,混元团队构建了千万量级的图生图数据,覆盖80多个任务,并注入了思维链数据,使模型能够学会先分析用户图像和意图,再输出详细编辑指令。后训练阶段采用自研MixGRPO算法,高效对齐用户偏好,大幅提升了指令响应和非编辑区域保持一致的效果。


最新全球权威大模型竞技场LMArena的图像编辑(Image Edit)榜单中,混元图像3.0图生图进入第一梯队,成为全球最强的开源图生图模型。


在最新的LMArena图片编辑榜单上,腾讯混元图像3.0图生图位列全球第七,也是前七名里面唯一开源的模型。LMArena官方X祝贺混元图像3.0图生图“在图片编辑磅榜单中与Nano-Banana和Seedream-4.5等表现相当”。这一成绩来自于对模型图像编辑能力的全面盲测评估,包括指令遵循、编辑精确度和输出质量等多个维度。



近期,腾讯混元图像3.0图生图模型在元宝上线,用户只需要上传1张或以上的图片并输入指令即可体验。该能力受到众多用户喜爱。


网友在元宝上使用混元图生图能力,图片来自网络


附混元图像3.0图生图开源项目地址:


  • Github:

    https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
  • Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0-Instruct
  • Hugging Face(蒸馏版):https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil

  • 商务合作 Business@metax-tech.com
  • 投资者联系 ir@metax-tech.com