News
时间:2026-03-31
国产算力硬核出击,开源生态共创未来!
沐曦股份作为飞桨黑客松第十期文心合作伙伴赛道核心出题方之一,携专属赛题「优化 PaddleOCR-VL-1.5+MetaX GPU」重磅来袭,邀全球开发者共探深度学习框架与国产GPU的软硬协同优化之道,用代码解锁智能文字识别的性能极限!
此前,沐曦股份与百度飞桨已达成深度合作,从联合举办AI4S材料研发技术沙龙、发布算力赋能计划,到完成MXMACA软件栈与飞桨的深度适配、实现文心大模型及PaddleOCR-VL在MetaX GPU上的稳定部署,双方始终以国产软硬件生态融合为核心,为科研与开发打造高效、自主可控的技术底座。
沐曦股份始终坚持推动软件生态开源共享,致力于围绕公司自研的MXMACA软件栈,打造一个开放、自主、全栈兼容的智能计算生态。自2025年2月14日,公司宣布MXMACA开源社区开放以来,截至2026年3月13日,MXMACA软件栈注册用户已超过30万人。
目前,MXMACA软件栈覆盖百度飞桨PaddlePaddle内的40多种AI框架,覆盖训练、推理、科学计算全场景,可大幅降低开发者的生态迁移成本。同时可支持500多款AI模型、4000多个开源项目软件兼容测试,实现全面覆盖、“即插即用”。
本次黑客松,沐曦股份再度携手飞桨,将实战性与技术深度拉满,以真实工业级优化场景为赛题,让开发者在实战中锤炼技术,为国产AI算力生态贡献核心力量!
PaddleOCR作为业界领先的智能文档解析与文字识别工具,支持多语言、手写体识别及PDF/图片等多格式处理,而本次赛题将基于PaddlePaddle + FastDeploy + Metax GPU 技术栈,实现PaddleOCR-VL-1.5的推理性能深度优化,让国产算力为智能识别插上「高速翅膀」!
FastDeploy源码:
https://github.com/PaddlePaddle/FastDeploy/tree/release/2.4
第一阶段:性能瓶颈深度剖析
提交profiling trace 文件+性能瓶颈分析评估报告,需覆盖推理框架调度、GPU利用率分析,并完成5个以上kernel函数的深度解析,精准定位性能优化关键点。
第二阶段:算子优化实战落地
沐曦股份技术团队将对第一阶段成果进行专业review并标注优化方向,开发者需针对确定的瓶颈点完成算子优化并提交PR,预期性能提升目标≥20%!
第一阶段/第二阶段优化成果均通过指定PR提交地址完成提交,具体见飞桨黑客松官方赛事页面。
为让开发者无后顾之忧专注技术攻坚,沐曦股份为所有报名本赛题的开发者提供每人300算力代金券专属福利,助力MetaX GPU上的开发、调试与验证!
1、完成百度飞桨黑客松-沐曦股份专属赛题[优化PaddleOCR-VL-1.5+MetaX GPU]报名;
2、注册并登录沐曦股份开发者社区;
3、在社区活动页面填写与百度飞桨黑客松报名一致的 GitHub ID,后台核验通过后将发放算力券。
若开发过程中需要更多算力资源,可将算力券诉求发送至邮箱:yang.yang2@metax-tech.com,沐曦股份将按需提供专属支持!
此外,完成进阶任务的开发者,可额外获赠《MXMACA C/C++ 程序设计高级教程》新书一册、200 算力代金券,并享有简历内推资格。
以代码为刃,以算力为基,期待各位开发者在实战中探索国产GPU与深度学习框架的协同极限!
如有任何问题可加入沐曦MXMACA开发者社群,我们会为您及时答疑与提供帮助。