金策宝
据中科曙光(603019)(603019.SH)官微消息,近日,在2025 CCF全国高性能计算学术大会(HPC China 2025)上,中科曙光正式发布国内首个遵循行业标准的超智融合算力平台——Nebula 800。这一创新产品不仅填补了国内在超算与智算融合领域的空白金策宝,更因技术突破性荣获2025 CCF全国高性能计算学术大会技术创新奖。
随着人工智能技术在各行各业的深度渗透与泛化应用,AI产业的发展重心已从单一模型与算法的研发阶段,逐步过渡到聚焦实际应用场景落地效果的关键发展期。在这一进程中,行业实践逐渐揭示:通过在数据层、算法层与业务层实现传统高性能数值模拟方法与新兴大模型技术的深度融合应用,能够在业务运行效率、结果准确性及系统稳定性等核心维度获得综合最优解。这一融合路径在气象预报、新材料研发、生命科学探索、工业仿真等AI for Science(科学智能)创新业务场景中展现出尤为显著的价值。
面对新型业务形态的需求升级,过去超算平台与智算平台分立建设的模式已显露出明显局限,难以支撑融合计算场景的复杂需求。在此背景下,具备高精度算力与低精度算力融合能力,兼容主流技术生态与简单友好的应用开发环境,支持多类型计算任务协同调度,可承载各类业务全流程运行,同时满足超高性能需求的存、算、传、管协同设计,并兼顾绿色节能特性的新型超智融合算力平台,成为技术发展的必然趋势。
Nebula 800平台实现了三大融合:一是算力融合,支持双精度、单精度、半精度等多种计算模式。无论是需要极高精度的科学计算数值模拟,还是大规模AI模型训练,都能在同一平台上完成,“一芯多用”,避免资源浪费。
二是存算传管融合。“打开智能管理,我们的管理系统会自动学习每个应用的计算特征、IO特征,应用再次运行时,会自动根据应用的需求特点、数据分布和网络拓扑采用最佳调度策略,让计算靠近数据或将数据提前‘搬运’至即将使用它的计算节点,大幅减少等待时间。”中科曙光高性能计算产品事业部副总经理刘冠川举例说。
在管理融合方面:平台配备智能运维系统金策宝,能实时感知运行状态,实现故障秒级定位与自动修复。同时,一个统一的调度平台即可调度科学计算、AI训练、工业仿真等多种任务,告别“多平台、多系统”的繁琐管理。
配查网官网提示:文章来自网络,不代表本站观点。