近日,在江苏昆山举办的光合组织2025人工智能立异大年夜会(HAIC2025)上,中科曙光scaleX万卡超集群以真机情势初次公开表态。
这一基于scaleX640超节点体系构建的大年夜范围智能计算基本举措措施,不仅在硬件机能上取得重大年夜冲破,更基于“AI计算开放架构”体系性解决了当前国产AI算力生态“碎片化、封闭化、适配难”的核心问题,标记住中国AI基本举措措施扶植正式迈入“生态共进”的新阶段。
作为全球首个单机柜级640卡超节点,曙光scaleX640采取超高密度刀片架构与浸没相变液冷技巧,将单机柜算力密度晋升至传统集群的20倍,同时实现低至1.04的PUE值。由16个scaleX640超节点经由过程自研scaleFabric高速收集互连构成的scaleX万卡超集群,可安排10240块AI加快卡,总算力冲破5 EFlops。

为进一步打通数据流动瓶颈,曙光经由过程“超等地道”与AI数据加快等设计,实现存、算、传的深度紧耦合与协同优化,从芯片级、体系级到应用级构建三级数据传输优化体系,高效应对万卡并发带来的极致读写与挑衅挑衅,明显晋升高通量AI推理响应速度与成果精准度,并将AI加快卡的资本应用率进步55%。
在此硬件基本之上,曙光自研原生RDMA高速收集ScaleFabric,基于国内首款400G类InfiniBand架构网卡与交换芯片,可供给400Gb/s带宽和低于1微秒的端到端延迟,通信效力较传统IB晋升2.33倍,成本降低30%,不仅释放万卡级超集群算力潜力,更支撑集群范围轻松扩大至10万卡以上。
在高效算力与通信才能之外,曙光构建了超集群数字孪生与智能调剂体系,实现运维全流程可视化与智能化,保障集群高达99.99%的可用性;智能调剂引擎可高效治理万级节点、办事十万级用户,支撑每秒万级功课的高并发调剂,确保大年夜范围AI营业稳定高效运行。

发表评论 取消回复