代理服务器对外占ip
过去一两年,很多客户扎堆上了一批算力中心,或者给自己机房恶补了GPU服务器,但实际上这波建设有点仓促,搞得良莠不齐。
尤其当客户真正开始上业务的时候,就发现搞智算不能只看纸面算力,要搞完整的算力底座,各方面都没有短板才行。
说白了,经过一段时间的螃蟹试吃,甲方都成了专家,需求更加明确,他们知道了自己想要的是什么,什么样的螃蟹才好吃↓
01、可进化,不落伍“买来即过时、部署即落后”的方案,坚决不能上。02、够开放,不锁定架构开发,兼容不同的硬件和软件生态。03、高效率,软硬协同提供内生AI能力,软硬件协同,训练推理效率最大化。04、低能耗,绿色节能智算中心的尽头是电力,绿色节能降低运营成本。05、无短板,四位一体需要算、存、网、调度四位一体,大模型训推才无短板。
张成听完这些需求,脑瓜子嗡嗡的,愣了半晌问:孙哥,这么难伺候的甲方你靠啥搞定?!这优质算力底座谁有?
现在,新华三已经实现了智算底座全面进化:技术进化、产品进化、能力进化,正好切合客户这波需求。
首先,在计算层面,新华三发布了面向AGI的可进化架构,简单讲就是智算节点全部采用模块化解耦设计。
以新华三新一代智算旗舰UniServer R5500 G7为例,整机可以拆分为GPU、CPU、存储、电源、散热五大子系统。
与上一代相比,R5500 G7显存容量提升200%,GPU互联带宽提升100%,大模型训练性能提升366%,支持15+种大模型无缝迁移,组成算力集群,可以轻松支持万亿级参数大模型训练。
由于R5500采用了可进化架构,每个系统都可以单独演进、按需配置、随需升级,最大化提升节点的可进化能力,生命周期更长。
可进化架构有个很重要的前提,那就是要有足够的开放性,太封闭搞锁定的系统再牛,客户也会心存顾虑。
目前,新华三服务器已适配兼容70余款AI加速卡,并已与15家国内外主流AI厂商进行深入合作,共同推动OAI标准和开放生态的建设。
我们还拿具体服务器来举例,这台新华三UniServer R4900 G7,听说刷新了业界通用服务器的新标准,是业界唯一支持6张双宽GPU的2U服务器。
新华三设计了一系列黑科技,从传感监测、风扇提效、风道设计、热管传热等多个维度入手,让这台服务器性能爆表、温度不爆表,完美解决高功耗挑战。
在此基础之上,新华三提供更加多元化的算力体系,UniServer系列产品覆盖智能计算、通用计算、高性能计算、弹性计算、边缘计算…
为此,新华三发布了数据中心操作系统——磐宁NingOS,融合了新华三20+年技术积累,与海量现网设备适配,高可靠、强性能、易维护。
在OS之上,新华三又全新升级了智能管理平台,提供从智能部署、智能调优、智能节能,到智能诊断、智能退役的一站式全生命周期管理。
在存储层面,新华三发布基于傲擎平台的下一代分布式存储Polaris X20000,目的性极其明确,就是奔着大模型来的。
比如代理服务器对外占ip,对大小IO的写入路径进行智能优化,通过内存0拷贝来精简无效IO,采用高性能并行客户端,让所有节点实现IO级负载均衡。
同时,提供统一的底层数据池和元数据池,实现语义无损的协议融合,一套系统支持全量数据类型(块、文件、对象、HDFS)。
并且在架构上全面进化,实现全活机制,故障秒级切换,并支持多租户数据与资源隔离,多级QoS调控。
同时,一套系统支持全流程智算应用,数据准备、模型开发、模型调优、模型推理,数据无缝流转,管理复杂度骤降、体验飙升。
千亿级文本大模型项目,Checkpoint加载速度提升50%;基因测序项目,比对周期缩短57%;自动驾驶系统,大幅缩短研发周期,从平均28个月缩短至13个月。
不同品牌GPU、CPU、NPU,不同的工作负载需求(通算、智算、高算),不同物理位置的机房……
但现在不一样了,新华三推出了傲飞异构算力调度平台,目的就是要实现多维度算力设施整合,异构算力协同,并且更加智能、动态地调度资源,提升算力利用率。
傲飞平台支持上百种CPU、GPU、NPU的异构算力融合,打通智算、通算、高性能计算,满足各种算力整合需求。
怎么样,凭借算、网、存、调度等领域的系列创新,新华三完成了智算底座的重塑,技术、产品、能力全面进化。