“如今的IT产业,每个层次都有人在做着各种各样的创新和尝试,而这种创新和尝试又往往会突破原来的边界前十证券公司,带给我们新感受”,在谈到世界人工智能大会(WAIC)感受的时候,新华三集团高级副总裁、云与计算存储产品线总裁徐润安如是说。
这也是许多参会者的共同心声。得益于大模型带来的AI热潮,本次世界人工智能大会空前火爆,甚至到了一票难求的程度,而各大参展商们也使出了浑身解数,随处可见的机器人、机器狗等无人设备展示,让观众目不暇接的同时,也意味着我们快步进入了算力互联的新时代,传统计算架构已逐渐无法满足日益复杂的计算任务,由此也对后端的解决方案能力提出了更高要求。
为此在本次WAIC大会上,新华三集团以“算力×联接”为技术基石,重磅发布了全新H3C UniPoD系列超节点产品,成为业界为数不多可以提供超节点解决方案的厂商,为万亿级参数大模型训练及推理提供更强劲、更智能、更绿色的算力供给,从而加速AI技术在百行百业的效能释放。
超节点:突破算力与互联瓶颈的关键
正如我们前面提到的,大模型的广泛普及带来了算力需求的暴涨,而由GPU引领的异构计算与多元化算力应用不仅已经成为大势所趋,更为解决当前AI计算面临的挑战提供了全新的思路和解决方案。在本次WAIC大会上,我们看到了不少国内算力企业提供的解决方案,他们也与新华三有着广泛而深度的合作。
“多元算力的协同或融合,说明我们的算力结构在向集中式训练、边缘推理的架构进化,智算中心也从原来的简单粗放的堆算力,开始转向挤效率。为了适应更多的GPU,同时又达到相应的算力效率,所以我们会有更多形态的服务器形态产生”,徐润安介绍道。
这也解释了新华三推出H3C UniPoD超节点解决方案的初衷。当然正如主题“算力×联接”所显示的那样,仅有算力是很难实现超节点的,毕竟不同算力的协同、数据传输都需要强大的互联和网络系统作为支撑,而新华三在网络领域的深厚积累也奠定了技术基础,才能够开发出基于以太协议和PCIe协议的双技术路线超节点产品,打造万亿级参数大模型训推的强劲算力引擎。
在展区现场,我们也看到了H3C UniPoD超节点。它以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列。其中,H3C UniPoD S80000面向万亿级参数模型训推场景,实现了更高性能、更高密度、更高效率的三重进化;柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。这一性能提升,使得在处理大规模数据和复杂模型时,能够显著缩短训练时间,提高模型的训练效率和准确性。
互联是超节点的灵魂,也是解决传统计算架构传输瓶颈的关键——超节点通过内部高速总线互联等技术,有效支撑了并行计算任务,加速了GPU之间的参数交换和数据同步。比如 H3C UniPoD F80000创新的PCIe光互联技术就可以突破单机板内走线限制,实现最大64张AI加速卡的高速互联,实现模型训练性能提升35%以上。这种高速、稳定的互联能力,确保了在大规模计算任务中,各个计算节点能够高效协同工作,避免了因数据传输延迟而导致的计算资源浪费。
“怎么做到互联,其实不是GPU厂商把卡给我,我就做出来,而是在一开始,我们就和GPU厂商一起讨论,我们这个架构是不是与双方总体的思路匹配,如果是匹配的话,下一步怎么样设计整个体系架构”。徐润安这番话很好的解释了生态协同的重要价值,这也是新华三多年行业深耕的体现。
当然,超节点形态的推出更解决了一直困扰用户的交付难题,在破解“AI算力焦虑”的同时实现了一体化的交付和一站式的服务。尤其是对于超大规模的互联网用户或者是智算中心用户,超节点的应用模式都可以实现集约化的算力整合与应用搭载,让训推效率实现大幅度提升。
除了算力服务之外,未来的数据中心更看重能效比。随着算力的不断提升,数据中心的能耗和散热问题日益突出。包括北上广深在内的不少一线城市都推出了数据中心能耗管理的相关规定,而H3C UniPoD超节点作为算力“巨无霸”,更需要考虑能耗利用的可持续问题。
为此 ,新华三打造出液冷整机柜解决方案,实现了高达75% -80%的液冷散热占比。不仅如此,新华三的液冷技术还具有安装和维护简便的优势。其创新性地实现了水、电、网三总线“盲插”设计,操作人员只需将服务器节点平稳推入机柜指定位置,水路、电路和网络的连接即可自动、精准地一次完成。
在供电方面,新华三液冷整机柜采用池化的集中供电单元(Power Shelf)设计,内置的PSU支持N + 2冗余,兼容3.3kW和5.5kW双输入。这种集中供电设计在大幅降低传输损耗的同时,显著减少了传统分散式电源等辅助设备对机柜空间的占用,这样也就确保在计算任务高峰期,设备能够持续稳定运行,避免因供电不稳定而导致的计算中断或性能下降。
由此看来,H3C UniPoD超节点以算力芯片多元化、互联协议标准化、基础设施集成化等核心设计理念,改变了现有算力架构模式,更可以兼容国内外80多款GPU,体现了新华三在生态应用上的开放多元。
生态协同+行业赋能,新华三让AI应用实践变简单
“开放系统在某种程度上,最大的挑战就是大家的对齐,怎么才能在设计思路、设计理念上对齐,整个研发过程当中对齐,最后还有生产制造整体过程的对齐,这还是挺艰辛的。”很显然,超节点的研发并不容易,这背后凝聚了包括新华三在内多方面的共同努力,也正因为如此,才体现了生态协同与开放包容的重要性。
“我们非常乐意和这些厂商进行合作,我们还会把一些愿意与我们进一步合作的生态,放到我们一体机的设备里,然后直接推送到客户侧”。除了硬件层面的协同创新之外,在软件层面,新华三也与众多软件开发商合作,优化超节点产品与各类AI框架、应用程序的兼容性和性能表现。
同样在展区现场,我们也看到了新华三多元化的应用场景展示,其内容覆盖医疗、金融、交通、教育、政务等多个领域。例如,在医疗行业,新华三与清华长庚医院合作,基于其超节点平台和灵犀使能平台,快速构建了脑血管病专病模型。在金融行业,新华三的超节点产品能够为金融机构提供强大的算力支持,用于风险评估、客户信用分析等业务场景等等。
据权威数据分析机构IDC预测,到2029年全球机器人市场规模将超过4000亿美元,中国市场占据近半份额。显然,机器人产业的蓬勃发展离不开强大的算力支持,超节点在相关领域的应用将会更广泛,市场规模也将随之增长。
从算力到互联前十证券公司,从能耗到供电,H3C UniPoD超节点可谓是凝聚了新华三创新技术与应用的“集大成者”,也代表了未来数据中心与智算中心应用的全新方向。正如徐润安所说:“我们认为,超节点在数据中心或者AI工厂中,都会成为下一个刚需”。
恒运配资提示:文章来自网络,不代表本站观点。