腾讯发布超强算力集群HCC 性能提升3倍

  腾讯宣布发布面向大模型训练的新一代HCC高性能计算集群(申请内测地址:cloud.tencent.com/act/pro/hccpnv5),整体性能比过去提升了3倍。它搭载了NVIDIAH800TensorCoreGPU,能够提供高性能、高带宽、低延迟的智算能力支撑。

  腾讯云HCC采用最新一代星星海自研服务器,基于自研网络、存储架构带来3.2T超高互联带宽、TB级吞吐能力和千万级IOPS。

  计算层面,新一代集群的单GPU卡在不同精度下,支持输出最高1979TFlops的算力。针对大模型场景,星星海自研服务器采用6U超高密度设计,相较行业可支持的上架密度提高30%;利用并行计算理念,通过CPU和GPU节点的一体化设计,将单点算力性能提升至更高。

  网络层面,腾讯自研的星脉高性能计算网络,具备业界最高的3.2TRDMA通信带宽。实测结果显示,搭载同等数量的GPU,3.2T星脉网络相较1.6T网络,集群整体算力提升20%。

  存储层面,腾讯云自研的存储架构,具备TB级吞吐能力和千万级IOPS,支持不同场景下对存储的需求。COS+GooseFS对象存储方案和CFSTurbo高性能文件存储方案,充分满足大模型场景下高性能、大吞吐和海量存储要求。

  此外,新一代集群集成了腾讯云自研的TACO训练加速引擎,对网络协议、通信策略、AI框架、模型编译进行大量系统级优化,大幅节约训练调优和算力成本。

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫

上一篇:

下一篇:

猜你喜欢

联系我们

173-662-005

在线咨询: QQ交谈

邮件:woowuo@126.com

工作时间:周一至周五,10:30-18:30,节假日休息

关注微信
我已知晓并同意