叮当号9月26日消息,AI基准测试MLPERF发布了Storage V1.0 AI基准测试结果。
MLPERF由图灵奖得主大卫·帕特森联合谷歌、斯坦福、哈佛大学等顶尖企业和学术机构成立,是权威性最大、影响力最广的国际AI性能基准测试。
华为OceanStor A800全新AI存储在全球厂商中脱颖而出,总性能、每节点性能、每U性能均是全球第一。
本次存储性能测试共有业界主流的13家厂商参与,通过运行一个分布式训练测试程序,模拟GPU计算过程,最大程度还原AI服务器对存储系统的访问模型。
华为OceanStor A800,通过单台设备成功满足了255张GPU模拟训练的数据吞吐需求,GPU利用率保持90%以上,单框稳定带宽高达679 GB/s,是传统存储性能的10倍。
其平均每节点提供高达354GB/s带宽,每U提供高达85GB/s的带宽,分别是第二名2.88倍和1.44倍。
同时,可以通过OceanStor A800大规模横向扩展提供百TB级带宽,checkpoint读写时间从10分钟缩短至秒级,断点续训时间小于15分钟,极大减少GPU等待,端到端算力利用率提升30%+,全面提升大模型训练效率。
文章来自互联网,只做分享使用。发布者:叮当,转转请注明出处:https://www.dingdanghao.com/article/746953.html