华为推出全球至快AI训练集群Atlas 900

当前位置: 西莪信息门户网 > 财经 > 华为推出全球至快AI训练集群Atlas 900

2019-10-27 16:26:44
人气:151

特殊科目

中国[上海,2019年9月18日]在第四届华为互联2019(华为互联大会)上,华为首次发布了其计算战略,其基础是架构创新、对全场景处理器家族的投资、无为而治的商业战略以及构建开放的布局生态。与此同时,华为发布了全球快速人工智能培训集群atlas 900,以加快科研和业务创新的智能化进程。

华为首次发布计算战略

计算是人类认知世界的一种方式。从大型机到个人电脑,从智能手机到可穿戴设备,计算能力日益成为人类能力的延伸。

华为副董事长胡侯坤表示,“我们面临着一个2万亿美元的计算行业。华为坚定致力于计算行业,并将通过架构创新、全场景处理器投资、坚持一事无成的商业战略以及构建开放生态来制定战略。”

首先,结构创新。投资基础研究,推出达芬奇架构,并使用创新的处理器架构来匹配计算能力的增长率。

其次,投资全场景处理器系列。包括通用计算昆鹏系列、人工智能计算瑞星系列、智能终端麒麟系列、智能屏幕洪湖系列。

第三,做事不做的商业策略。华为不直接向外界销售处理器。它侧重于面向客户的云服务和面向合作伙伴的组件。它优先支持合作伙伴开发完整的机器。

第四,建立开放的生态环境。在未来五年,我们将继续投资15亿美元,汇集500万开发人员,使全球合作伙伴能够开发应用程序和解决方案。

阿特拉斯900创下新纪录

据了解,atlas 900 ai集群主要为大数据集神经网络训练提供超强计算能力,可广泛应用于科研和商业创新。它使研究人员能够更快地训练图像、视频和声音等人工智能模型,并使人类能够更有效地探索宇宙的奥秘、预测天气、勘探石油和加速自动驾驶的商业过程。

Atlas 900 ai cluster还可以提供云服务,以云的方式提供丰富而经济的计算能力资源,以及具有简单易用、高效率和全过程的ai平台,从而为客户提供“易于访问、经济实惠和方便”的通用ai计算能力和极致体验。为了让各行各业都能获得超级计算能力,华为在云中部署了atlas 900,推出了华为云ei集群服务,并以极其优惠的价格向世界各地的科研机构和大学开放,供即时应用。

“对于计算行业来说,这是一个伟大导航的新时代。我们希望千帆能够参与竞争,而不是独自前进。我们期待与各界合作伙伴一起抓住历史机遇,创造新的智力水平。”胡侯坤终于强调了。

atlas 900

代表当今全球计算先锋

用于大型数据集训练的神经网络体系结构涵盖图像识别、自然语言处理、视频实时分析和智能推荐系统等各个方面。训练这些神经网络模型需要大量浮点计算能力。这次发布的atlas 900人工智能训练集群由成千上万个相互连接的910人工智能处理器组成。它是目前世界上最快的人工智能训练集群,代表了当今世界上最先进的计算能力水平。最后,其功率达到256p ~ 1024 pflops @ fp16,相当于50万台计算机的计算能力。主要亮点如下:

人工智能计算行业领先

Atlas 900 ai训练集群使用业界正在崛起的910 ai处理器,具有单芯片计算能力。每款910 ai处理器内置32个达芬奇ai内核,单芯片提供两倍于行业的计算能力(256tflops @ fp16)。阿特拉斯900人工智能培训集群将数千个正在崛起的910人工智能处理器相互连接,以构建行业领先的计算集群。

织家集群网络

阿特拉斯900 ai训练集群采用“hccs、pcie 4.0和100g以太网”三种高速互联模式。100 tb全互联无阻塞专用参数同步网络将网络延迟和梯度同步延迟降低10-70%。专门创建的无工智能无损交换算法对集群中的网络流量进行实时学习和训练,实现网络零丢包和e2e μs级延迟。

系统级调谐

阿特拉斯900 ai培训集群通过华为的集体通信库和作业调度平台集成了hccs、pcie 4.0和100g roce,充分释放了正在崛起的910 ai处理器的强大性能。

华为的集体通信库提供培训网络所需的分布式并行库。通信库的网络拓扑训练算法进行系统级优化,实现集群线性度> 80%,大大提高作业调度效率。

极端散热系统

传统数据中心大多使用空气冷却技术来散热,但在人工智能时代,传统数据中心面临着巨大的挑战。cpu和ai芯片等高功耗设备带来更大的热岛效应,需要更有效的冷却方法。液冷技术可以满足数据中心对高功率、高密度部署和低pue的超高要求。

此外,在节省空间方面,与8kw风冷式机柜相比,节省了79%的房间空间。极端液冷技术满足高功率、高密度设备部署和低pue的要求,大大降低了客户的总体拥有成本。

1024瑞星910 ai处理器

华为在华为云上部署了atlas 900人工智能培训集群,集群规模为1024个,增加了910个人工智能处理器。基于当前典型的resnet-50 v1.5模型和imagenet-1k数据集,atlas 900ai训练集群只需59.8秒即可完成训练,居世界第一。

“imagenet-1k数据集”包含128万张图片,准确率为75.9%。在同样的精度下,业内其他两家主要制造商的测试结果分别为70.2秒和76.8秒。atlas 900 ai训练集群比竞争对手快15%。