全球人工智能迎来新一轮超级竞争!联想发布两款AI服务器 助力飞跃

人工智能
后台-插件-广告管理-内容页头部广告(手机)

全球AI产业开启新的超级竞争,算力需求暴涨

今年,AI大模型成为全球AI产业的新热点,特别是大模型代表ChatGPT的爆红,备受瞩目。ChatGPT不仅写论文、写代码等能力让人吃惊,而且发布短短两个月内就拿下了活跃用户1亿的成绩,成为历史上增长最快的消费者应用程序,引发业内关注。

同时,ChatGPT所代表的AI大模型也成为各国重点投入的焦点。据悉,AI大模型被称为“超级大脑”,是通向强人工智能的重要方向之一,也是AI产业的新高地,为此,世界主要国家纷纷加大力度,投入AI大模型,抢占这一产业制高点。

全球人工智能迎来新一轮超级竞争!联想发布两款AI服务器 助力飞跃

例如,日本于今年4月发布了有关信息通信政策的报告草案,致力于建设反映日本文化的人工智能(AI)基础模型;英国也于今年4月向负责构建英国版人工智能(AI)基础模型的团队提供1亿英镑(约合8.6亿元人民币)起始资金,以助英国加速发展人工智能技术,这些人工智能的基础模型包括类似ChatGPT的大语言模型......

值得关注的是,在全球对AI大模型热度持续上涨的同时,AI产业发展所需要的算力需求也水涨船高。据数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。

对此,我国正在积极推进算力产业发展,争取抢占AI产业发展的制高点。日前,中国算力产业的高端会议——2023中国算力大会在宁夏银川隆重召开,据大会发布的数据显示,截至目前,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到每秒1.97万亿亿次浮点运算(197EFLOPS),位居全球第二,服务器、计算机、智能手机等计算类产品产量全球第一。

此次大会上,国内众多领先科技企业也带来一系列重大技术成果。如,作为中国领先的智能IT基础设施提供商,联想在此次大会上带来了AI服务器领域的重大新品发布,助力AI产业实现进一步发展。

在算力领域,联想一直处于领先地位。据IDC数据显示,联想集团是2022增长最快的AI硬件基础设施(服务器和存储)提供商,同比增长139%,全球排名第三。

联想重磅发布两款全新AI服务器,引领AI产业发展

在“智算无限 全栈智能 联想AI算力战略暨AI服务器新品发布会”上,联想发布全新的AI算力战略,从“AI赋智 绿色赋能”两大特征出发,通过领先的AI技术和绿色算力技术,覆盖全域应用,打造全面的AI导向基础设施。

其中,在AI赋智方面,联想提出将100%算力基础设施产品支持AI,50%基础设施研发投入在AI领域,全面AI技术覆盖全域AI应用。在绿色赋能方面,联想提出全面布局和引领液冷技术,打造液冷技术和液冷集群方案灯塔,持续创新引领未来技术。

联想重磅发布了两款全新AI服务器产品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。这两款服务器是基于AI导向打造的全新产品,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。

联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器。当前,AI算力已成为企业训练开发使用人工智能的硬门槛,而联想问天WA7780 G3 AI大模型训练服务器正是为打破AI算力供给困境而来,为训练提供强劲的算力支撑。

全球人工智能迎来新一轮超级竞争!联想发布两款AI服务器 助力飞跃

在性能方面,联想问天WA7780 G3 AI大模型训练服务器基于领先的可扩展处理器。系统配备8颗高效的 GPU,拥有高达640GB的HBM3高速显存,通过GPU间互联带宽高达400GB/s。将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。并且GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。

在快速低延迟互联方面,联想问天WA7780 G3 AI大模型训练服务器, 为了满足AI超大模型训练场景下,GPU服务器间高速数据通信的需求,可支持IB、RoCE等多种对外网络连接方案。最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。

同时,在本地存储的设计上,还采用了GPU Direct Storage (GDS) 技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。

在节能高效方面,联想问天WA7780 G3 AI大模型训练服务器在产品设计中采用了三重独立风道设计,针对不同部件的散热特征,进行了系统性的优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天WA7780 G3 AI大模型训练服务器功耗降低约10%。同时,为了满足未来智算中心对PUE值更低的要求,本产品还预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在AI大模型训练过程中,因系统散热带来的额外能耗,PUE值有望低于1.1。

而本次发布会一同亮相的联想问天WA5480 G3 AI训推一体服务器则是一款4U机架式AI服务器,支持多元的算力和丰富的生态,能够为AI模型的训练推理提供极致可靠的算力,加速人工智能在千行百业的落地,从而推动各行业乃至整个社会的智能化变革进程。

全球人工智能迎来新一轮超级竞争!联想发布两款AI服务器 助力飞跃

在性能方面,联想问天WA5480 G3 AI训推一体服务器采用2颗领先的可扩展处理器,支持最新PCIe 5.0。并通过PCIe扩展,最多可以支持10张包括最新的GPU在内的多类型、多品牌AI加速卡。可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景,为AI的多样场景提供多元算力。

在灵活拓扑方面,联想问天WA5480 G3 AI训推一体服务器在CPU-GPU互联的硬件设计上也充分体现了灵活多变的设计理念。联想问天WA5480 G3 AI训推一体服务器基于不同AI工作负载,可以为客户提供包括直通、Balance、Common多种CPU-GPU互联方式,避免了因为CPU-GPU数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。结合不同种类,不同数量的加速卡选择,真正实现了对AI各种复杂场景的完美匹配。

在极致可靠方面,充分考虑设计冗余,确保无间断运行。联想问天WA5480 G3 AI训推一体服务器充分考虑了设计冗余,为AI算力提供了安全稳定的运行环境。支持电源N+N冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器24小时在线运行。支持CPU、GPU、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇N+1冗余等多种安全设计保障高环温无间断运行。

此外,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器作为“联想问天”品牌家族重要的组成部分,不仅传承了联想服务器高性能、高可靠、高扩展、低功耗“三高一低”的特性,还具备“本地创新、敏捷高效”的品牌内涵。

未来,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器将与联想其它AI基础设施产品组合多向赋能,助力AI算力覆盖AI全域应用。同时,配合联想领先的液冷技术,联想AI导向的算力基础设施,将持续助力AI算力绿色赋能,为普慧算力铸造牢固的“基石”。

全球人工智能迎来新一轮超级竞争!联想发布两款AI服务器 助力飞跃

当前,在全球各国的持续推动下,AI大模型正迎来蓬勃发展。未来,作为中国领先的智能IT基础设施提供商,联想也将依托新IT技术,引领算力赋能千行百业,助力中国AI产业实现新高!

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。