#AI分享# AI for Science时代,如何发展人工智能新基建?

人工智能
后台-插件-广告管理-内容页头部广告(手机)

科学智能AISI 科学智能AISI 2022-09-15 18:00 发表于北京

#AI分享# AI for Science时代,如何发展人工智能新基建?

8月10日下午,科学智能峰会邀请到了阿里云、亚马逊云、华为云、字节跳动、百度云、并行科技、英伟达、海光信息和英特尔等国内外云计算软硬件领域的专家学者开展了“AI for Science”主题下的基础设施建设分论坛讨论,各领域专家就如何建设新科学计算形态下的基础设施进行了交流。

行业发展背景

2020年,国家发改委明确新基建内容,共包括三方面:信息基础设施;深度应用技术、支撑传统基础设施转型升级,进而形成的融合基础设施;支撑科学研究、技术开发、产品研制的具有公益属性的创新基础设施,分别从技术、应用、产业化角度阐明了新基建重点。其中云计算被列入新技术基础设施,数据中心、智能计算中心被列入算力基础设施。

云计算的上游供应商主要为IDC企业,以及服务器厂商、网络运营商和网络设备厂商等基础设备提供商;中上游主要由数据中心组成,行业壁垒高,集中度较高;中游即为云生态,包括基础平台和云原生应用等,云计算厂商负责提供IaaS、PaaS和SaaS等服务;下游即各行业的用户。

当前随着AI for Science发展方向愈发受到业界的重视,越来越多的中上游供应商面向科学计算需求推出了各类有针对性的解决方案。

AI for Science的计算特点

当前AI for Science存在数据驱动、物理驱动以及“物理+数据”融合三种主要计算模式。

蛋白质结构预测 Alphafold2 是数据驱动模式的代表,通过对输入的模型数据进行自监督训练,训练得到的神经网络可以预测蛋白质结构的三维坐标。数据驱动模式的计算过程对于大数据处理、分布式训练、混合精度训练等极致算力挖掘能力都有着较高的要求。

物理驱动(Physics-Informed Neural Networks)是将物理方程引入到神经网络的损失函数中使其参与网络训练,从而使得学习的结果满足物理规律,典型代表为DeepMD方法。通过利用第一性原理软件在小体系下生成训练数据,利用训练数据进行神经网络训练,训练完成的神经网络可在大体系下进行分子动力学模拟。计算过程对于异构计算集群的混同调度能力、并行计算能力、双精度浮点计算能力等要求较高。

“物理+数据”的深度融合,这个领域的主要挑战有很多,比如“数据同化”、“观测和模型的同步学习”、“强化学习”和“理性实验设计”等。这里的挑战更像是一个系统化的工程——每一个场景可能都需要一个庞大的团队来完成。当然这也意味着巨大的空间和机会。

针对AI for Science计算特点提出的解决方案

芯片层面

英伟达公司采用台积电4纳米工艺制造,于2021年推出了基于Hopper架构的H100GPU,通过Transformer引擎推进Tensor Core技术的发展,旨在加速AI模型训练。Hopper Tensor Core能够应用混合的FP8和FP16精度,以大幅加速Transformer模型的AI计算。与上一代相比,Hopper还将TF32、FP64、FP16和INT8精度的每秒浮点运算提高了3倍。

深势科技DPTechnology

国产海光芯片致力于为云计算提供高性能、稳定的国产全精度算力,支持高性能科学计算和AI for Science等多种场景。海光目前已推出了深算一号和深算二号,深算三号和深算四号分别计划在2023年和2024年推出,逐步拉近和国外芯片厂商的差距。海光目前已在全国的数据中心部署了超过20万枚芯片,支撑了包括天文、海洋模式、药物筛选等众多超大规模、战略性科学计算、工程仿真应用,实现了较广的行业覆盖。

深势科技DPTechnology

英特尔公司以经英特尔至强CPU优化过的AlphaFold2为例,向大家说明了在AI for Science新计算形态下,应用程序的复杂度在不断上升。在AlphaFold2的计算过程中,不同环节计算特点差异性非常大。而通过使用算法与硬件的协同优化,英特尔最终使计算性能获得了大幅提高。

深势科技DPTechnology

机器学习架构与生态建设层面

华为打造了昇思MindSpore科学计算整体架构,包含了业界领先的数据集、基础模型、预置高精度模型和前后处理工具,具备覆盖药物研发主要流程的计算生物套件、商飞翼型及机身组合体启动设计仿真解决方案的计算流体套件和米级大尺度阵列天线电磁仿真的计算电磁套件。

深势科技DPTechnology

百度飞桨推出AI for science共创计划,提供广泛适配异构硬件、深度融合优化的算力、端到端核心功能支持的框架以及丰富的算法和开发接口,与企业、高校、科研院所等伙伴携手共同建设基于飞桨的AI for Science领域顶尖开源项目,打造活跃的、前瞻性的AI for Science开源社区,建立产学研闭环,推动科研创新与产业赋能。

深势科技DPTechnology

计算平台建设方面

阿里云构建了PAI机器学习平台。这是面向开发者和企业的深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI全链路开发服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

深势科技DPTechnology

字节跳动火山引擎提出了云原生+HPC超融合架构设计,针对新计算形态下峰值算力需求高的特点,把算力和存储规模化调度,在满足业务常规算力需求的同时,合理分配算力资源,满足新计算形态的业务高峰需求,支持运行超大规模的分布式任务,包含多种预置算法框架和自定义算法框架,提供稳定、灵活、高性能的机器学习训练环境和高性价比的预付费资源组,提升整体资源利用率。

深势科技DPTechnology

亚马逊云提供Amazon SageMaker解决方案,可为每位开发人员和数据科学家提供快速构建、训练和部署机器学习模型的能力。SageMaker消除了机器学习过程中每个步骤的繁重工作,让使用者能够更轻松地开发高质量模型。SageMaker在单个工具集中提供了用于机器学习的所有组件,让使用者能够以更低的成本、更轻松地在更短的时间内将模型投入生产,从而解决了这一挑战。

深势科技DPTechnology

并行科技提出了国产工业软件测试验证推广服务一体化平台。用户可以在一个平台上实现计算软件部署、应用特征分析与优化、应用服务推广等全生命周期功能。目前已经在生物医药、石油勘探等场景获得了验证。

深势科技DPTechnology

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。