高性能计算如何助力中国材料基因组计划?

计算
高性能计算如何助力中国材料基因组计划?
麻省理工科技评论 2020-06-30

2020-06-30

新的科学革命正在发酵。
科学 人工智能
新的科学革命正在发酵。

在材料科学研究领域,传统的研究手段往往遵循“试错” 的思路,从提出假设到实验验证以获取目标材料。这其中存在的效率问题愈发凸显,一种新材料从研发到应用需要10-20年,已无法满足工业快速发展对新材料的需求。

为了缩短上述的研发周期和降低研发成本,材料基因组计划得以推出。根据白宫科技政策办公室在2011年6月24日发布的相应的白皮书《具有全球竞争力的材料基因组计划》,阐述了材料创新基础设施的三个平台: 计算工具平台、实验工具平台和数字化数据(数据库及信息学)平台。可以理解为,材料基因组计划将有计算工具、实验手段和数字化数据三大部分。

而数字化的、结构化的数据,可谓整个材料基因组计划的最基本“养分”。

在国内,来自中科院的一支团队正在尝试让材料研究中的海量数据得到更多沉淀和应用。

中科院物理所刘淼参与的团队正在为材料基因平台搭建新的超算中心,以进行和材料数据相关工作。他介绍道,这是一个比较新兴的方向,但也是大势所趋,相关的领域在国际上已经有很多同行和先驱者在布局。据了解,该中心将与英特尔、戴尔共建。

刘淼进一步介绍到:“用超算做材料计算时,其实是和我们运算的体系、方法以及软件的一些行为都是相关的。对于不同的运算方法,对超算的需求是有不同的。我们现在用的设备比较通用的,也就是使用了X86的CPU,这是业界最通用的,而且底层用到的这些数学函数库、并行方案、网络之间的连接都是业界比较通用的。也就是说,尽最大可能的满足各种科学计算对软硬件的需求,这是最通用的一个方案”。

目前,系统的部署情况是中小型集群,与英特尔、戴尔合作的系统有160个计算节点,接近2PB的存储,现有GPU节点一个。不过,特别的是,团队还配套了一个数据处理中心,和传统的高性能计算(HPC)架构仍有不同方法,即它会有一个小型私有云空间,其中会使用到业界用得比较多的方案,比如VMware以及比较高端的存储设施。

另外,科学计算还涉及到科学数据本身所带来的复杂存储问题。

在这一点上,戴尔科技集团高性能计算实验室主任凌巍才解读到,科学数据要有多种文件格式的存储、访问、处理,这种情况下就会存在另外一种专门针对这种应用场景的称之为ISILON存储的方法。这是一种分布式的NAS系统。因为数据是随着时间的推移,价值也在不断变化,就可以把它归档到一个不经常读写访问存储层面,对应的是ECS的存储解决方案。如果说数据量很多,其中还涉及一部分非常重要的数据,DP产品则可以把其存储备份起来。

“我们和用户接触的时候,感觉到用户不仅是在做一套HPC,而是涉及材料基因库的整个处理流程,并能通过一个网站来进行访问。在整个流程当中,戴尔的存储方案也有用武之地。整个产品线的全面性,包括在单一产品的性能上,我们都是非常领先的”,他说。

最后,科学界对于超算技术未来发展的趋势也有着自己的判断。

对此,刘淼提到:“ 我们当然希望算力越多越好,超算是一个工具,如果说往更广的范围去讲,现在很多数理学科在做的科研领域,其实核心的推动都还是工具的进步。例如冷冻电镜、扫描隧道显微镜。不少进展其实是基于工具变得更加高级,它的探测范围、灵敏度更高了。

超算也是一样,当我们的算力到达一定程度时,比如说以前做计算时需要很多台节点并行成一台计算机来用。但是现在单台的算力提高了之后,经常只是在一台设备里就可以做独立运算就可以,这样的话,如果说有很多台设备,设备之间的通讯成本会降低一些。这是IT信息业进步带来很大的好处。

还有一个特别大的好处就是存储的发展,我们发现存储的摩尔定律并没有减缓的意思。此前做数据的大量运算时,其实我们很担心数据没有存储空间,我们有一个初步的估算,如果说每天算1000个密度泛函理论这样的材料计算的作业任务时,大概会产生1TB的数据,所以这个数据量还是很大的”。

麻省理工科技评论

From Tech to Deeptech