随着日本8月底宣布下一代超算将在2021年问世,中国、美国、日本和欧洲在超算领域的竞争日趋白热化,各方角逐的新战场转移到运算速度达每秒百亿亿次的E级超算。为争夺“超算界的下一顶皇冠”,中国的E级超算研制计划已全面展开。近日,《环球时报》记者独家探访部署有“神威”E级超算原型机的国家超算济南中心,亲眼目睹下一代“国之重器”。

日本的E级超算研制则基于目前的超级计算机“京”。2016年,富士通和日本理化学研究所宣布为日本开发首台E级超算——“后京”,并计划在2020年部署。但不久后,该项目负责人石川裕博士承认,“后京”的部署可能会延迟。

早在2016年前后,中国已经启动E级超算的研发计划,同时开始3种技术路径的探索:国家超算天津中心同国防科技大学联合研制的“天河三号”E级超算原型机已于7月22日在天津完成部署,国家并行计算机工程技术研究中心联合国家超算济南中心研发的“神威”E级超算原型机于8月5日在济南正式启用。此外,中科曙光也在进行E级超算的研制,但暂时还未披露该项目的进展。

据张云泉透露,在“神威”E级超算原型机正式启用的近1个月中,济南超算中心已经将“神威·太湖之光”的20多个应用顺利移植过来,并进行了一系列测试。

尽管在超级计算机研发本身,中国毫无疑问处于第一梯队,但潘景山对《环球时报》 记者表示,从超算的整体生态来看,中国依然与美国存在差距,业界也在共同努力,希望尽快打造属于我国的超算应用生态。

另一方面,“神威”E级超算还将立足济南,服务全国,解决健康医疗、先进制造、航空航天、气候气象、生物信息、新能源新材料等一批国家科学与工程计算领域的重大课题,为国家经济建设提供国际领先的计算平台,为中国制造业赋能。

虽然E级超算被誉为“超算领域的下一顶皇冠”,但其原型机却“貌不惊人”。“神威”E级超算原型机目前只是一台一人多高的纯黑色机柜,上面印有金色的“神威 E级原型系统”字样。打开原型机的机柜门,里面整齐分布着32个运算超节点,每个超节点又由8个申威众核处理器构成。

在美国超算“顶点”于今年6月超过“神威·太湖之光”、重夺全球超算第一后,中美之间的超算之争更加趋于白热化,对于下一代E级超算,两国都展示出“势在必得”的姿态。

与“天河三号”原型机处理器+加速器的松散耦合架构相反,“神威”E级超算的原型机采用了紧耦合的“同构众核”架构,在国产的申威26010+处理器中采用四个主核带256个从核的架构。张云泉对《环球时报》记者表示,“神威”的集成度更高,功耗更低,但挑战在于并行编程的难度会提升。“不过根据国际业界预测,未来最合适E级超算的架构应该就是‘胖核’+‘瘦核’。”

相较中美日的E级超算研制已经给出明确的时间表,欧洲的E级超算却迟迟没有眉目。张云泉向《环球时报》记者介绍称,由于欧洲超算此前一直采用美方技术,缺少自主核心技术,因此目前虽然有了E级超算计划,但没有看到实质性进展。

虽然都是走众核路线,但张云泉告诉《环球时报》记者,三家的研发路径却不尽相同。根据此前披露的消息,中科曙光的E级超算原型机采用了自主X86架构处理器和加速器的异构众核体系架构。有分析认为,虽然X86处理器的技术相对成熟,但要将其完美移植到中国的E级超算上,达到较高的性能,依然存在不小的难度。

噪音与低温,这是《环球时报》记者走进国家超算济南中心机房的第一感受。这里部署着中国首台全部采用国产处理器和系统软件构建的千万亿次计算机——“神威·蓝光”。一个月前,“神威·蓝光”迎来一个新邻居——“神威”E级超算原型机。

“目前来看,中国E级超算计划于2020年完成部署,应当是走在了世界的最前列”,张云泉对《环球时报》记者表示,但可以预期的是,在未来十年,中美在超算领域交替领先的格局不会出现根本性改变。

“对于E级超算的应用,我们的思路是‘顶天立地’”,张云泉对《环球时报》记者解释道,一方面,超算需要服务国家战略,为科学研究提供计算能力。以计划部署在山东的“神威”E级超算为例,它将为国家海洋强国战略构建“深蓝大脑”,支撑海洋和气候预测、海洋药物智能筛选、海底战略性资源智能勘探、海洋生态系统演变预测、海洋大数据智能分析等应用。

据国家超算济南中心主任张云泉介绍,“神威”E级超算原型机实现了完全自主可控——处理器、网络交换芯片、消息处理芯片等核心器件全部实现国产化。运算系统全部采用具有完全自主知识产权的申威众核处理器;高速互连网络系统全部采用完全自主知识产权的申威网络芯片构建;存储和管理系统采用申威多核处理器构建,实现了对该领域产品的国产化替代。

作为原型机,虽然它的体积不大,但相比由9个机柜组成的“老前辈”“神威·蓝光”,“神威”E级超算原型机的浮点运算速度达每秒3000万亿次,是“神威·蓝光”的3倍,相当于我国最强超算“神威·太湖之光”运行速度的1/30。

国家超算济南中心副主任潘景山向《环球时报》记者介绍称,2016年至2018年是中国E级超算规划中的第一步,即进行原型机的研发。这一阶段完成后,三家的E级超算将进行PK,通过“赛马机制”确定其中两家并制造出两台真正的E级超算。“根据计划,拥有每秒百亿亿次运算速度的‘神威’E级超算将在2020年正式发布。”

据美国媒体披露,美国第一台E级超算代号为“A21”,未来计划部署在美国阿贡国家实验室,于2021年投入使用。不久前,美国又宣布2个新的E级超算计划,其中一台将采用与A21不同的架构,部署在橡树岭国家实验室;计划部署于劳伦斯·利弗莫尔国家实验室的E级超算则可能采用一种全新架构。

相比中科曙光,“天河三号”E级超算的原型机采用了“多模融合加速架构”,即同时使用国产飞腾FT2000+处理器和迈创Matrix 2000+加速器。据张云泉介绍,“天河三号”的架构中既有专门的飞腾芯片分区,也有迈众芯片分区,二者既可以单独运行,也可以合力运行。

张云泉还向《环球时报》记者介绍,“神威”E级原型计算机也紧跟行业热点,首次在国产超级计算机上构建了人工智能软件生态链,基于神威深度学习库和框架,开展了对弈系统、医疗影像识别、机器翻译多个大规模人工智能应用,其中机器翻译应用的数据规模、并行规模和训练速度世界领先。

超级计算机可谓是“国之重器”,即使抛开数额巨大的研发费用不提,每台超算每年的用电都需要花费上亿元,这让不少民众都提出一个疑问:普通人如何从下一代E级超算中受益?