计算能力已经成为衡量一个国家、地区,甚至企业指数经济发展水平的重要指标。随着新基建的加速推进,计算中心(包括超算中心、先进计算中心以及智能计算中心等)已成为数字经济建设重要方向,正在驱动科技创新向产业、科研等各个领域扩展。随着科学计算、AI计算、大数据、云计算、边缘计算等数据处理模式的多源融合,计算在商业模式和应用场景方面也进一步加速向多元化个性化趋势发展。传统超级计算机正在“变成”智能计算机,为人工智能提供专门服务的计算中心也在加速落地。为此,我们邀请行业内知名专家学者以及企业家聚焦计算中心技术架构的演进路径,共同探讨计算中心技术融合与多元共生等深层次问题。随着科学计算、AI计算、大数据、云计算、边缘计算等数据处理模式的多源融合,传统计算中心面临的挑战? 新型计算中心技术架构未来发展方向?这些都值得我们深入思考。
在此背景下,2021年1月16日,由中国计算机学会(CCF)主办,CCF太原分部、CCF YOCSEF太原学术委员会、山西省超级计算中心以及山西省智能计算工程技术研究中心共同协办的“计算中心技术架构的演进路径技术论坛”成功举行。CCF YOCSEF太原裴向东和现任胡欣宇担任执行主席。CCF YOCSEF太原王中信和史玉晶担任线上主席。
聚焦计算中心计算架构,开展高水平技术报告
首先国家超级计算天津中心总工程师,冯景华博士做《计算中心设施和平台架构演进思考》技术报告,冯博士以国家级超算中心计算架构视角,重点从多芯片的多样性、多融合平台架构及生态建设给大家分享,提出随着计算需求的发展,数据处理模式向的多源融合发展,计算中心商业模式和应用也进一步由多元化向个性化趋势发展。
第二位引导嘉宾为华为中国数字政府解决方案CTO刘晓,他做《华为国产化高性能计算进展与生态建设》技术报告,刘晓指出x86体系,从PC端向下;ARM体系,从手机端反向打通PC机,会逐步呈现双寡头态势。同时给大家带来华为在计算中心创新架构部署及技术积累方面最新思考和进展。
第三位引导嘉宾为中国科学院深圳先进技术研究院高性能计算研究中心执行主任、博士生导师、魏彦杰研究员,他做的报告为《从生物计算看计算中心的技术架构演进路径》,他主要以一个国内外超算中心重度使用者的角度出发,针对用户群体不同,在选择硬件架构、软件设计时,要考虑背景的多样性,以实现最大化支撑。比如,他的研究团队在助力新冠研究中的蛋白质模拟过程中,尝试使用FPGA、RISC-V等定制化的计算平台,都取得了非常不错的成果。最后,他支出定制化计算生态已到来,Domain-specific architecture,未来定制化会越来越普遍。
之后,针对计算中心架构的技术难点和未来发展趋势进行思辨,在场嘉宾和参会人员展开了激烈的讨论。
引导嘉宾冯景华博士认为需求越来越高,所以要求计算中心的设计很复杂。多系统面向上层提供服务,还需要解决数据传输等问题。多源融合在开发应用的时候也有要求。
华为公司刘晓认为中美发展不同。中国的企业发展是自上而下,美国的企业发展是自下而上。华为在生态领域做很长时间,有天时(政策、信创)、地利(选择城市)、人和。鲲鹏创新中心在全国与地方政府合作,联合拓展应用生态,对建设国产化自主系统起到积极的作用。
YOCSEF太原AC吴喆峰认同华为的模式,精英数智就是受惠于华为云的商业模式。提高这种生态模式可以进一步提升未来的技术发展。
中国科学院科技战略咨询研究院隆云滔博士认为释放算例,开放数据,减少算例能耗,实现可持续发展。AI产业国家倾注很多力量,在健康运营的背景下,促进软硬件协同,绿色可持续发展。
工信部考试中心卢光明研究院认为计算与软件角度。基础计算模式发展,IT产业结构发生变化,需求市场的多元素,必然要求多态融合。
执行主席裴向东认为传统的超算主要是科学计算,随着AI计算应用的产生,腾讯、华为关注对AI算力的支撑;天津、无锡超算在工业计算方向发力,目前学界、产业界尚未大力关注。目前的工业计算面临的挑战有:第一,还没有真正部署和实施国家级的平台,第二个挑战,缺少既有超算、又有建模背景的复合型人才。INTER和AMD全球引领性强,我们有一定差距,向多元的多技术要素的发展方向,要融合多个系统,做出国内自主可控的,从行业做不同的计算中心。
引导嘉宾魏彦杰重复强调计算中心定位在哪(科学计算、AI计算、工业计算?),国内存在同质化竞争。在此背景下,软件工程师要不断学习新的计算框架,在多元素复合需求下,如何吸引人才成为大家面临的严峻挑战。
山西大学郭威认为从社会角度,大多人不了解超算。是否有科普宣传,对新入门槛的用户来说是否有平台介绍,知识元素和人才成为紧迫的因素。
引导嘉宾刘晓从业务驱动视角,认为计算中心如果需要变成通用功能,那么需要加入AI的加速等功能,如果可以做到芯片级就是最终达到的目的;从算力密度来看,包括交换性能,整机整柜扩展;从国产化角度,还需要超算中心把生态做起来。
兰州AC李杜认为计算中心最好和本地的科技融合的更好一些。. 计算机中心单纯做计算很难引领,还是需要构建一个生态。计算中心硬件是一个方面,是否还可以从软件、算法结构等方面进一步加强。
华为周洪提问:未来计算中心多种场景融合下,重组架构的方向?裴向东认为计算中心关注计算、存储和互联。大型并行机通用计算能力非常重要。存储层面,已经实现纯闪存的存储,存储速度非常快;计算方面,很多计算中心已经在进行一些主芯片的设计。关键是国内大的厂商是否可以和英伟达做抗衡。存储方面华为已经非常领先,互联方面还是非常重要。
魏彦杰进一步补充,一个好的软件或应用,IO、网络、芯片协同,目标是计算中心达到最高效率,不是越贵越好,而是性价比最高的方式协同设计。
甘肃超算中心沈玉琳:国外超算中心只是为了某几个领域做架构,国内还是以大而全的方向走,最好是符合更大量的应用,我认为未来随着计算更加精细化发展,会走市场化运作。一旦市场化,国家级超算中心应该承载战略性支撑。