百亿亿次超算将用国产64核处理器,性能比肩Intel至强E5

更新日期:2021-09-30

来源:系统部落

  继天河2号之后,中国的神威·太湖之光超算也连续垄断了全球超算TOP500冠军之位,其峰值性能超过12.5亿亿次,Linpack性能达到了9.3亿亿次,是全球首个10亿亿次超算,最关键的一点是太湖之光使用的是国产申威处理器。现在中美日欧都在争抢下一代百亿亿次超算,国内就有神威、天河、曙光三个项目,其中天河三号预计今年底完成关键技术验证。由于美国已经封锁了对中国的高性能计算芯片的出口,再加上国内自主可控的要求,百亿亿次超算全面使用国产处理器已经不是问题,国内的飞腾公司已经完成了FT-2000 Plus 64核处理器,多核性能将达到了Intel至强E5主流产品的水平。

百亿亿次超算将用国产64核处理器,性能比肩Intel至强E5
>

  中国的神威处理器已经启用国产处理器,天河2号超算之前使用的是Intel至强E5及Xeon Phi加速器,下一代的天河三号按照要求也会转向国产处理器。由于天河系列超算主要是国防科大主导研发,所以它很可能使用飞腾公司的处理器,这家公司在广州、天津都有研发中心,早在天河1号、2号超算上就有应用FT-1000、FT-1500处理器,不过这些处理器使用的还是开源的SPARC架构,也只是用在节点连接上,并不是计算的主力。

  FT系列处理器先后使用过多种指令集,包括IA-64、SPARC,不过这些指令集多数不是主流选择了,最终他们选择了64位ARMv8指令集,从FT-2000系列开始全面应用ARMv8架构。两年前飞腾公司在Hotchips 27国际会议上公布了64核ARMv8处理器Mars,他们自己开发的架构代号为Xiaomi,不巧的是飞腾公司的演讲者被美国拒签(飞腾公司跟国防科大有关,后者被美国制裁),所以当时的演讲是通过视频回忆完成的。2016年飞腾公司正式推出了FT-2000/64处理器,基于28nm工艺制造,集成64个FC661核心,频率1.5-2.0GHz,集成32MB L2缓存,支持128MB扩展L3缓存,内存则是16条DDR3-1600通道,带宽204GB/s,最大功耗100W。

  现在的FT-2000 Plus则是FT-2000的增强版,制程工艺提升到了16nm,也是TSMC代工,频率提升到了2.0-2.4GHz,依然是64个FC661内核,不过放弃了L3缓存,整合了DDR4内存控制器。

  可以看出,FT-2000 Plus处理器在设计上有升有降,放弃了复杂、昂贵的扩展L3缓存,这会导致其性能有所下降,不过内存从DDR3升级到了DDR4,性能有所提升,而制程工艺的改变也大幅提高了工作频率。

  至于具体的性能,根据飞腾公司透露出的消息,FT-2000 Plus单核性能跟Intel处理器还有较大差距,但是因为核心多,多线程性能与Intel主流的至强E5处理器相当。考虑到飞腾处理器是应用在高性能计算机市场上的,多核性能要比单核性能更重要,所以这个缺点还可以接受。

  飞腾FT-2000 Plus处理器预计会在天河3号超算上大规模应用,取代以往的Intel至强处理器成为计算核心。至于它的实际表现,明年的TOP500超算中或许有机会管中窥豹。