大嘉购无卡支付APP咨询: 微信:18833195
大嘉购(www.jinkongqianbaow.com)是广东盛迪嘉电子商户股份有限公司旗下独立电商购物及移动支付品牌,资金由持人行颁发支付牌照支付机构“盛迪嘉支付”提供结算服务!

芯片技术落后的中国,是如何造出超级计算机的?

大嘉购官网整理编辑:

2019年,超级计算机排行榜出炉。美国人在多年之后,终于依靠Summit重新成为世界第一。而在此之前,中国的太湖之光已经蝉联四届第一。

相比Summit中nVIDIA GPU使用的12nm工艺(今年nVIDIA可能升级到7nm),神威太湖之光的28nm可以算古董级的工艺了。

明明工艺落后,为何中国的神威太湖之光,却能在超级计算机的排行榜上排名第一达四年之久呢?这背后的奥秘是什么呢?

一、 神威的来源

神威太湖之光是江南所制造的,江南所全称是无锡江南计算技术研究所,很早就开始对自主高性能计算机的研发。

神威用的处理器是申威(以前处理器也叫神威),这款处理器时,是从美国DEC公司的Alpha处理器衍生出来的。

当时,美国各家大的计算机公司都有自己的指令集和处理器,DEC公司也不例外,而DEC的Alpha系列是当时的明星处理器,同时代浮点性能是最强大的。

然而,成功的处理器不一定能让企业成功。1998年Compaq收购DEC,2002年,惠普康柏合并。而惠普有自己的PA-RISC指令集。

于是,Alpha的东西就卖给中国了,价格不便宜,这是申威的起源。

Alpha当年的思想是很先进的,AMD的K7就有Alpha的影子,英特尔P4的超线程技术是Alpha的。当年桌面CPU还在从单核心向双核心进化,而Alpha的21364已经考虑64个核心的之间的高效通信问题了。

现在,被媒体捧成大神的Jim Keller,当年就是在Alpha设计团队中成长的。

DEC被收购后,他去了AMD,参与设计了K7,是K8项目的主设计师。结果,AMD在那几年吊打Intel。

移动时代,Jim Keller去了PA-Semi,这家公司是由Daniel W. Dobberpuhl在2003年创立,和Jim Keller一样,他也曾在DEC工作,同时他还是Alpha 21064 和StrongARM处理器的主设计者。

就是说,PA-Semi也是Alpha的血脉。结果。PA-Semi给苹果收购,从A5,一直做到今天吊打ARM公版的A13处理器。

你今天用的iPhone,iPad,同样有Alpha的血脉。

从苹果离开后,Jim Keller再去AMD,设计了Zen。今年Zen2重新吊打一次英特尔。

目前,Jim Keller在英特尔准备大招。

Alpha当年提出的很多东西都是超前的,EV7总线,超线程,多核心的通信问题。今天,我们用的英特尔、AMD,苹果A系列处理器都有Alpha的遗产。

所以,重金买下Alpha,给神威一个非常好的底子。

二、江南所的创新

江南所拿到Alpha以后,2006年设计出具有自主微结构的申威1,130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。

这么落后的工艺做到这么高的主频,因为江南所当时和代工厂有深度合作,优化提升主频,实际性能不错。

2010年,申威1600用65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。

在技术指标上,16核心的神威1600在1.1ghz的时候,双精度浮点运算能力是140.8G,i7 980xe 6核心在3.2ghz,双精度浮点是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威在性能功耗比上已经超越了当时的Intel。而神威的工艺落后,65nm对32nm。

太湖之光用的是申威26010,双精浮点峰值为3.06TFlops,与Kight Landing处在同一水平线。

申威26010采用了“CPU+加速器”的方案(管理核心+运算核心),为64位RISC(主频1.45GHz),拥有260个处理核心和4个内存控制器。处理器内包括四个核心组,每组有65个内核,由8×8 Mesh架构计算集群(CPE)、一个管理单元(MPE)、一个内存控制器(MC)组成。

这个理念属于众核,其实当年alpha21364就考虑过64个核的通信问题,神威有个好底子。

后来众核流行,大家都堆小核心,神威的架构正合适,这个东西做超算是合适的。

超级计算机的美国大牛曾经考察过江南所的神威太湖之光。他惊异的发现,中国人把美国最优秀的超级计算机Cray T3D做到了芯片上面。

在工艺落后于英特尔两代的情况下,做出不低于英特尔的性能。一定功耗内,堆核心数量超过英特尔的超级计算机,性能就是世界第一。

由于指令集的差异,江南所的神威太湖之光浮点性能远好于X86指令集的英特尔处理器。

所以,能够追赶神威的,都是采用nVDIAI异构计算的超级计算机。

领先四年后,才被工艺先进数代的产品赶超。江南所自己的创新也毋庸置疑。

三、未来的超级计算机

2019年,中国的神威太湖之光被美国赶超。但是从工艺看,落后两代。

看单核心性能,神威用今天的角度看也很羸弱。28nm 2Ghz 大约是2Ghz ARM A75-A76的水平。与ARM阵营像苹果A12、A13使用的CPU核心结构落后很多。

神威强大在于架构先进,核心之间互联通讯的开销小。

而随着技术的发展,神威是可以提升工艺与单核心性能的,现在中芯国际的12nm已经量产,7nm的evu指日可待。未来神威重回世界第一只是时间问题。

特别声明:本文为DoNews签约作者原创,文章版权归原作者及原出处所有。转载请联系DoNews专栏获取授权。(有任何疑问都请联系idonews@donews.com)

扫描二维码