不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

不看不知道│史上最全世界計算機發展史

中國超級計算機發展之路

2017年發佈的全球超級計算機500,使用中國自主芯片製造的“神威太湖之光”取代“天河二號”登上榜首,中國超算上榜總數首次超過美國,名列第一(中國有167臺HPC入圍TOP500,美國是165臺)。

不看不知道│史上最全世界計算機發展史

相對於天河2號採用Intel的至強PHI計算卡,本次刷榜的“神威太湖之光”從CPU到互聯網絡、存儲列陣等關鍵組成部分全部實現了國產化。

如果說天河2號因為使用了Intel的計算卡而被一些別有用心之徒詬病的話,本次完全自主研發的“神威太湖之光”毫無疑問實現了中國在高性能計算領域對美國的逆襲。

在模仿中蹣跚學步

建國伊始,因軍事和科研上的需要,國家非常重視計算機技術研發。除了積極培養本土人才,並送尖子赴蘇聯進修外,還積極吸引海外留學歸國人才——這當中有曾在蘇聯進修的張效祥教授,有在英國愛丁堡大學攻讀博士後的夏培肅院士,有在哥本哈根任無線電廠發展工程師的吳幾康院長,還有非常“土氣”的張梓昌高級工程師......他們成為建國初期仿製蘇聯計算機、自主設計計算機的棟樑。

1952年,國家就成立電子計算機科研小組,由數學研究所所長華羅庚負責。計算機小組提出了一臺串行的電子管計算機的輪廓設想,性能參數與EDVAC、EDSAC計算機相當。

就在這個時期,夏培肅院士完成了第一個電子計算器和控制器的設計工作,並編寫了中國第一本電子計算機原理講義。在院校開設了計算機設計、程序設計和計算機方法專業訓練班,並送技術尖子赴蘇聯進修。

1956年,國家制定了發展我國科學的12年遠景規劃,把開創我國的計算技術事業等項目列為四大緊急措施之一,中國科學院成立了計算技術研究所籌備委員會,將人才集中到該研究所,並依靠從蘇聯獲得的技術圖紙和蘇聯在156工程中援建的電子管工廠設計、生產自己的計算機。

1958年,原七機部高級工程師張梓昌對蘇聯提供的M-3機設計圖紙進行局部修改後,成功研製出103計算機,運算速度達每秒3000次,該計算機共生產36臺。

1959年,張效祥教授以蘇聯還在研製中的БЭСМ-II計算機為模板,成功研製104計算機,該機共生產7臺,每秒運行1萬次,在原子彈的研製過程中發揮了重要作用。

103計算機和104計算機的誕生,使中國計算機完成了從無到有的跨越。而且因為是仿製蘇聯的先進計算機,在技術起點上比較高——103計算機和104計算機在技術水平上僅次於美蘇。

1960年,夏培肅院士帶隊設計的107計算機研製成功,並被安裝在北京玉泉路中國科學技術大學。

107計算機是一臺小型的串聯通用電子管數字計算機,是新中國第一臺自主設計的計算機,標誌著中國的計算機從模仿到自主設計的跨越!

中科大以107計算機為基礎,編寫了《計算機原理》和《程序設計講義》,作為該校計算機專業、力學系、自動化系、地球物理系的教材。107計算機除了為教學服務外,還服務於潮汐預報、彈道計算、核物理、力學、微波等領域。

技術封鎖下自強不息

因長波電臺、聯合艦隊、中蘇論戰等事件的影響,中蘇關係迅速惡化,《中蘇友好同盟互助條約》名存實亡,赫魯曉夫撤走了全部在華蘇聯專家,而在珍寶島、鐵列克提事件後,中蘇幾乎到了戰爭邊緣,在60年代至80年代初,中國已很難得到蘇聯技術支援。

與此同時,西方對中國進行嚴格的技術封鎖。在美蘇的技術封鎖下,中國只能走自主設計、自主生產的發展路線,正如毛澤東同志所說“封鎖吧,封鎖他十年八年,中國的問題就解決了”。

晶體管制造對60年代初的中國而言難度不可謂不大,西方和蘇聯都認為中國根本不可能掌握該項技術。為解決晶體管制造難題,中國人民解放軍軍事工程學院四系四〇四教研室康鵬臨危受命,成功研發“隔離-阻塞振盪器”(後被命名為康鵬電路),解決了晶體管的穩定性問題,使中國比美國晚近8年進入晶體管時代。“康鵬電路”問世後,中國開始量產晶體管。

在解決晶體管制造難題後,哈軍工(慈雲桂主持設計)於1964年成功研製出新中國第一臺全晶體管計算機441B-I,相對於美國於第一臺全晶體管計算機RCA501晚了6年。

441B系列計算機是我國第一臺具有分時操作系統和彙編語言、FORTRAN語言及標準程序庫的計算機。

在天津電子儀器廠共生產了100餘臺,主要用於軍工、科研、氣象、油田勘探等,該機最大特點就是高可靠性和高可維性——1966年,北京舉辦計算機展覽,恰逢邢臺大地震,441B計算機是唯一不受地震影響,穩定運行的計算機。該系列機型平均使用15年以上。

1964年,吳幾康成功研製119計算機,該計算機運算能力為每秒5萬次,運算能力略強於美國於1958年製造的IBM 709計算機,後者的運算能力為每秒4.2萬次。1965年,109計算機研製成功,該機由2萬多支晶體管,3萬多支二極管組成,穩定運行15年。109和119計算機在我國研製氫彈的歷程中立下汗馬功勞,被譽為研製氫彈“功勳機”。

1965年,中國自主研製的第一塊集成電路在上海誕生,中國只比美國晚了5年進入集成電路時代。1972年,自主研製的大規模集成電路在四川永川半導體研究所誕生,實現了從中小集成電路發展到大規模集成電路的跨越。

從中小規模集成電路發展到中大規模集成電路,美國用了8年時間(1960年到1968年),而我們的前輩,在被美蘇同時封鎖扼殺之時,只用了7年就完成了跨越(從1965年到1972年),他們的奉獻和犧牲值得後輩銘記!

在72年尼克松訪華之後,中國和西方原本劍拔弩張的關係有所緩解,中國通過特殊渠道少量購買單機設備,並將其消化吸收後,大量仿製,推陳出新,搭建了自己的生產線。

此後,國產計算機更是進入大批量生產時代——批量生產的計算機有161型“南華”牌臺式計算機、LX--121型銀行利息機、130系列、150系列、180系列計算機。其中,130系列計算機產量最大,總產量近千臺。

這批計算機也告別過去僅限於軍工科研使用,使用範圍擴大到政府機關、銀行的數據採集和數據處理,工業控制,信息和事物處理等方面。

在這個時期,雖然西方技術突飛猛進,但中國在局部領域也追平西方,比如上海無線電十四廠於1975年成功開發出的1024位移位存儲器,就基本達到國外同期水平;1979年研製的HDS—9計算機每秒運算500萬次,是美國1972年的IBM 370-168計算機運算能力的兩倍;中科院上海冶金所還獨立發展了製造集成電路所需要的離子注入機,並出口到日本......

截至70年代末,中國科研人員和產業工人發揚自力更生、自強不息的精神,建成了中國自己的半導體工業,掌握了從單晶製備、設備製造、集成電路製造的全過程技術。

市場換技術下的悲劇

在80年代奉行“造不如買、買不如租”、“市場換技術”等政策後,中國半導體產業技術研發進入低谷期,技術人才要麼流失到國外,要麼去大學教書,有的甚至被調去看守機房。

在這段時間裡,自主技術被貶低,而洋技術被美化——很多非常有前途的科研項目被否決;不少科研項目更是在“外國專家”的“悉心指導”下被引上了歧路;甚至出現了中國企業使用自己研發的技術依舊要給外商繳納專利費的現象。

而自主研發CPU也被進口CPU取代,比如1983年,浪潮開始採用進口Intel8088芯片,而非國產芯片組裝0520微機,在80年代至90年代初研製的長城286、長城386、長城486、2780機、太極2220、銀河超級小型機、

HN2730超級小型機等計算機均採用國外芯片。

中國第四代計算機中的巨型機代表機型——“銀河1”巨型計算機耗資1億元人民幣,但因大量購買國外硬件,未能對中國的半導體產業進步起到多大積極作用。

在“造不如買、買不如租”理論的指導下,至80年代末,中國憑自己的技術已經很難生產出一臺計算機了。到90年代初,以聯想為代表的中國計算機企業紛紛轉向“貿工技”路線,只從事低附加值的微機組裝,無力也無心從事芯片研發,國內芯片市場徹底落入外資掌控。

玻璃房子的恥辱

在中國喪失獨立自主研發製造計算機的能力後,美國政府嚴格限制對中國出口高性能計算機。當時,高性能計算機的應用涉及的基本是堪稱國家“命脈”的領域,如國防軍工、油氣勘探、水電利用等。

由於中國當時還沒有自主研發的高性能計算機,所需要的計算機只能依靠進口,價格昂貴,維修管理困難。在1994年,中國進口計算機就花掉近20億美元,維護費用動輒千萬。

有專家表示,原石油工業部物探局曾花費巨資購買了一臺國外的大型機,在後期集成與維護的費用上對方公司竟開出百億以上的天價。

不僅如此,對方還提出了一個讓中國IT人銘記了十幾年的屈辱條件——在設備使用過程中,為防止機器核心技術外洩,設備機房採用全透明的玻璃牆壁,中國使用人員的一舉一動都在外國人的時刻監控下,甚至連高性能計算機的啟動密碼和機房鑰匙都要由外國人控制!

於是在中國的土地上,有了“中國人不得入內”的玻璃房子——在將列強趕走幾十年後,中國的土地“中國人不得入內”又以這種形式重新上演了。

為了徹底拆除“玻璃房子”,研發出完全擁有自主知識產權的國產高性能計算機,以曙光公司為代表的中國民族IT產業走上了一條異常艱苦的自主突圍之路。

90年代初,為了徹底打破國外對高性能計算機的壟斷,國家派出一支年輕精幹的科研小分隊,遠赴美國硅谷去進行曙光一號的研究。當時的科學計算所所長李國傑在黑板上寫下了“人生能有幾回搏”七個大字,斬釘截鐵的對幾個年輕人說:“派你們去,就相信你們一定能把機器給造出來!” 在每天工作十五、六個小時,長達11個月的封閉式研究後,科研小分隊成功設計出曙光一號核心部分。

在曙光一號的研發過程中,一些國外公司和國內買辦對曙光一號研究小組的領頭人李國傑院士說,“把錢給我,我給你造出來不就完了”。但李國傑院士堅持認為,高性能計算的核心技術必須掌握在中國人手中,這是一絲一毫都不能讓步的,不僅要做整機研製,包括存儲器在內的配件都要自己做。

1993年,中國一臺高性能計算機曙光一號並行機終於研製成功。曙光一號的戰略效應可以說是立竿見影:就在這臺高性能計算機誕生的第三天,美國便宣佈解除10億次計算機對中國的禁運!成功打破了國外IT巨頭對我國信息技術的壟斷,推動信息產業走上了自主發展的道路。

不看不知道│史上最全世界計算機發展史

中國超算逆襲

在堅定了自主發展超算的決心,並將決心付諸於實踐後,中國超算捷報頻傳:

1995年,在只有十餘名研究員及500萬元經費的情況下,中國成功研發出曙光1000大規模並行計算機。

曙光1000在整體技術上居中國之首,並達到了20世紀90年代前期的國際先進水平,其運行速度的峰值達到了每秒25億次,在當時我國大規模科學工程計算中發揮了重大作用。曙光1000也榮獲了1996年中國科學院科技進步特等獎和1997年國家科學技術進步一等獎。

1998年,曙光2000問世,總體水平達到了90年代同期國際先進水平,有些方面如機群操作系統、集成化並行編程環境和服務器聚集軟件等已處於國際領先水平。

2001年,曙光3000誕生,標誌著我國超算產品正在走向成熟,能兼顧大規模科學計算、事物處理和網絡信息服務,已然是國民經濟信息化建設的重大裝備。

2004年,曙光公司研發出4000A,成為國內首臺每秒運算超過10萬億次的超級計算機,並代表中國首次進入全球超級計算機TOP 500排行榜,位列第十位。

2008年,曙光5000降生,曙光5000的系統峰值運算速度達到每秒230萬億次浮點運算,使中國成為繼美國之後第二個能製造和應用超百萬億次商用高性能計算機的國家,也表明我國生產、應用、維護高性能計算機的能力達到世界先進水平。

2009年,作為第一臺國產千萬億次超級計算機的天河一號在湖南長沙亮相。天河一號超級計算機性能為每秒1206萬億次的峰值速度,Linpack實測性能為每秒563.1萬億次,強勁的性能使天河一號位列中國超級計算機前100強之首,也使中國成為繼美國之後世界上第二個能夠自主研製千萬億次超級計算機的國家。2010年,國防科大對天河1號進行了升級,天河1A的實測運算能力從天河1號的每秒563.1萬億次,提升至2507萬億次,成為當時世界上最快的超級計算機。

2010年,曙光6000問世,曙光6000以實測每秒達1271萬億次的Linpack峰值速度,在2010年第35屆全球超級計算機500強排名中名列第二。

2012年,神威藍光超級計算機投入使用。該超算使用了8704片申威1600,搭載神威睿思操作系統,雖然超算絕對性能並不高,但卻是中國在“市場換技術”之後,首次實現了超算CPU和操作系統的全部國產化。神威藍光超算峰值計算性能為每秒一千萬億次,持續性能為每秒796萬億次,性能功耗比超過741MFlops/W(百萬次浮點運算/秒•瓦),LINPACK效率為74%。

2013年,國防科大成功研製出天河2號,其高達55PFlops的性能使其傲視群雄,六度蟬聯TOP500排行榜首位。雖然在計算節點上使用的是美國Intel的CPU,但天河2號也使用了4096片飛騰1500,用於高速互聯網絡系統。

一直以來,別有用心之徒以天河2號使用美國CPU為由認為其不具備技術含量,其實超算系統可以分為軟件系統和硬件系統兩部分。

超級計算機硬件系統主要由高速運算系統、高速互連通信網絡系統、存儲系統(I/O 管理結點和 I/O 存儲結點)、維護監控系統、電源系統、冷卻系統和結構組裝設計等部分組成。

CPU僅僅是其中的一部分,並不是超算硬件系統的全部,某些人以天河2號使用美國CPU為由認為其不具備技術含量的說法是荒謬而可笑的。事實上,同樣使用E5和至強PHI計算卡的美國超算Stampede,不僅運算能力僅為天河2號的五分之一左右,整機效率也比天河2號更低,只有60.7%。

如果說天河2號、曙光6000、天河1號等超算使用了國外CPU是白璧微瑕,那麼,本次發佈的新超算“神威太湖之光”則實現了CPU、操作系統、高速互聯網絡等核心軟硬件的全面國產化——其CPU申威26010由260個核心構成,雙精浮點峰值高達3TFlops,完全追平了Intel最好的超算芯片。

得益於申威26010強勁的性能和良好的體系結構設計,新超算“神威太湖之光”的雙精浮點峰值高達100PFlops。相較於美國於今年完成升級的Stampede 2,新超算在絕對性能上是Stampede 2的近6倍。

這不僅徹底扭轉中國在超算領域技術和信息安全上受制於人的局面,還在技術上實現了對西方國家的逆襲。

一臺超算由什麼組成

自“天河二號”榮登TOP500榜首並6度蟬聯桂冠以來,一直有社會輿論攻擊“天河二號”使用美國Intel的CPU,因而不具備技術含量,甚至有媒體引用所謂業內人士聲稱“只要把足夠多的手機芯片連接起來,性能輕鬆超越天河二號”,一言蔽之,就是“天河二號”是組裝貨,中國並不掌握超算核心技術。

這種論調正確與否暫且不論,本次“神威太湖之光”採用了全自主技術則是對上述輿論的有力回擊,不僅實現了在超算領域徹底扭轉在技術和信息安全上受制於人的局面,還使美國對中國四家超算中心禁售Intel至強PHI計算卡成為笑柄,再次在信息技術領域實現了“凡是買不到的,中國人自己都能做出來”。

先來分析此前的一種論調:超算的全部技術都在CPU嗎?

超算系統可以分為軟件系統和硬件系統兩部分。

超級計算機硬件系統主要由高速運算系統、高速互連通信網絡系統、存儲系統、維護監控系統、電源系統、冷卻系統和結構組裝設計等部分組成。具體來說:

高速運算系統負責邏輯複雜的調度和串行任務和並行度高的任務,可以是採用同構計算(純CPU組成計算節點),也可以採用異構計算(CPU+加速器組成計算節點);

高速互連通信網絡由infiniband、高速以太網、自定製互聯機制構成,將所有計算節點連接起來,使其成為一個整體;

存儲系統由內存和外存組成,負責數據交換和儲存;

維護監控系統保障超算不死機、不出錯,畢竟每隔幾秒出一次錯,死一次機,這種足以讓超算的使用者精神崩潰;

電源系統包裝能源供應;

冷卻系統幫助超算降溫,防止出現超算過熱而造成的不良後果;

結構組裝設計是將上述系統裝載到一起,在保障性能和穩定性的基礎上,實現機櫃體積最小。

不看不知道│史上最全世界計算機發展史

運算系統機艙內部

超級計算機軟件系統主要包括操作系統、編譯系統、並行程序開發環境、科學計算可視化系統等四個重要組成部分。具體來說:

操作系統系統主要包括對同構技術或異構協同支持,高效能支撐擴張,基礎服務內核,全局並行文件系統;

編譯系統的功能是支持C、C++、Fortran77/90/95等編程語言,支持OpenCL、OpenMP、MPI等並行編程語言,支持編譯優化;

並行程序開發環境的功能是提供程序接口,支持應用程序的調試和性能分析;

科學計算可視化系統由海量數據服務模塊、並行繪製與顯示模塊和可視化映射與操作模塊組成。

因此,運算系統、存儲系統、互聯繫統、操作系統、基礎庫、應用軟件,以及監繫統控、冷卻系統、電源系統等都是超算的重要組成部分。因此,一些人稱因國產超算使用美國Intel的CPU,因而不具備技術含量,將CPU等同於超算的全部技術的說法顯然是非常不科學的。

超算不是簡單堆砌CPU

有媒體引用所謂業內人士聲稱,“把足夠多的手機芯片連起來就能超越天河2號。”但實際上,這個說法也是值得商榷的。

因為堆CPU也是一個技術活,體系結構設計的不好,高速互聯網絡做的不行,系統軟件做的不好,儲存列陣做的不行,即使堆再多的CPU,超算的性能也上不去。簡單粗暴的堆砌CPU根本不可能製造出一臺超級計算機,更不要說是能與天河2號相匹敵的超算。

另外,哪怕掌握了正確的堆砌CPU的方法,也不是單憑靠堆CPU數量就能獲得一臺能與天河2號相匹敵的超算。原因何在? 因為超算建設不是簡單的搭積木式的堆砌CPU——即便堆砌了海量的計算卡,但受制於其他方面,比如高速互聯網的技術水平,也會導致無法到達理論計算性能。

具體來說,高速互聯網絡的難點在於超算的計算節點之間傳輸的數據量巨大,延遲要求嚴格,當互聯網絡效率不足,就會導致數據擁堵,大幅降低超算整機系統效率。而超算的計算節點越多,對互聯網絡的要求也就越高。因此,即使想通過堆砌CPU來提升運算能力,也會受限制互聯網絡的性能,造成這種做法並不能無節制的提升超算的性能——受制於諸如互聯網絡以及其他方面的瓶頸,整機效率被拉低,導致實際性能並沒有因為堆砌了更多的CPU而有所提高。

另外,堆砌過多的CPU還存在功耗過大、機箱體積過大等問題,非常不利於日後的運營維護和使用,在超算市場基本不具備市場競爭力。正是因為高速互聯網絡的重要性,相對於在2015年才對中國四家超算中心禁售Intel計算卡,高速互聯網絡卻早就被美國列入技術封鎖的名單。

在軟件系統方面,控制少量計算節點和控制大量計算節點對軟件系統的要求近乎於天差地別。軟件系統必須保證每個超算計算節點的性能被髮揮到最大才能充分挖掘出硬件上的潛力,否則,就會影響超算的整機效率。

另外,TOP500頭幾名的計算節點大多在數千近萬,甚至一萬個以上,某幾個計算節點損壞,並需要更新是常有的事。當計算節點損壞時,軟件系統必須做到部分節點損壞時不會發生死機、報錯等情況,不影響計算任務的持續。

因此,如果沒有一個好的體系結構,那麼CPU的性能將無法全部發揮出來,而且堆砌的CPU數量越多,整個系統就越複雜,對高速互聯網絡、存儲列陣、監控系統、冷卻系統和軟件方面的要求也就越高,整機效率的提升也就越難。而體系結構設計能力水平不夠高的情況下,單純堆砌CPU數量,反而會降低整機效率,無法提升整機性能。

“神威太湖之光”牛在哪裡

“神威太湖之光”刷新TOP500排行榜,依靠的是其強悍的雙精浮點性能——其高達125PFlops雙精浮點峰值和93PFlops穩定性能讓世人驚歎。其實,除了擁有舉世無雙的雙精浮點性能之外,“神威太湖之光”還擁有整機效率高,整機功耗低、性能功耗比高,整機體積小等一系列優點。

“神威太湖之光”超算擁有40960個計算節點,使用了上海高性能集成電路設計中心設計的國產眾核芯片申威26010,採用28nm製程工藝,主頻1.45G,擁有260個核心,雙精浮點峰值高達3.06TFlops,在雙精浮點上完全追平了Intel最好的超算芯片。正是得益於國產眾核芯片申威26010的強悍性能,加上良好的體系結構設計以及互聯網絡等核心部件,使超算擁有異乎尋常的高性能、高效率、低功耗、高性能功耗比和小體積:

高性能——神威太湖之光雙精浮點峰值高達125PFlops,穩定性能為93PFlops,相比較之下,美國超算泰坦的雙精浮點峰值高達27 Pflops,穩定性能為17.6 PFlops,天河2號的雙精浮點峰值高達54.9Pflops,穩定性能為30.65PFlops,由此可見,“神威太湖之光”在穩定性能是美國超算泰坦的5.2倍(泰坦很可能是美國現在頂尖的超算之一,完成升級的Stampede 2性能為18PFlops)。

高效率——“神威太湖之光”整機效率高達74.16%,相比較之下,美國超算泰坦的整機效率為65.19% ,而河2號的整機效率為55.83%,由於超算性能越強,規模越大,整機效率提升就越困難“神威太湖之光”在穩定性能是美國超算泰坦5.2倍的情況下,整機效率依然大幅優於泰坦,整機效率之高簡直令人驚駭!

低功耗——“神威太湖之光”的功耗為15.3 MW,美國超算泰坦功耗為9MW,天河2號為17.8 MW,可以說,“神威太湖之光”的穩定性能達到天河2號3倍的水平,但整機功耗卻低於天河2號。

性能功耗比高——“神威太湖之光”的性能功耗比高達6G/W,相比之下,TOP500超算榜單上的競爭對手都相形見絀——天河2號的整機性能功耗比為1.95G/W,美國泰坦超算的性能功耗比為2.143G/W,美國超算紅杉整機性能功耗比為2.069G/W,日本超算“京”整機性能功耗比為0.830/W,美國超算Mira 整機性能功耗比為2.069G/W(Mira和紅杉用的都是IBM的Power)……即便是全球Green500排行榜,“神威太湖之光”也能排至第三位。由於Green500排行榜第一和第二的超算只採用了低功耗版的Intel E5,性能非常弱,而即便是採用英偉達K80加速卡的超算,其整機性能功耗比也只有4.7G/W。因此,“神威太湖之光”在性能功耗比上顯得格外耀眼。

小體積——“神威太湖之光”機櫃佔地605平方米,美國超算泰坦機櫃佔地面積404平方米,天河2號機櫃佔地面積720平方米。

不看不知道│史上最全世界計算機發展史

中國有三大超算系列:天河、神威、曙光。三大系列超算分別由國防科大、曙光公司,以及地處江南的某研究所研製,當然,其中也不乏互相協作以及其他單位參與的情況。近年來,中國超算頻頻刷榜,不僅賺足了眼球,還為中國國防軍工以及社會經濟發展產生了促進作用。

雖然“神威太湖之光”在整機性能、整機功耗、整機效率、性能功耗比等重要參數上無與倫比,但也並非盡善盡美,它也有自己的阿克琉斯之踵——其內存只有1.31 PB(天河2號為1.4PB)。另外,由於國產眾核芯片內存帶寬僅有136.51G,而且用的還是DDR3,相比之下,Intel的KNL和英偉達的Tesla都採用3D堆疊內存,內存帶寬更是達到512G(Intel PHI) 和 720G(英偉達 Tesla)。因為單個CPU的內存帶寬不大,所以對於現實生活中的應用,很難跑出接近峰值的性能。對於某些對內存帶寬要求高的應用,實際使用中就不如Tesla和PHI了。

不過,這並非申威26010和“神威太湖之光”的硬傷,得益於申威26010異乎尋常的設計理念,使申威26010單芯片能夠完成Intel E5+PHI,或Power+Tesla兩款產品的功能,而且相對於Intel E5+PHI,或Power+Tesla,申威26010能夠實現共享內存,這就避免了Intel E5+PHI,或Power+Tesla必須面對的顯式拷貝,從而降低了對內存的壓力,並減小了性能損失。筆者猜測,正是因為申威26010異常先進的設計理念,一定程度上彌補了內存上的不足,使中國科研人員敢於採用136.51G的內存方案。


分享到:


相關文章: