新四季網

不怕美國禁售!新天河推自主超算晶片

2025-05-10 20:43:26

    天河2號再一次稱霸全球超算性能榜單(性能最大33.83PFlops,千萬億次浮點計算),雖然仍處在建設中,但它已經比較獨特的連續5次成為Top500的冠軍。

    不過,高興之餘我們也有意思隱憂,因為美國商務部在今年4月份發布公告,決定拒絕英特爾公司向中國的國家超級計算中心出售至強晶片用於天河二號的升級。

    因為Xeon E5處理器比較容易獲取,所以限售的重點直指Xeon Phi計算加速卡。至於超算為什麼必須用加速卡,重點考慮的就是能耗和建設成本。

    限售令公布後,天河2號系統主任設計師、國防科大教授盧宇彤曾回應,「按照原定計劃,天河二號擬在今年將計算能力從55PFLOPS升級到100PFLOPS。儘管此次美方對天河二號升級所需Intel Xeon處理器的限售,對原定升級計劃有一定影響,但我們早有準備,絕不會影響天河二號從55PFLOPS升級到100PFLOPS的既定目標 。

    至於中國的信心來自那裡,本次超算峰會上,盧宇彤的主題演講也親自做了回應,我們整理了ZDnet親臨現場後發回的報導,一起來看看。

    這一次,全新的天河2A首次公開對外公布了信息,和與歷代天河系統的對比,其運算峰值將達到100P,更為精彩的是,「中國計算加速卡China Accelerator」首次亮相,型號「Matrix2000」。

    雖然處理器方面仍是至強E5-2692 V2,但這款自主的加速卡可謂是對「禁運令」的最大回擊。而且,在性能提升到100P的同時,天河2A的功耗幾乎沒有增加!

    事實上,通用處理器在未來的HPC系統裡的權重會越來越低,主要工作將逐漸向控制層面轉移,計算任務則主要由加速器完成。因為NVIDIA GPGPU Tesla同樣在美國限售範圍內,國防科大給出的中國自主研發方案就是通用計算數位訊號處理器(GPDSP)。必須承認的是,並不算有多「高大上」。

    Matrix2000的主要設計規格預計為16核設計,可達到2.4T的浮點性能,雖然還比不上Knight Landing的3T,但對於白手起家的中國來說,已經相當不易,而且功耗比現有的Xeon Phi少了100W。

    Matrix2000的內部設計,採用了標量與向量單元+超長指令字(VLIW)的架構

    針對全新的Matrix2000所準備的軟體堆棧,包括GPDPS驅動程序、作業系統、編譯器、數學庫等

    據國防科大的相關研發人員介紹,有關DSP的浮點計算應用,一直也是國防科大的研發重點,它與超算研究可謂是並行發展。也正是因為有了這樣的積累,國防科大才能比較從容的面對美國的限售。但該研發人員也表示,GPDSP的一個推廣難點也就在於,在HPC應用領域幾乎是從零起步,就像當初NVIDIA剛推出GPGPU時一樣,直到CUDA的發布才迅速改善了GPGPU的應用生態環境。

    在互聯層,採用了自主研發的TH-Express 2+架構,實現了自適應(Adaptive)互聯架構

    所謂的自適應互聯架構,就從多個層面入手,通過自應用平臺層至底層形成的智能互動,保證網絡效率持續而穩定,比如自動規避質量不佳或擁擠的鏈路,進一步杜絕重複的通信,並在節點與網絡故障時對路由重新配置等等。

    天河二號A仍然是以自主研發的H2FS文件系統為核心,實現了1TB/s的突發傳輸,100GB/s的持續傳輸

    不過盧宇彤表示,目前Matrix2000已經通過了驗收。這意味著至少在國防科大的層面,正式投入使用已經沒有問題,但具體時間還不能確定,所以只給出了2016年這一較為籠統的時間點。

    相關研發人員也透露,除了應用平臺進一步配套完善之外,GPDSP晶片本身的生產與物理設備的調優還有很多工作要做。而且受限於當前中國半導體生產工藝水平,現在還是採用40nm工藝的GPDSP,也在很大程度上制約了Matrix2000的能力。

    總的來說,中國研製超大規模HPC系統的目的肯定不僅僅是為了跑個LINPACK爭個名次,否則也不會引起美國的重視並引發限售。

    天河二號A的設計在某種角度上說,真正打開了中國自主HPC發展的向上之路,因為加速器很重要,也因為加速器被國外限售,所以天河二號A在這種環境下還能很快達到100P的性能,也許連美國相關人士也沒有想到,但這絕對是件好事!■

同类文章
銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

  今年,AMD銳龍7000系列筆記本處理器四種架構五大系列混雜,其中只有兩個系列採用了全新架構,其餘為舊款重製的馬甲型號,這可能讓不少普通消費者感到困惑,無從辨別哪一款才是全新的「Zen4」架構CPU。  最近,AMD向合作夥伴發布了新的材料,解釋稱當筆記本電腦上的橙色貼紙意味著它基於 Zen4
AMD品牌日來襲 京東11.11促銷火熱進行中

AMD品牌日來襲 京東11.11促銷火熱進行中

  隨著前兩天AMD京東11.11開門紅活動盛大開啟,豐富的AMD全線產品促銷盛宴讓廣大玩家激動不已,而活動仍然在火熱進行中,現已成功進入第二階段,更多驚喜的超值促銷等待著DIY玩家們的繼續參與。本次活動11月6日為AMD品牌日,活動熱力持續升級包含了直降秒殺、滿減、套包鉅惠、返E卡等豐富的活動豪禮

優異旗艦處理器還用矽脂?Intel這波可不夠良心

    Intel 在今年發布了全新發燒級的酷睿處理器i9,性能一下子有了不小的提升,玩家們也都開玩笑說道,多年來擠牙膏的 Intel 這次是擠多了。在性能提升的同時,玩家們還希望的就是 Intel 能夠放棄使用矽脂,不過先發售的i9-7900X並沒有做到。    在處理器的核心與頂蓋之間使用釺焊代
AMDQ1虧損超1億 賣X86技術給中國廠商

AMDQ1虧損超1億 賣X86技術給中國廠商

    Intel日前的財報表現還不錯,但為了轉型,依然要裁員1.2萬人。老對手AMD今天也發布了今年Q1季度財報,當季營收8.32億美元,下滑了19%,不出意外地還是虧損了1.09億美元,但與去年同期1.8億美元的虧損相比已經收窄,已經在改善業績了。對AMD來說,他們開闢新業務還是蠻成功的,AMD
國產新超算推遲?棄Intel換自主CPU

國產新超算推遲?棄Intel換自主CPU

    目前世界上最快的超級計算機的我國的「天河2號」,它每秒能完成5億億次運算,超算廣州中心主任尹學峰近日稱,天河2號利用率在60%,可見需求還是很廣泛。    剛剛,曙光公司總裁歷軍近日在接受記者採訪時表示,繼千萬億次超級計算機曙光「星雲」之後,「十億億次」超級計算機曙光7000已開始研發。  
Intel會推配備優異核顯Skylake-C嗎?

Intel會推配備優異核顯Skylake-C嗎?

    由於14nm工藝的延期及戰略調整,Intel今年的桌面版Broadwell處理器有些尷尬——比預定時間晚了一年,沒發布多久就碰上了Skylake處理器上市。但另一方面,Broadwell桌面版又非常讓人期待,因為它是首款配備128MB緩存優異核顯的桌面處理器,圖形性能比普通核顯強多了。考慮到
體驗14nm的魅力 Skylake主機配置推薦

體驗14nm的魅力 Skylake主機配置推薦

    伴隨著更多Intel 14nm Skylake處理器、面向主流玩家的B150晶片組主板上市開售,以及DDR4內存的售價逐漸步入廣大普通消費者能夠接受的範圍,大傢伙終於可以在不擔心「預算爆表」的前提下愉快的組一套新主機來體驗14nm工藝帶來的「快感」了。    為什麼要這麼說呢?因為在Inte
桌面Broadwell要停產?Intel:不可能!

桌面Broadwell要停產?Intel:不可能!

    Broadwell五代酷睿是Intel歷史上比較奇怪的一代產品,主要精力都放在了移動平臺上(當然還有下一步的伺服器),而桌面上只有區區兩款i7-5775C、i5-5675C,還都是直接從移動版移植過來的。    這倆稀缺之物還有一個與眾不同的亮點,那就是保留了GT3e Iris Pro核芯顯
散熱器損壞Skylake處理器:真的掰彎了

散熱器損壞Skylake處理器:真的掰彎了

    之前有消息稱Skylake處理器很可能因為PCB變薄導致大型散熱器損害處理器,本來以為這個問題只不過是示警,但現在已經有杯具案例了——已經有用戶的Skylake處理器真的變彎了,甚至主板插槽也變形了,這下可要真的注意了。此外,除了鐮刀、貓頭鷹之外,越來越多的散熱器廠商也表態了。    之前我
Intel確認:Skylake處理器存死機Bug

Intel確認:Skylake處理器存死機Bug

    雖然PC走勢漸弱,Intel也把精力開始投入到了虛擬實境、物聯網等領域,但談及2015最激動的事,Intel CEO前不久亮相CES時還是把榮耀頒給了Skylake處理器。    作為第六代酷睿,Skylake驚喜並沒有達到讓所有人眼前一亮,性能就不談了,上市後還被曝出像是i3 TDP弄錯、