新四季網

理性分析「神威」超算拿下世界靠前

2025-04-24 18:01:24

    實際上,筆者大概在去年的這個時候也寫過一篇有關國產超算的文章,不過內容主要是質疑「天河2」連續五次蟬聯《全球超算500強》之意義所在。

    當時的觀點並非是認為「天河系列」已沒有所謂的技術價值,而是想強調:當「天河1」於2010年10月首次擊敗美國橡樹嶺國家實驗室的「美洲虎」超級計算機後,成功幫助國人在歷史上首奪「最快超算」之頭銜時,「天河系列」的偉大使命實際上就已經基本完成。

    再之後的「天河2」連續蟬聯,即使媒體用再多的篇幅去報導和渲染,也只能是徒增一些虛無飄渺的「自豪感」,而不能改變國產超算實際面臨的兩項殘酷事實:1. 最核心的技術仍依賴於美國——所以後來有了美國單方面宣布禁止向中國科研機構出口Xeon CPU和Tesla GPU的新規;2. 美國已經在研究下一代「百億億次級」(exascale)超算,能效標準遠超當前水平——所以我們眼下的領先,真的不能代表什麼。

    因此,基於我們一時半會兒在自主核心硬體上難以趕超美國的事實,小編提出——將超算小型化、節能化和普及化會是一套更符合實際意義的做法,因為這能讓我們製造出更多可以榮登《綠色超算500強》榜單的中小型超算系統,能讓更多的學校和科研機構隨時隨意地用上屬於自己的超級計算機。實際上,這也是大國發展、科技興國的重要指標之一。

    然而萬萬沒有想到,時間僅過了一年,「神威太湖之光」的出現不僅確保了今年《綠色超算500強》前三甲的一個席位(過去中國大陸產超算從未登榜前十),更還一舉同時奪得了《全球超算500強》的冠軍頭銜,且完完全全用的是國產自主設計處理器(小編這裡不用CPU一詞,是因為從架構看已經脫離了傳統CPU的概念,有點英特爾Xeon Phi加速協處理器的意思,後者也是美國禁售名單產品之一)。

    這樣的成績,在美國剛剛宣布對華禁售高性能處理器的大環境下,在苦苦掙扎也不願配合大陸共同研發的臺灣半導體面前,簡直等同於一次核爆,其意義遠非「天河系列」繼續蟬聯「全球最強」所能比擬——當然這裡還是要再次澄清,小編沒有無視「天河」的價值,但用一套已掌握的技術標準來連續贏得競爭對手現階段已不參與的角逐,真的已不再具備任何值得大篇幅渲染的意義。

    不要將所有的「國產芯」都一視同仁

    每每提到「國產芯」,總會有那麼一群「不明真相」的網友要調侃、要嘲笑。不能怪他們,畢竟有過上海交大「漢芯事件」這樣的黑歷史,也有著「龍芯」過分高調而不討喜的事實。「少說多做」一直是小編在評價「龍芯」時的觀點,而「神威太湖之光」背後的「申威系列」處理器,就實實在在做到了這點,所以今天他們成功了,並且一鳴驚人。

    當然,這裡要插個畫外音,要為「龍芯」做一點解釋:出於某些原因,「龍芯」雖然受到國家重視,但卻是「自負盈虧」的放養模式。相比也是國家重點項目的「申威」,後者則得到了軍方的完全支持,因而無需擔憂能否持續發展的問題。所以從這個角度理解,我們不能怪「龍芯」的完全商業化,但是——少接受採訪、少吹噓性能、低調做產品就行了,誇大產品在特定測試環境下性能趕超歐美是沒有意義的,因為「龍芯」定位的是通用計算市場,不是在指定領域下玩跑分。

    「申威」顯然在獲得軍方支持後,走的並不是「通用」路線——能否支持普通人能理解的Windows、UNIX或者Linux發行版並不重要,「申威」作為國家安全戰略用晶片自然會有特殊定製版系統與之配合;性能或許也非最重要指標,能掌握核心技術並用於關鍵領域才是最具意義的事情——所以,「申威」一直特別低調,鮮有報導(比較大篇幅的報導始於2015年)。直到今天勇奪世界靠前,才讓美國頓時懵逼了,讓主流媒體突然沸騰了。

    能被用於超算領域的「國產芯」大概也只有「申威」和「龍芯」兩個選擇,其它的基於ARM架構的晶片,則主要面向移動和通用市場,因此要一視同仁地進行比較並不具備價值。未來還有可能出現的能挑戰「申威」的國產晶片,恐怕就只有等與AMD合作的那款SoC了——當然小編對此是極度懷疑中。

    「神威太湖之光」的厲害和不同

    「神威太湖之光」採用的是申威26010處理晶片,共40960個計算節點,每個節點由256個計算內核 4個管理內核(據說也帶計算功能)組成,所以整套系統共1060萬個CPU計算核——這個數字為排名第二的「天河2」的三倍,後者約為312萬個計算內核,因而在浮點計算性能上也大約是「天河2」的三倍:93.01 petaflop/s比33.86 petaflop/s。

    然而,「神威太湖之光」的整機功耗只有15.37 MW,而「天河2」則為17.81 MW。也就是說,「神威」是實現了性能倍增的前提下,功耗反而大幅降低了。這才是一次真正意義的技術突破——當然,這與美國提出的50 gigaflops/watt的exascale次世代超算還是有很大差距(「神威」換算過來的每瓦性能約為6 gigaflops/watt)。

    申威26010之所以能有如此強大的浮點計算性能是得益於Alpha處理器架構。Alpha是不同於今天市場主流的X86、ARM、MIPS、Power和Sparc的又一處理器微架構,屬於RISC(精簡指令集)家族,曾在上世紀90年因大膽前衛的亂序並行設計而風靡。雖說Alpha也不是申威的自主專利技術(原持有公司為DEC,後輾轉賣給了惠普,於2004年停止研發),但與龍芯使用MIPS一樣,在經過那麼多年的沉淪,把已經「過氣」的舊指令集和架構重新發揚光大,並加入新的構思(異構架構設計),也能算是一種創新,因此申威26010在「自主原創性」方面並不存疑。

    申威26010的挑戰

    不過,也正因為申威26010是基於DEC Alpha 21264這個專利已過保護期的技術所發展出的產品,且採用了類似英特爾Phi加速處理器的架構設計,「神威太湖之光」勇奪世界靠前的背後,恐怕要面臨編程難、使用難、兼容性難等諸多挑戰。

    譬如,Alpha早在2004年就停止後續開發了,因此很顯然它不會有開源社區的支持。因此申威及其使用者就不得不自主維護一套系統和應用生態,而早期有能力參與其中開發的人員相信是十分有限。此外,申威26010的架構既不像GPU,又不完全是基於CPU,想要合理調用計算加速,在編程上也需要額外學習成本,今天大量懂得OpenCL或CUDA編程的軟體工程師們恐怕也無法順利平移到「神威太湖之光」。

    當然,申威還是主要以突破美國封鎖、掌握晶片核心技術為目的的項目,沒有那麼高的通用性或許並不是迫在眉睫的問題。

    

同类文章
銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

  今年,AMD銳龍7000系列筆記本處理器四種架構五大系列混雜,其中只有兩個系列採用了全新架構,其餘為舊款重製的馬甲型號,這可能讓不少普通消費者感到困惑,無從辨別哪一款才是全新的「Zen4」架構CPU。  最近,AMD向合作夥伴發布了新的材料,解釋稱當筆記本電腦上的橙色貼紙意味著它基於 Zen4
AMD品牌日來襲 京東11.11促銷火熱進行中

AMD品牌日來襲 京東11.11促銷火熱進行中

  隨著前兩天AMD京東11.11開門紅活動盛大開啟,豐富的AMD全線產品促銷盛宴讓廣大玩家激動不已,而活動仍然在火熱進行中,現已成功進入第二階段,更多驚喜的超值促銷等待著DIY玩家們的繼續參與。本次活動11月6日為AMD品牌日,活動熱力持續升級包含了直降秒殺、滿減、套包鉅惠、返E卡等豐富的活動豪禮

優異旗艦處理器還用矽脂?Intel這波可不夠良心

    Intel 在今年發布了全新發燒級的酷睿處理器i9,性能一下子有了不小的提升,玩家們也都開玩笑說道,多年來擠牙膏的 Intel 這次是擠多了。在性能提升的同時,玩家們還希望的就是 Intel 能夠放棄使用矽脂,不過先發售的i9-7900X並沒有做到。    在處理器的核心與頂蓋之間使用釺焊代
AMDQ1虧損超1億 賣X86技術給中國廠商

AMDQ1虧損超1億 賣X86技術給中國廠商

    Intel日前的財報表現還不錯,但為了轉型,依然要裁員1.2萬人。老對手AMD今天也發布了今年Q1季度財報,當季營收8.32億美元,下滑了19%,不出意外地還是虧損了1.09億美元,但與去年同期1.8億美元的虧損相比已經收窄,已經在改善業績了。對AMD來說,他們開闢新業務還是蠻成功的,AMD
國產新超算推遲?棄Intel換自主CPU

國產新超算推遲?棄Intel換自主CPU

    目前世界上最快的超級計算機的我國的「天河2號」,它每秒能完成5億億次運算,超算廣州中心主任尹學峰近日稱,天河2號利用率在60%,可見需求還是很廣泛。    剛剛,曙光公司總裁歷軍近日在接受記者採訪時表示,繼千萬億次超級計算機曙光「星雲」之後,「十億億次」超級計算機曙光7000已開始研發。  
Intel會推配備優異核顯Skylake-C嗎?

Intel會推配備優異核顯Skylake-C嗎?

    由於14nm工藝的延期及戰略調整,Intel今年的桌面版Broadwell處理器有些尷尬——比預定時間晚了一年,沒發布多久就碰上了Skylake處理器上市。但另一方面,Broadwell桌面版又非常讓人期待,因為它是首款配備128MB緩存優異核顯的桌面處理器,圖形性能比普通核顯強多了。考慮到
體驗14nm的魅力 Skylake主機配置推薦

體驗14nm的魅力 Skylake主機配置推薦

    伴隨著更多Intel 14nm Skylake處理器、面向主流玩家的B150晶片組主板上市開售,以及DDR4內存的售價逐漸步入廣大普通消費者能夠接受的範圍,大傢伙終於可以在不擔心「預算爆表」的前提下愉快的組一套新主機來體驗14nm工藝帶來的「快感」了。    為什麼要這麼說呢?因為在Inte
桌面Broadwell要停產?Intel:不可能!

桌面Broadwell要停產?Intel:不可能!

    Broadwell五代酷睿是Intel歷史上比較奇怪的一代產品,主要精力都放在了移動平臺上(當然還有下一步的伺服器),而桌面上只有區區兩款i7-5775C、i5-5675C,還都是直接從移動版移植過來的。    這倆稀缺之物還有一個與眾不同的亮點,那就是保留了GT3e Iris Pro核芯顯
散熱器損壞Skylake處理器:真的掰彎了

散熱器損壞Skylake處理器:真的掰彎了

    之前有消息稱Skylake處理器很可能因為PCB變薄導致大型散熱器損害處理器,本來以為這個問題只不過是示警,但現在已經有杯具案例了——已經有用戶的Skylake處理器真的變彎了,甚至主板插槽也變形了,這下可要真的注意了。此外,除了鐮刀、貓頭鷹之外,越來越多的散熱器廠商也表態了。    之前我
Intel確認:Skylake處理器存死機Bug

Intel確認:Skylake處理器存死機Bug

    雖然PC走勢漸弱,Intel也把精力開始投入到了虛擬實境、物聯網等領域,但談及2015最激動的事,Intel CEO前不久亮相CES時還是把榮耀頒給了Skylake處理器。    作為第六代酷睿,Skylake驚喜並沒有達到讓所有人眼前一亮,性能就不談了,上市後還被曝出像是i3 TDP弄錯、