新四季網

中國芯威武!全球首款異構運算處理器

2023-09-19 02:28:53 1

    2016年初,在北京亦莊召開的「高性能異構計算及網絡安全研討會」上,華夏芯(北京)通用處理器技術有限公司即將推出全球首款完全支持異構系統架構(HSA)的處理器。

    先來看看媒體是怎麼說的(由於篇幅冗長,為方便閱讀,筆者就摘錄重點以供參考)

    據《中國電子報》報導說,「處理器IP核與生態系統兩方面問題的解決,將使中國自主處理器產業有望在下一代異構計算時代,取得更快速的發展,趕上國際先進水平。」摘錄如下:

    1、華夏芯的突破表明我國在新一代異構計算上取得重大進展,有望在原本相對空白的處理器IP(智慧財產權)核授權領域打破國外壟斷,徹底改變中國處理器產業的核心智慧財產權基本依賴於國外許可的被動局面。

    2、從軟體角度看,應用開發將變得輕鬆,任何程序都不必費心考慮不同處理器內核之間的存儲差異。這將給計算性能以革命性的提高。

    3、是全球首次推出完全支持HSA標準的CPU+GPU+DSP的處理器IP核平臺,它從指令集、微架構到工具鏈具有完全自主智慧財產權。同時,華夏芯還可進行SoC定製設計服務。這將有效改善國產IP核設計及許可上的短板。

    那麼,什麼是異構系統架構?《中國電子報》的報導有多少真材實料,又有多少水分呢?

    什麼是異構計算?

    異構計算主要是指使用不同類型指令集(X86、ARM、MIPS、POWER......)和體系架構的計算單元(CPU、GPU、DSP、ASIC、FPGA......)組成系統的計算方式。

    舉例來說,AMD的APU其實就屬於異構計算。

    【編者註:AMD,即超微半導體公司。AMD公司專門為計算機、通信和消費電子行業設計和製造各種創新的微處理器(CPU、GPU、APU、主板晶片組、電視卡晶片等)、快閃記憶體和低功率處理器解決方案,是目前業內唯一一個可以提供CPU、GPU、主板晶片組三大組件的半導體公司。】

    異構計算主要的優點有:

    一是可以讓各個計算單元執行自己最擅長的任務。術業有專攻,CPU、GPU、DSP、FPGA等計算單元各有所長,在引入特定計算單元,讓計算系統變成混合結構,就能讓CPU、GPU、DSP、FPGA執行自己最擅長的任務,並相對於同構計算可能有一定性能優勢,或性能功耗比優勢。

    二是可以避免顯式拷貝。最新的異構計算理論上要求實現CPU、GPU、DSP等計算單元實現內存統一尋址,使CPU、GPU等計算單元可以共享內存,不必將數據複製一份到對方的內存區域中。

    異構計算並非新概念,AMD、ARM等公司早已成立異構系統架構基金會 (HSA Foundation)。另外,異構計算在超算領域已經有一定的應用,而且已經有取代同構計算的發展趨勢。

    舉例來說,美國泰坦(每個計算節點由1個AMD Opteron 6274處理器和1個NVIDIA Tesla K20加速器組成),中國天河2號(每個計算節點由2個E5和3個Xeon Phi組成)。中國正在升級或建設的3臺100P超算也都採用異構計算。

    相對於上述提到泰坦和天河2號,由於CPU和加速器無法共享內存,會因為需要顯式拷貝而導致性能損失,最新的異構系統架構的優勢在於可以發展成統一的內存編制——在理論上,可以實現CPU、GPU、DSP等計算單元實現內存統一尋址,使各個計算單元交互數據時,不再需要將自身內存區域中現有的數據複製一份到對方的內存區域中,而是可以直接通過相同的地址訪問到,在內存和顯存的設計科學合理的前提下,實現性能提升。

    另外,在編程方面,可以避免顯式拷貝,使程式設計師們不用介入不同計算單元的內存管理,能有效降低編程的繁瑣程度。

    當然,理想很豐滿,現實很骨感——不同核心直接cache級別的互通始終是HSA架構無法攻克的難關——雖然AMD的APU通過將CPU和GPU集成到一個晶片上實現了共享內存。但CPU和GPU的Cache卻還沒有做到統一,不同核心直接cache級別的互通,而這也是HSA架構最大的技術難點(CPU,GPU,DSP的緩存模型不同)。即便AMD等廠商給HSA畫了非常美好的藍圖,但就現階段而言,HSA的優勢並不大。

    華夏芯的技術究竟如何?

    華夏芯未必能實現Cache級別的互通。

    在HSA方面,AMD顯然是最有發言權的廠商之一,但其APU也只實現了CPU+GPU,而且實現了內存共享,但CPU和GPU的Cache卻還沒有做到統一,而華夏芯言之鑿鑿,「該產品在架構層面成功整合了CPU、GPU、DSP,實現了異構多核的內存統一尋址,使不同內核真正無縫地緊密聯繫在一起,」一家初出茅廬公司的技術水平已經超越AMD這樣的老牌IC設計公司了,這實在令人難以置信,不知道AMD看到這段文字做何感想。

    華夏芯所謂「自主智慧財產權」存在水分

    根據《中國電子報》的報導,「華夏芯正在開發並即將推出的『統一處理器平臺』是全球首次推出完全支持HSA標準的CPU+GPU+DSP的處理器IP核平臺,它從指令集、微架構到工具鏈具有完全自主智慧財產權。」這段文字所蘊藏的消息實在讓人難以置信。

    雖然國內IC設計廠商推出了不少產品,但大多都是購買購買國外 IP核授權,或者就是國外晶片的馬甲,能做自主設計CPU或GPU或DSP的單位如鳳毛麟角,更遑論同時具備三者的設計能力。

    因此,筆者是不太相信一家在此之前從未聽聞,也沒有什麼技術積累的廠商,能橫空出世,並突然間同時具備CPU、GPU、DSP的設計能力。

    而自主指令集雖然實現難度並不大,比如深圳中微電就採用了自主指令集,但是由於不可能兼容現有的軟體生態,在商業化方面基本不具備市場前景。在黨政軍市場早已被龍芯、申威、飛騰等自主晶片瓜分完畢,武器裝備、人造衛星、航天設備等特殊領域的嵌入式晶片也已「名花有主」的情況下,採用自主指令集既不具備商業市場前景,也無法在黨政軍市場贏得一席之地。

    加上領導非常喜歡「自主智慧財產權」的因素,所謂「從指令集、微架構到工具鏈具有完全自主智慧財產權」很有可能有相當大的水分。

    宣傳言過其實

    就現階段而言,HSA的優勢並不明顯,還遠遠達不到「給計算性能以革命性的提高」的地步。

    而且就軟體而言,雖然APU統一尋址能方便編程,能使程式設計師們不用介入繁瑣的CPU-GPU內存管理,但《中國電子報》對華夏芯的報導中稱「任何程序都不必費心考慮不同處理器內核之間的存儲差異」——消除CPU、GPU、DSP、ASIC、FPGA等計算單元之間的存儲差異,即便是AMD也只能表示:「臣妾做不到啊!」

    國內在異構計算方面做得如何?

    雖然異構計算是老概念了,但由於現階段並不具備多少比較優勢,因而只在超算等為數不多的領域取得了明顯的成績,有取同構計算而代之的趨勢。

    相對於華夏芯這樣的處於紙面上的產品,上海高性能集成電路設計中心設計的國產眾核晶片則是比較成功的例子,該晶片有數個主核心和兩百餘個從核心,主核心主要負責邏輯運算,兩百餘個從核心可以使晶片擁有非常高的理論雙精浮點性能和良好的性能功耗比(小道消息稱10-15G/W),其峰值雙精度浮點運算速度超過每秒3萬億次(3TFlops),完全追平了Intel第二代Xeon Phi(也是Intel最好的眾核晶片)。

    結合《我國首個研究完全自主智慧財產權的異構計算處理器實驗室破繭》的新聞看,華夏芯通用處理器技術有限公司目前還處於草創階段,其官方網站也非常簡陋,除「成為國內嵌入式處理器領域擁有自主智慧財產權的一流設計企業」表示華夏芯主攻嵌入式處理器外,基本沒有任何有價值的信息,華夏芯現在有可能依舊處於草臺班子階段。加上「從指令集、微架構到工具鏈具有完全自主智慧財產權」需要非常深厚的技術積累,並非朝夕之間可以鑄就。

    筆者鬥膽推測,所謂「是全球首次推出完全支持HSA標準的CPU+GPU+DSP的處理器IP核平臺,它從指令集、微架構到工具鏈具有完全自主智慧財產權」有很大的水分,即將推出的產品很有可能就是一款集成了CPU+GPU+DSP的SOC,以目前華夏芯的公開資料和媒體的相關報導,華夏芯頗有套取政策之利的嫌疑。■

同类文章
銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

  今年,AMD銳龍7000系列筆記本處理器四種架構五大系列混雜,其中只有兩個系列採用了全新架構,其餘為舊款重製的馬甲型號,這可能讓不少普通消費者感到困惑,無從辨別哪一款才是全新的「Zen4」架構CPU。  最近,AMD向合作夥伴發布了新的材料,解釋稱當筆記本電腦上的橙色貼紙意味著它基於 Zen4
AMD品牌日來襲 京東11.11促銷火熱進行中

AMD品牌日來襲 京東11.11促銷火熱進行中

  隨著前兩天AMD京東11.11開門紅活動盛大開啟,豐富的AMD全線產品促銷盛宴讓廣大玩家激動不已,而活動仍然在火熱進行中,現已成功進入第二階段,更多驚喜的超值促銷等待著DIY玩家們的繼續參與。本次活動11月6日為AMD品牌日,活動熱力持續升級包含了直降秒殺、滿減、套包鉅惠、返E卡等豐富的活動豪禮

優異旗艦處理器還用矽脂?Intel這波可不夠良心

    Intel 在今年發布了全新發燒級的酷睿處理器i9,性能一下子有了不小的提升,玩家們也都開玩笑說道,多年來擠牙膏的 Intel 這次是擠多了。在性能提升的同時,玩家們還希望的就是 Intel 能夠放棄使用矽脂,不過先發售的i9-7900X並沒有做到。    在處理器的核心與頂蓋之間使用釺焊代
AMDQ1虧損超1億 賣X86技術給中國廠商

AMDQ1虧損超1億 賣X86技術給中國廠商

    Intel日前的財報表現還不錯,但為了轉型,依然要裁員1.2萬人。老對手AMD今天也發布了今年Q1季度財報,當季營收8.32億美元,下滑了19%,不出意外地還是虧損了1.09億美元,但與去年同期1.8億美元的虧損相比已經收窄,已經在改善業績了。對AMD來說,他們開闢新業務還是蠻成功的,AMD
國產新超算推遲?棄Intel換自主CPU

國產新超算推遲?棄Intel換自主CPU

    目前世界上最快的超級計算機的我國的「天河2號」,它每秒能完成5億億次運算,超算廣州中心主任尹學峰近日稱,天河2號利用率在60%,可見需求還是很廣泛。    剛剛,曙光公司總裁歷軍近日在接受記者採訪時表示,繼千萬億次超級計算機曙光「星雲」之後,「十億億次」超級計算機曙光7000已開始研發。  
Intel會推配備優異核顯Skylake-C嗎?

Intel會推配備優異核顯Skylake-C嗎?

    由於14nm工藝的延期及戰略調整,Intel今年的桌面版Broadwell處理器有些尷尬——比預定時間晚了一年,沒發布多久就碰上了Skylake處理器上市。但另一方面,Broadwell桌面版又非常讓人期待,因為它是首款配備128MB緩存優異核顯的桌面處理器,圖形性能比普通核顯強多了。考慮到
體驗14nm的魅力 Skylake主機配置推薦

體驗14nm的魅力 Skylake主機配置推薦

    伴隨著更多Intel 14nm Skylake處理器、面向主流玩家的B150晶片組主板上市開售,以及DDR4內存的售價逐漸步入廣大普通消費者能夠接受的範圍,大傢伙終於可以在不擔心「預算爆表」的前提下愉快的組一套新主機來體驗14nm工藝帶來的「快感」了。    為什麼要這麼說呢?因為在Inte
桌面Broadwell要停產?Intel:不可能!

桌面Broadwell要停產?Intel:不可能!

    Broadwell五代酷睿是Intel歷史上比較奇怪的一代產品,主要精力都放在了移動平臺上(當然還有下一步的伺服器),而桌面上只有區區兩款i7-5775C、i5-5675C,還都是直接從移動版移植過來的。    這倆稀缺之物還有一個與眾不同的亮點,那就是保留了GT3e Iris Pro核芯顯
散熱器損壞Skylake處理器:真的掰彎了

散熱器損壞Skylake處理器:真的掰彎了

    之前有消息稱Skylake處理器很可能因為PCB變薄導致大型散熱器損害處理器,本來以為這個問題只不過是示警,但現在已經有杯具案例了——已經有用戶的Skylake處理器真的變彎了,甚至主板插槽也變形了,這下可要真的注意了。此外,除了鐮刀、貓頭鷹之外,越來越多的散熱器廠商也表態了。    之前我
Intel確認:Skylake處理器存死機Bug

Intel確認:Skylake處理器存死機Bug

    雖然PC走勢漸弱,Intel也把精力開始投入到了虛擬實境、物聯網等領域,但談及2015最激動的事,Intel CEO前不久亮相CES時還是把榮耀頒給了Skylake處理器。    作為第六代酷睿,Skylake驚喜並沒有達到讓所有人眼前一亮,性能就不談了,上市後還被曝出像是i3 TDP弄錯、