NVIDIA Tesla K80:怪物級雙芯計算卡
2025-05-02 03:52:26
泡泡網顯卡頻道11月18日 新一屆高性能計算大會召開,中國的「天河二號」勇奪全球超級計算機性能四連冠,各大廠商也都趁機紛紛推出了各自的重磅新品。先來看NVIDIA的怪物級計算卡:Tesla K80。
Tesla K系列都是基於「克卜勒」(Kepler)架構的高性能計算產品,其中採用GK110大核心的已有三款,而今天這款Tesla K80,從各個方面都進行了前所未有的增強。
首先,她的核心是新的GK210。
GK110核心第一次用於高性能計算是Tesla K20,只開啟了2496個流處理器,經過一次修訂後升級為GK110B,先後推出了2688個流處理器的增強版Tesla K20X、2880個流處理器的完整版Tesla K40,後者還提供了三個檔次的核心頻率。
GK210則是NVIDIA第一次對某個核心進行中途修改,最大的變化就是寄存器文件、一級緩存容量都翻了一番,分別來到512KB、128KB,不過整體架構沒變,還是2880個流處理器、384-bit位寬,製造工藝也依然是臺積電28nm,但電晶體數量理論上應該比71億個更多了。
寄存器文件、一級緩存增大後,可以明顯改進流處理器陣列內的數據吞吐能力,工作更高效,尤其適合高性能計算。這顯然是一次針對性的重新設計。
可怕的是,Tesla K80一次就用了倆GK210核心,而上次的雙芯計算卡還是Tesla K10,當時用的是倆小核心GK104。
不過可以理解的是,如此龐大的兩個核心很難全速開動,每一個都只開啟了15組流處理器陣列中的13組,也就是總共2496×2=4992個流處理器,相當於Tesla K20翻了一番。
核心頻率也定得很低,只有562MHz,但是第一次支持GPU Boost動態加速了,最高可達875MHz。顯存是兩組384-bit 12GB GDDR5,總計達24GB,但頻率也不是很高,只有5GHz。
這一切都是出於功耗的妥協。Tesla K20X/K20已經達到235W,而雙芯的Tesla K80在一番折騰後,仍控制在了300W,並且保持了雙插槽的身材,但需要使用被動散熱,由系統風扇帶走熱量,主動散熱版暫時沒有。
性能方面自然可期,官方宣稱FP32單精度、FP64雙精度浮點性能最高分別可達2.91TFlops(萬億次浮點)、8.74TFlops(比例還是1:3),比此前提高了74%,但這只是最大加速理論性能,實際上會低一些。
1U標準機架內可以放入最多四塊Tesla K80,雙精度性能可超10TFlops。
根據情況不同,Tesla K80的效率提升幅度最好59%,最差2%。
Tesla K80的售價高達5000美元,但其實比單芯Tesla K40 5500美元的首發價格便宜了很多,不過後者現在已經降至3900美元。
目前,全球性能第十的Cray CS-Storm,以及戴爾、惠普、廣達的高性能計算系統都已經配備了Tesla K80。■