帶有gpu的計算機系統的製作方法
2023-10-11 09:37:24 1
專利名稱:帶有gpu的計算機系統的製作方法
技術領域:
本實用新型涉及計算才幾系統,特別涉及帶有GPU的計算機系統。
背景技術:
科學計算特別是超級計算在當今的科學研究、工程應用乃至經濟社會 管理中發揮著愈來愈重要的作用。隨著計算機技術的不斷發展,高性能計 算機的發展也是日新月異,其峰值計算能力不斷呈現跨越式發展的趨勢。 目前主流的高性能計算機主要通過基於通用處理器CPU的結點機構建, 在各個結點機內,通過提高CPU主頻或增加CPU核的數目來增強結點機
的計算能力,進而提高整個高性能計算機的計算能力。
在2007年底,隨著圖形加速卡(Graphic Processing Unit, GPU )在傳 統高性能計算領域中的應用,GPU以其較CPU更強大的計算能力、內存 訪問帶寬以及更好的性價比而受到越來越多的青睞。以NVIDIA公司出品 的專門用於科學計算的TeslaC1060 GPU加速卡為例,該GPU加速卡具有 多達240個的計算核心,單精度理論峰值約是933 Gflops,內存訪問帶寬 是102 GB/s,而目前比較高端的Intel 3.0GHz的雙核處理器單精度計算的 理論峰值只能達到48 Gflops,內存訪問帶寬最高也就達到約10GB/秒,兩 者性能上的差異達幾十倍甚至上百倍。利用GPU構建高性能計算機群在 成本上也有很大的降低,如使用CPU構建同等性能的計算機集群,價格 至少是GPU加速卡的幾十倍,因此GPU相對於CPU具有很高的性價比。 此外,由於佔地面積的減小以及耗電的減少,GPU在使用過程中的運行成 本也會比基於CPU的高性能集群系統低很多。使用GPU還能減少對環境 的影響,如噪聲和輻射等都會相應降低。
在現有技術中,已經存在一.些利用GPU構建的相關設備,如NVIDIA 公司推出的S1070系統。該系統在1U (U代表機架式伺服器的機箱高度, 1U=44.5 mm )的空間內安裝了四塊GPU加速卡,用以實現計算才幾的加速運 算。但S1070系統並不能獨立工作,只有將S1070系統通過專用線纜連接到 常見的計算機上以後才能在計算機控制下進行相應的工作。
實用新型內容
本實用新型的目的是提供一種具有強大浮點計算能力與高性價比的
帶有GPU部件的計算機系統。
為了實現上述目的,本實用新型提供了一種計算機系統,包括CPU 以及安裝有GPU部件的主板;所述主板上包括有一個或多個PCI-Express X16插槽,所述插槽之間的距離不小於40毫米,所述GPU部件通過所述 插槽安裝到所述主板上。
上述技術方案中,所述插槽採用開口方向與主板平面平行的橋接卡。
上述技術方案中,所述主板包括至少一個北橋晶片,所述北橋晶片至 少支持36條PCI-Express通道連接。
上述技術方案中,所述CPU至少有一個CPU核心對應所述GPU部件 中的一個GPU核心。
上述技術方案中,還包括電源,所述電源為大功率電源,所述電源直 才妄與所述GPU部件連接。
上述技術方案中,所述電源釆用多個12V的6pin和8pin接口與所述 GPU部件連接。
上述技術方案中,還包括專用於所述GPU部件的散熱裝置,所述散 熱裝置安裝在正對所述GPU部件的位置。
上述技術方案中,所述GPU部件包括顯示卡或圖形加速卡。
本實用新型還提供了一種超級計算機系統,包括多個通過網絡互聯的 所述計算機系統。
本實用新型的優點在於
本實用新型具有很強的浮點計算能力與高性價比。
圖1為本實用新型的計算機系統在一個實施例中的結構圖; 圖2為本實用新型的計算機系統在另一個實施例中的結構圖。
具體實施方式
以下結合附圖和具體實施方式
對本實用新型做進一步說明。 本實用新型的帶有GPU的計算機系統在現有計算機系統的基礎上,添加了 GPU部件,並針對GPU部件的要求對現有計算機系統加以改進。 下面將結合具體的實例對本實用新型的計算機系統的組成做詳細說明。
本實用新型的計算機系統包括主板、CPU、硬碟、內存、電源、顯示 器,還包括有GPU部件。如圖1所示,所述的CPU、 GPU、內存都安裝 在所述主板上,而所述硬碟與電源都與主板連接,從而形成計算機系統。
現有技術中的GPU部件可以分為兩類, 一類是高端的顯示卡,如 NVIDIA的Geforce系列的顯示卡以及AMD的Radeon系列的顯示卡;另 一類是專門用於高性能計算的圖形加速卡,如NVIDIA的Tesla系列的GPU 加速卡和AMD的Firestream系列的GPU加速卡。無論是上述何種類型的 GPU部件,都可應用於本實用新型的計算^li系統。
GPU部件通常利用主板上現有的PCI-Express X16插槽安裝到主板 上。由於GPU部件中配置了數量眾多的計算核心和大容量的高速顯存, 其計算發熱量大,需要在GPU部件中配備專門的散熱模塊,因此GPU部 件的體積較現有計算機系統中所使用的顯卡的體積更大。以NVIDIA 7〉司 的Geforce GTX295顯示卡為例,該顯示卡的外形尺寸的長、寬、高約是 267 x 37 x 111 mm,其長度大於常見的微型計算機主板的長度,而其寬度 也要佔據主板上兩個插槽的寬度。因此,若直接將現有計算機系統中的主 板應用於本實用新型的計算機系統中,則這些主板無法滿足GPU部件的 安裝要求。
要將GPU部件安裝到主板上,本實用新型的計算機系統中的主板應 當滿足以下條件PCI-Express X16插槽間的距離為常見插槽間距的兩倍, 即不小於40mm;主板上PCI-Express XI6插槽的數量應當儘可能的多,以 安裝更多的GPU部件,提供更高的性能。考慮到目前主板上的每個北橋 晶片最多只能支持36條PCI-Express通道連接,如果計算機上所配置的 GPU部件超過兩個,則每個GPU部件實際利用的PCI-Express 4妄口位寬小 於16個通道。因此在一種優選實現方式中,如果計算機上所配置的GPU 部件超過兩個,可以在主板上再增加一個北橋晶片,以提高PCI-Express 通道的傳輸帶寬。
將GPU部件安裝到主板上時,可以如圖l所示,將所述GPU部件以 垂直於主板平面的方式插到PCI-Express X16插槽內。但採用此種方式安 裝時,由於GPU部件本身的高度接近3U,因而提高了整個計算機系統的 整體高度,使得系統高度達到3U或4U。計算機系統高度的增加,意味著
5在有限安裝體積下所能安裝的計算機系統就會減少,從而降低集成度。例
如, 一般伺服器機拒的高度為42U,若一臺計算機的高度為4U,則在該服 務器機拒內最多可以安裝10臺這樣的計算機,但若計算機的高度能夠減 少到2U,則伺服器機拒內所能安裝的計算機可以達到21臺,可見,同樣 的佔地面積,計算機系統的高度越小,則伺服器機拒中所能集成的計算機 系統就越多。為了降低計算機系統的整體高度,在一種優選實現方式中, 在將GPU部件安裝到主板上時可採用PCI-Express橋接卡,PCI-Express 橋接卡上的插槽的方向平行於主板平面,因此當將GPU部件插入所述插 槽內時,如圖2所示,所述GPU部件的方向與主板平面平行,從而使得 整個計算機系統不受到GPU部件本身高度的影響。在將GPU部件水平安 裝後,可將整個計算機系統的高度降低到2U。
在本實用新型的計算機系統內,計算機系統的計算能力主要由GPU 部件提供,而非CPU。所述CPU在本實用新型的計算機系統內主要起到 調度GPU運行的功能。因此,對計算機系統中所採用的CPU的配置要求 不高,只要滿足每個GPU核心對應有一個CPU核心即可,而所採用的CPU 的主頻的高低也不會對計算機系統的性能產生影響。由於當前在單臺計算 機上一般最多能安裝4個GPU部件,因此,為了提升計算機的計算性能, 可以採用包含有雙GPU核心的GPU部件,如帶有雙GPU核心的GPU加 速卡,從而使得單臺計算機上所具有的GPU核心超過四個。例如,使用 三至四個包含雙GPU核心的加速卡,如NVIDIA的GTX295或AMD的 HD4870X2。為了與此類GPU部件相適應,計算機系統中可以使用兩個 四核的CPU,或者可以使用支持超線程的四核CPU來虛擬8個CPU核心, 如Intel最新平臺Nehalem的17系列的處理器。
由於本實用新型中所採用的GPU部件的功率較大,如NVDIA公司的 GeforceGTX295單卡的最大功率達到289W,與一臺普通個人計算機的整 機功率相近,因此,本實用新型的計算機系統無法通過單獨使用主板上的 PCI-Express來為所述的GPU部件供電,需要為GPU部件提供額外的電能。 在本實用新型中,可通過計算機上的電源直接為GPU部件供電,考慮到 GPU部件上一般提供有一個或兩個12V的6PIN或8PIN外界電源接口 , 因此本實用新型的計算機系統中所採用的電源應當包括有6PIN和8PIN的 接口,且所用電源為大功率電源。所述電源的功率大小與計算機系統內所 配置的GPU部件的個數有關,在一個實例中,若計算機系統內配置有一
6塊GPU部件,則所述電源的功率在650 W左右,若計算機系統內配置有 兩塊GPU部件,則所述電源的功率在1000 W左右,若計算才幾系統內配置 有三塊GPU部件,則所述電源的功率在1200 W左右,若有四塊GPU部 件,則所述電源的功率在1500 W左右。
本實用新型的計算機系統內的GPU部件具有很高的散熱量,因此需 要在計算機機箱內為GPU部件配備專門的散熱裝置。在圖1和圖2的示 例中,都在機箱內正對GPU部件的位置安放一排12V的大流量、高轉速 的冷卻風扇,直接將冷空氣導入到GPU部件的吸風口 ,從而實現了對GPU 部件的散熱。所述風扇的供電來自主板上的風扇電源接口 ,通常GPU部 件內都配有溫度探頭,因此可以根據GPU部件自身的溫度在系統主板的 BIOS裡設置調控風扇供電電流的大小,乂人而根據GPU部件的溫度自動調 控冷卻風扇的轉速。
本實用新型的計算機系統既可以工作在Windows作業系統下,也可以 工作在Linux系統下。但在使用GPU部件時,還要配置相應的運行環境才 能做高性能的計算。所述運行環境的配置與GPU部件的生產廠家有關, 不同的GPU部件有不同的運行環境。例如,NVIDIA公司出品的GPU加 速卡,需要採用CUDA (compute unified device architecture)開發環境。 AMD公司的GPU力口速卡,需要4吏用Brook+或者CAL( compute abstraction layer)流處理開發。
本實用新型的計算機系統既可以作為個人桌邊的具有強大計算性能的 超級計算機使用,也可以作為超級計算系統的結點機使用。作為超級計算系 統的結點機時,可通過主板上集成的乙太網卡將多個計算機系統互聯起來, 從而構建百萬億次或千萬億次的超級計算系統。特別的,通過集成有 Infiniband網卡的系統主板或在主板上富餘的PCI-E插槽中安裝Infiniband網 卡,可以實現各結點機之間基於Infiniband網絡的高速互聯,獲得更高的通 信帶寬,從而提升超級計算系統的性能。如對於帶有四個雙槽位間距的 PCI-Express X16插槽的主板,如果作為個人桌邊的超級計算機或利用集成 的千兆乙太網網卡互聯成超級計算系統,可以給每個計算機內配置四個GPU 加速卡,而如果要利用Infiniband網絡以該計算機作為結點機構建超級計算 系統,則每個節點最多只能配置三塊GPU加速卡,留下一個PCI-Express 插槽安裝Infiniband網卡。
最後所應說明的是,以上實施例僅用以說明本實用新型的技術方案而非限制。儘管參照實施例對本實用新型進行了詳細說明,本領域的普通技術人 員應當理解,對本實用新型的技術方案進行修改或者等同替換,都不脫離本 實用新型技術方案的精神和範圍,其均應涵蓋在本實用新型的權利要求範圍 當中。
權利要求1、一種計算機系統,其特徵在於,包括CPU以及安裝有GPU部件的主板;所述主板上包括有一個或多個PCI-Express X16插槽,所述插槽之間的距離不小於40毫米,所述GPU部件通過所述插槽安裝到所述主板上。
2、 根據權利要求1所述的計算機系統,其特徵在於,所述插槽採用開口方向與主板平面平行的橋接卡。
3、 根據權利要求1所述的計算機系統,其特徵在於,所述主板包括至少一個北橋晶片,所述北橋晶片至少支持36條PCI-Express通道連接。
4、 根據權利要求1所述的計算機系統,其特徵在於,所述CPU至少有一個CPU核心對應所述GPU部件中的一個GPU核心。
5、 根據權利要求1所述的計算機系統,其特徵在於,還包括電源,所述電源為大功率電源,所述電源直接與所述GPU部件連^^。
6、 根據權利要求5所述的計算機系統,其特徵在於,所述電源採用多個12V的6pin和8pin接口與所述GPU部件連接。
7、 根據權利要求1所述的計算機系統,其特徵在於,還包括專用於所述GPU部件的散熱裝置,所述散熱裝置安裝在正對所述GPU部件的位置。
8、 根據權利要求1所述的計算機系統,其特徵在於,所述GPU部件包括顯示卡或圖形加速卡。
9、 一種超級計算機系統,其特徵在於,包括多個通過網絡互聯的所述權利要求1-8之一的計算機系統。
專利摘要本實用新型提供一種計算機系統,包括CPU以及安裝有GPU部件的主板;所述主板上包括有一個或多個PCI-Express X16插槽,所述插槽之間的距離不小於40毫米,所述GPU部件通過所述插槽安裝到所述主板上。本實用新型具有很強的浮點計算能力與高性價比。
文檔編號G06F15/16GK201435029SQ20092010938
公開日2010年3月31日 申請日期2009年6月23日 優先權日2009年6月23日
發明者何險峰, 博 李, 李曦鵬, 李靜海, 王小偉, 蔚 葛, 陳飛國 申請人:中國科學院過程工程研究所