一種兼容不同gpu的管理系統及其設計方法
2023-05-10 17:12:46
一種兼容不同gpu的管理系統及其設計方法
【專利摘要】本發明提供一種兼容不同GPU的管理系統及其設計方法,系統包括CPU晶片、南橋晶片、BMC晶片、PCIE插槽、排針、錯誤指示燈和手持終端;CPU晶片通過南橋晶片和BMC晶片連接,所述BMC晶片通過乙太網或串口與手持終端連接,PCIE插槽通過SMB總線與BMC晶片連接,BMC晶片同時與排針連接;錯誤指示燈通過錯誤指示信號線連接BMC晶片。本發明提供的管理系統中BMC晶片能夠智能地識別PCIE插槽上所插入的GPU板卡類型,並自動地調用相關的程序建立起與此GPU相適配的通信協議,實現BMC晶片對GPU板卡有效的管理。BMC晶片利用LPC總線能夠實現從BIOS中讀取GPU板卡信息;BMC晶片也能通過SMB總線讀取GPU板卡的信息;通過對比兩方面得到的信息,實現GPU板卡的監控管理、故障報警等功能。
【專利說明】一種兼容不同GPU的管理系統及其設計方法
【技術領域】
[0001] 本發明屬於計算機【技術領域】,具體涉及一種兼容不同GPU的管理系統及其設計方 法。
【背景技術】
[0002] NVIDIA公司在1999年發布GeForce256圖形處理晶片時首先提出GPU的概念。GPU 能夠從硬體上支持T&L(TransformandLighting,多邊形轉換與光源處理)的顯示晶片,因 為T&L是3D渲染中的一個重要部分,其作用是計算多邊形的3D位置和處理動態光線效果, 也可以稱為"幾何處理"。一個好的T&L單元,可以提供細緻的3D物體和高級的光線特效; 只不過大多數PC中,T&L的大部分運算是交由CPU處理的(這就也就是所謂的軟體T&L), 由於CPU的任務繁多,除了 T&L之外,還要做內存管理、輸入響應等非3D圖形處理工作,因 此在實際運算的時候性能會大打折扣,常常出現顯卡等待CPU數據的情況,其運算速度遠 跟不上今天複雜三維遊戲的要求。即使CPU的工作頻率超過3GHz或更高,對它的幫助也不 大,由於這是PC本身設計造成的問題,與CPU的速度無太大關係。
[0003] GPU (Graphic Processing Unit,圖形處理器),在現代計算機中應用得越來越廣, 一是應用在圖形處理領域,二是應用在HPC (High Performance Computing)領域。目前主 要有兩大產品系列Intel GPU和NVIDIA GPU。這兩種廠商的GPU帶外管理功能都可以採 用PCIE(PCI Express Bus)規範中定義的可選的SMBus總線作為帶外管理信號,但採用的 管理協議不同。
【發明內容】
[0004] 為了克服上述現有技術的不足,本發明提供一種兼容不同GPU的管理系統及其設 計方法,其中的BMC晶片能夠智能地識別PCIE插槽上所插入的GPU板卡類型,並自動地調 用相關的程序建立起與此GPU相適配的通信協議,實現BMC晶片對GPU板卡有效的管理。
[0005] 為了實現上述發明目的,本發明採取如下技術方案:
[0006] 本發明提供一種兼容不同GPU的管理系統,所述系統包括CPU晶片、南橋晶片、BMC 晶片、PCIE插槽、排針、錯誤指示燈和手持終端;所述CPU晶片通過南橋晶片和BMC晶片連 接,所述BMC晶片通過乙太網或串口與手持終端連接,所述PCIE插槽通過SMB總線與BMC 晶片連接,所述BMC晶片同時與排針連接;所述錯誤指示燈通過錯誤指示信號線連接BMC芯 片。
[0007] 所述CPU晶片與南橋晶片之間通過DMI2總線連接,所述南橋晶片與BMC之間通過 LPC總線連接。
[0008] 所述BMC晶片通過南橋晶片讀取BIOS中所檢測到的GPU板卡信息。
[0009] 所述BMC晶片採用SMB總線連接PCIE插槽的SMB總線針腳,對PCIE插槽上所插 入的GPU板卡進行管理。
[0010] 所述SMB總線包括SMB時鐘信號線BMC_SMB_CLK和SMB數據信號線BMC_SMB_SDA。
[0011] 所述排針用於標識GPU板卡類型,排針通過GPU板卡身份信號線GPU_TYPE_ID連 接BMC晶片的GPI0針腳。
[0012] 通過排針把GPU板卡身份信號GPU_TYPE_ID拉為高電平,表明PCIE插槽所插入板 卡為Intel GPU板卡;把GPU板卡身份信號線GPU_TYPE_ID拉為低電平,表明是NVIDIA GPU 板卡;所述BMC晶片則根據檢測GPU板卡身份信號線GPU_TYPE_ID的高低電平來判斷PCIE 插槽所插入的GPU板卡類型。
[0013] 所述排針的ΡΙΝΙ通過阻值為4. 7K歐姆的上拉電阻連接到3. 3V輔助電源;PIN2通 過GPU板卡身份信號線GPU_TYPE_ID連接到BMC晶片的GPI0針腳;ΡΙΝ3接地。
[0014] 本發明還提供一種兼容不同GPU的管理系統的設計方法,所述方法包括以下步 驟:
[0015] 步驟1 :在BMC晶片的程序資料庫中編寫適配於Intel和NVIDIA兩種GPU板卡的 監控程序;
[0016] 步驟2 :把編寫好的監控程序通過編譯工具生成二進位燒錄文件,燒錄進BMC晶片 的Firmware晶片;
[0017] 步驟3 :根據PCIE插槽插入GPU板卡的類型設置標識GPU板卡排針的電平;
[0018] 步驟4 :插入主板電源線纜,即主板存在輔助電源但未開機時,BMC晶片正常工作;
[0019] 步驟5 :BMC晶片通過GPU板卡身份信號線GPU_TYPE_ID檢測標識GPU板卡的排針 的電平;GPU板卡身份信號線GPU_TYPE_ID為高電平時調用Intel GPU板卡的監控子程序, 為低電平時調用NVIDIA GPU板卡的監控子程序;
[0020] 步驟6 :主板開機上電,使主板正常工作;
[0021] 步驟7 :主板開機完成後,BMC晶片與GPU板卡正常通訊,取得GPU板卡相關信息, BMC晶片通過LPC總線讀取主板BIOS和0S信息,從中得到GPU板卡的相關信息;
[0022] 步驟8 :BMC晶片對比分析來自兩方面的信息;若信息一致,BMC晶片持續監控GPU 板卡;若信息不一致,BMC晶片通過錯誤指示信號線ERR_C0NTR0L控制錯誤指示燈亮紅燈告 警,並通過乙太網絡或串口與手持終端通訊,以友好直觀的界面向用戶報警或者顯示監控 信息。
[0023] 與現有技術相比,本發明的有益效果在於:
[0024] 1) BMC晶片能夠智能地識別PCIE插槽上所插入的GPU板卡類型,並自動地調用相 關的程序建立起與此GPU相適配的通信協議,實現BMC晶片對GPU板卡有效的管理。
[0025] 2) BMC晶片利用LPC總線能夠實現從BIOS中讀取GPU板卡信息;
[0026] 3) BMC晶片也能通過SMB (System Management Bus)總線讀取GPU板卡的信息;通 過對比兩方面得到的信息,可以實現GPU板卡的監控管理、故障報警等功能。
【專利附圖】
【附圖說明】
[0027] 圖1是本發明實施例中兼容不同GPU的管理系統結構圖;
[0028] 圖2是本發明實施例中兼容不同GPU的管理系統設計方法流程圖。
【具體實施方式】
[0029] 下面結合附圖對本發明作進一步詳細說明。
[0030] 如圖1,本發明提供一種兼容不同GPU的管理系統,所述系統包括CPU晶片、南橋芯 片、BMC晶片、PCIE插槽、排針、錯誤指示燈和手持終端;所述CPU晶片通過南橋晶片和BMC 晶片連接,所述BMC晶片通過乙太網或串口與手持終端連接,所述PCIE插槽通過SMB總線 與BMC晶片連接,所述BMC晶片同時與排針連接;所述錯誤指示燈通過錯誤指示信號線連接 BMC晶片。
[0031] CPU晶片採用Intel公司的Haswell-EP CPU ;南橋晶片採用Intel公司的 Wellsburg C610 ;BMC 晶片採用 ASPEED 公司的 AST2400。
[0032] 所述CPU晶片與南橋晶片之間通過DMI2總線連接,所述南橋晶片與BMC之間通過 LPC總線連接。
[0033] 所述BMC晶片通過南橋晶片讀取BIOS (Basic Input Output System)中所檢測到 的GPU板卡信息。
[0034] 所述BMC晶片採用SMB總線連接PCIE插槽的SMB總線針腳,對PCIE插槽上所插 入的GPU板卡進行管理。
[0035] 所述SMB總線包括SMB時鐘信號線BMC_SMB_CLK和SMB數據信號線BMC_SMB_SDA。
[0036] 所述排針用於標識GPU板卡類型,排針通過GPU板卡身份信號線GPU_TYPE_ID連 接 BMC 晶片的 GPIO (General Purpose Input Output,通用輸入 / 輸出)針腳。
[0037] 通過排針把GPU板卡身份信號GPU_TYPE_ID拉為高電平,表明PCIE插槽所插入板 卡為Intel GPU板卡;把GPU板卡身份信號線GPU_TYPE_ID拉為低電平,表明是NVIDIA GPU 板卡;所述BMC晶片則根據檢測GPU板卡身份信號線GPU_TYPE_ID的高低電平來判斷PCIE 插槽所插入的GPU板卡類型。
[0038] 所述排針的ΡΙΝΙ通過阻值為4. 7K歐姆的上拉電阻連接到3. 3V輔助電源;PIN2通 過GPU板卡身份信號線GPU_TYPE_ID連接到BMC晶片的GPI0針腳;ΡΙΝ3接地。
[0039] 如圖2,本發明還提供一種兼容不同GPU的管理系統的設計方法,所述方法包括以 下步驟:
[0040] 步驟1 :在BMC晶片的程序資料庫中編寫適配於Intel和NVIDIA兩種GPU板卡的 監控程序;
[0041] 步驟2 :把編寫好的監控程序通過編譯工具生成二進位燒錄文件,燒錄進BMC晶片 的Firmware晶片;
[0042] 步驟3 :根據PCIE插槽插入GPU板卡的類型設置標識GPU板卡排針的電平;
[0043] 步驟4 :插入主板電源線纜,即主板存在輔助電源但未開機時,BMC晶片正常工作;
[0044] 步驟5 :BMC晶片通過GPU板卡身份信號線GPU_TYPE_ID檢測標識GPU板卡的排針 的電平;GPU板卡身份信號線GPU_TYPE_ID為高電平時調用Intel GPU板卡的監控子程序, 為低電平時調用NVIDIA GPU板卡的監控子程序;
[0045] 步驟6 :主板開機上電,使主板正常工作;
[0046] 步驟7 :主板開機完成後,BMC晶片與GPU板卡正常通訊,取得GPU板卡相關信息, BMC晶片通過LPC總線讀取主板BIOS和0S信息,從中得到GPU板卡的相關信息;
[0047] 步驟8 :BMC晶片對比分析來自兩方面的信息;若信息一致,BMC晶片持續監控GPU 板卡;若信息不一致,BMC晶片通過錯誤指示信號線ERR_C0NTR0L控制錯誤指示燈亮紅燈告 警,並通過乙太網絡或串口與手持終端通訊,以友好直觀的界面向用戶報警或者顯示監控 信息。
[0048] 最後應當說明的是:以上實施例僅用以說明本發明的技術方案而非對其限制,所 屬領域的普通技術人員參照上述實施例依然可以對本發明的【具體實施方式】進行修改或者 等同替換,這些未脫離本發明精神和範圍的任何修改或者等同替換,均在申請待批的本發 明的權利要求保護範圍之內。
【權利要求】
1. 一種兼容不同GPU的管理系統,其特徵在於:所述系統包括CPU晶片、南橋晶片、BMC 晶片、PCIE插槽、排針、錯誤指示燈和手持終端;所述CPU晶片通過南橋晶片和BMC晶片連 接,所述BMC晶片通過乙太網或串口與手持終端連接,所述PCIE插槽通過SMB總線與BMC 晶片連接,所述BMC晶片同時與排針連接;所述錯誤指示燈通過錯誤指示信號線連接BMC芯 片。
2. 根據權利要求1所述的兼容不同GPU的管理系統,其特徵在於:所述CPU晶片與南 橋晶片之間通過DMI2總線連接,所述南橋晶片與BMC之間通過LPC總線連接。
3. 根據權利要求2所述的兼容不同GPU的管理系統,其特徵在於:所述BMC晶片通過 南橋晶片讀取BIOS中所檢測到的GPU板卡信息。
4. 根據權利要求1所述的兼容不同GPU的管理系統,其特徵在於:所述BMC晶片採用 SMB總線連接PCIE插槽的SMB總線針腳,對PCIE插槽上所插入的GPU板卡進行管理。
5. 根據權利要求1或4所述的兼容不同GPU的管理系統,其特徵在於:所述SMB總線 包括SMB時鐘信號線BMC_SMB_CLK和SMB數據信號線BMC_SMB_SDA。
6. 根據權利要求1所述的兼容不同GPU的管理系統,其特徵在於:所述排針用於標識 板卡類型,排針通過GPU板卡身份信號線GPU_TYPE_ID連接BMC晶片的GPI0針腳。
7. 根據權利要求6所述的兼容不同GPU的管理系統,其特徵在於:通過排針把GPU板 卡身份信號GPU_TYPE_ID拉為高電平,表明PCIE插槽所插入板卡為Intel GPU板卡;把GPU 板卡身份信號線GPU_TYPE_ID拉為低電平,表明是NVIDIA GPU板卡;所述BMC晶片則根據 檢測GPU板卡身份信號線GPU_TYPE_ID的高低電平來判斷PCIE插槽所插入的GPU板卡類 型。
8. 根據權利要求6或7所述的兼容不同GPU的管理系統,其特徵在於:所述排針的ΡΙΝΙ 通過阻值為4. 7Κ歐姆的上拉電阻連接到3. 3V輔助電源;ΡΙΝ2通過GPU板卡身份信號線 GPU_TYPE_ID連接到BMC晶片的GPI0針腳;PIN3接地。
9. 一種兼容不同GPU的管理系統的設計方法,其特徵在於:所述方法包括以下步驟: 步驟1 :在BMC晶片的程序資料庫中編寫適配於Intel和NVIDIA兩種GPU板卡的監控 程序; 步驟2 :把編寫好的監控程序通過編譯工具生成二進位燒錄文件,燒錄進BMC晶片的 Firmware 晶片; 步驟3 :根據PCIE插槽插入GPU板卡的類型設置標識GPU板卡排針的電平; 步驟4 :插入主板電源線纜,即主板存在輔助電源但未開機時,BMC晶片正常工作; 步驟5 :BMC晶片通過GPU板卡身份信號線GPU_TYPE_ID檢測標識GPU板卡的排針的電 平;GPU板卡身份信號線GPU_TYPE_ID為高電平時調用Intel GPU板卡的監控子程序,為低 電平時調用NVIDIA GPU板卡的監控子程序; 步驟6 :主板開機上電,使主板正常工作; 步驟7 :主板開機完成後,BMC晶片與GPU板卡正常通訊,取得GPU板卡相關信息,BMC 晶片通過LPC總線讀取主板BIOS和OS信息,從中得到GPU板卡的相關信息; 步驟8 :BMC晶片對比分析來自兩方面的信息;若信息一致,BMC晶片持續監控GPU板 卡;若信息不一致,BMC晶片通過錯誤指示信號線ERR_C0NTR0L控制錯誤指示燈亮紅燈告 警,並通過乙太網絡或串口與手持終端通訊,以友好直觀的界面向用戶報警或者顯示監控
【文檔編號】G06F11/32GK104111886SQ201410290190
【公開日】2014年10月22日 申請日期:2014年6月25日 優先權日:2014年6月25日
【發明者】鄭臣明, 劉文君, 柳勝傑 申請人:曙光信息產業(北京)有限公司