將GPU計算全面普及!中科院研究員專訪
2023-10-07 14:00:47 4
泡泡網顯卡頻道12月15日 2011年12月14-15日NVIDIA在北京國家會議中心舉辦亞洲GTC(GPU Technology Conference),這也是2011 NVIDIA GTC大會最後的一場會議,大會邀請了來自世界各地、各個領域的資深程式設計師、研究人員以及思想領袖。在會上編輯對中國科學院過程工程研究所研究員、超級計算系統項目負責人葛蔚進行了專訪。
中國科學院過程工程研究所研究員、超級計算系統項目負責人——葛蔚,主要從事化工過程中複雜多相系統的計算機模擬與理論分析。提出並發展了結合微觀粒子模擬中軟、硬粒子模型的擬顆粒模擬,以此為工具揭示了氣固流態化、氣液鼓泡流動和微流動等系統中多種控制機制協調形成穩定性條件的機理,檢驗並擴展了多相複雜系統分析型多尺度方法。從問題、軟體與硬體結構一致性的角度提出了多尺度離散模擬通用軟體平臺及其專用硬體平臺的設計思想,申請和獲得多項國家發明專利。
編輯:可否簡單為大家介紹一下,在眾多利用到NVIDIA通用計算技術的工程項目中,最典型的案例是什麼?
葛蔚研究員:在某鋼廠的煉鋼處理過程中會產生大量的廢鋼渣,過多的廢鋼渣無法被充分利用起來,而實際上這些副產品在經過處理之後可以用作鋪路等其他用途。之前的處理方法並不科學,後來通過利用NVIDIA工作站進行模擬的運算,研發出了一種新的處理方法,提升了鋼渣處理的速度以及品質。使最終處理出來的鋼渣,在重新利用時質量更加穩定。最終真正為企業提升了生產力和利潤。
編輯:程式設計師採用GPU環境進行編程時,會不會有一些不習慣?
葛蔚研究員:一開始肯定會不習慣,比如你新換了個新手機,需要用些時間適應。既然CUDA能夠達到很好的效率,那麼它必然也是滿足你的需求,而且用時間長了,你還會覺得以前在CPU環境下進行編程才是真的難用,很多複雜需求根本無法在CPU環境下來實現。
實際上不習慣主要是心裡上的不習慣,用慣了CPU環境下的編程,忽然轉到功能更全的GPU環境肯定不適應。就好比我用慣了諾基亞,突然給我一個iPhone,我肯定不適應,適應了之後會覺得iPhone很不錯。所以說一開始不習慣主要體現在熟悉的過程,並不是在GPU環境下編程不好用。
編輯:您認為NVIDIA的超級計算機解決方案和其他家相比最大的優勢在什麼地方?
葛蔚研究員:之前IBM的Cell方案較為封閉,並不是一個很開放的體系,大家如果想用只能全套買IBM的產品,整套成本相當高,不利於大規模的普及。我們曾經購買過PS3並利用它進行運算,難度非常大最終還是放棄了,這也是一種自然的選擇,哪個好用用哪個。目前37套基於GPU的超級計算機,有35套採用了NVIDIA的GPU,這也是NVIDIA從軟體到硬體整體對用戶的支持相當到位。
編輯:您目前自己用的工作站是什麼配置呢?
葛蔚研究員:我們主要的工作站採用的泰安主板最多能安裝8個GPU,每個節點實際安裝6個GPU是機架式的伺服器。其他的就是之前從聯想和惠普採購的工作站,我們最早的工作站用的是惠普XW8600安裝的GTX295。目前我們的團隊越來越大,我們打算將最早的工作站發到個人手裡。之前NVIDIA也在宣傳希望將GPU的計算技術推廣到個人用戶中,這次終於先在我們這裡實現了。
編輯:目前超級計算機的發展瓶頸在哪?需要在哪方面進行突破?
葛蔚研究員:有三方面:應用、可靠性以及能耗,第一在應用方面,運算能力可以通過硬體的堆砌來完成,但應用程式不能完全利用到所有節點,這種問題不能單靠硬體方面的人來考慮,也需要編程人員來一起想辦法來解決。
第二在可靠性方面,這麼多節點同時運作故障的概率相當大,一定要有容錯的機制,軟體硬體都需要容錯機制。單一的臺式機不會考慮最終的結果算錯了怎麼辦,但超級計算機就要考慮這一問題了,總不能算到最後前功盡棄。
最後就是能耗方面,超級計算機由於節點眾多,能耗問題不容忽視。如果單純用CPU環境來實現目前的排行第一的超級計算機,那麼只能用核電站來支撐其功耗,顯然此種方法得不償失。■