全新英偉達CUDA 4.0令並行編程更輕鬆

2023-08-04 05:42:36 5

2011年2月28日—美國加利福尼亞州聖克拉拉市— 英偉達?（NVIDIA®）公司今天發布了最新版本的英偉達CUDA工具包。藉助該工具包，開發人員能夠開發出在英偉達GPU上運行的並行應用程式。

英偉達CUDA 4.0工具包旨在讓並行編程變得更加容易，並且讓更多開發人員能夠將應用程式移植到GPU上來。因此，該版本軟體包含下列三大特性:
?英偉達?（NVIDIA®）GPUDirect? 2.0技術 – 支持一臺伺服器或工作站內多GPU之間的點對點通信。這讓多GPU編程更加輕鬆並且能夠提升應用程式性能。
?統一虛擬尋址 (UVA) – 能夠為主系統內存和顯卡顯存提供一個合併的存儲器地址空間，讓並行編程變得更快、更容易。
?Thrust C++模板高性能基元庫 – 能夠提供一系列強大的開源C++並行算法和數據結構，這些內容能夠讓C++開發人員的編程工作變得輕鬆。與使用標準模板庫(STL)以及線程構件(TBB)時相比，通過利用Thrust，並行排序等例程的速度可提升5至100倍。

美國伊利諾伊大學厄本那香檳分校資深研究程式設計師John Stone表示：「統一虛擬尋址以及更快的GPU間通信速度讓開發人員能夠更加輕鬆地利用GPU的並行計算能力。」
Quantifi公司利率產品總監Peter Decrem指出：「人們可以通過標準模板接口利用GPU計算來為各種任務提升效率。能夠處理的任務從簡單的現金流生成到Libor市場模型、變額年金或CVA調整等複雜的計算，可謂是十分廣泛。Thrust C++庫通過處理存儲器存取和分配等低級功能，從而大幅降低了入門門檻，讓金融工程師在GPU增強性能的環境下能夠把精力集中到算法開發上來。」

英偉達CUDA 4.0架構版本包含大量其它特性與功能，其中包括:
?MPI與CUDA應用程式相結合 – 當應用程式發出MPI收發調用指令時，例如OpenMPI等改編的MPI軟體可通過Infiniband與顯卡顯存自動收發數據。
?GPU多線程共享 – 多個CPU主線程能夠在一顆GPU上共享運行環境，從而使多線程應用程式共享一顆GPU變得更加輕鬆。
?單CPU線程共享多GPU – 一個CPU主線程可以訪問系統內的所有GPU。開發人員能夠輕而易舉地協調多顆GPU上的工作負荷，滿足應用程式中「halo」交換等任務的需要。
?全新的NPP圖像與計算機視覺庫 – 其中大量圖像變換操作讓開發人員能夠快速開發出成像以及計算機視覺應用程式。
?全新、改良的功能
oVisual Profiler中的自動性能分析功能
oCuda-gdb中的新特性以及新增了對MacOS的支持
o新增了對C++特性的支持，這些特性包括新建/刪除以及虛擬等功能
o全新的GPU二進位反彙編程序

自2011年3月4日起，只需報名參加CUDA註冊開發者計劃，即可免費獲得英偉達CUDA Toolkit 4.0候選版，報名網址為: 。 CUDA註冊開發者計劃可提供豐富的工具、資源以及信息，讓並行應用程式開發人員能夠最大限度地發揮英偉達CUDA技術的潛力。