優異顯卡HD7970:ALU團簇改為CU結構
2023-08-10 11:39:07 1
對照以往的產品,最新發布的優異顯卡HD7970 在Tahiti構架上最大的改進是來自ALU集群部分。與傳統AMD構架的VLIW結構ALU團簇不同,優異顯卡HD7970的Tahiti構架的ALU集群撤消了來自超長字節指令的限定,所有ALU全部以SIMD的形式來完成吞吐,不再需要打包和解包的過程。
在優異顯卡HD7970的Tahiti構架中,ALU團簇的名稱從VLIW SIMD變成了Compute Unit。這一名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。
據筆者了解,優異顯卡HD7970 Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以優異顯卡HD7970 Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。
優異顯卡HD7970 Tahiti構架CU結構細節
除了負責浮點吞吐的SIMD CORE之外,優異顯卡HD7970 Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。
運算單元之外,優異顯卡HD7970 Tahiti構架的每個CU還綁定了由Branch和Scheduler構成的二級線程控制機制,以及一個完整的Texture Arroy,Texture Arroy的作用與傳統AMD構架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
Intel Larrabee構架
由此不難看出,優異顯卡HD7970 Tahiti構架CU單元的結構在邏輯層面上已經與Fermi構架的SM單元和Larrabee的Vector Unit存在極大的相似性。三者均由浮點吞吐部分(優異顯卡HD7970 Tahiti的Vector ALU團簇,Fermi的SP單元集群,Larrabee的Vector集群),整數、特殊函數及原子操作部分(優異顯卡HD7970 Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二級線程控制機制(三方的Scheduler等)。除此之外,優異顯卡HD7970所擁有的CU還與Fermi的SM一樣擁有完整的Texture Arroy,甚至每一個運算單元(優異顯卡HD7970 Tahiti的Vector ALU,NVIDIA的SP單元)都擁有完全相同的4K寄存器。
優異顯卡HD7970 CU進行wavefront吞吐示意
優異顯卡HD7970內的一個CU就是一個獨立的處理單元,能夠面對一個標準的指令集群或者說線程塊,也就是AMD的wavefront。優異顯卡HD7970 Tahiti的CU能夠在一個周期內處理一個64線程的wavefront,這與Fermi一個周期處理一個32線程的warp是相同的。
優異顯卡HD7970 Tahiti支持WinZip最新版帶來的Open CL加速
優異顯卡HD7970採用的更新之後的CU單元在計算能力和效率方面有了長足的進步,不僅令優異顯卡HD7970的Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且讓優異顯卡HD7970在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。