GTX550Ti廉頗老矣 HD7750能否擔當28nm時代殺手
2023-08-10 14:09:58 2
尋找28nm時代最合理GPU
絕對性能長久以來成為我們衡量顯卡的唯一標準,所以AMD和NVIDIA的卡皇之爭從來都不缺少觀眾與喝彩,不過衡量大多數DIY玩家的購買力之後,我們才深刻認識到動輒2000到3000元卡皇僅是少數人的玩物,而不是一款真正適合運行遊戲的超值顯卡。
從Radeon HD 3800和Geforce GTX 8000系列開始,由於DirectX 10時代著色器Shader計算壓力的不斷提升,AMD和NVIDIA兩大廠商不約而同地採用統一GPU渲染管線,同時輔以大量的緩衝資源和更大規模的顯存控制器。這種升級提升了視覺效果,帶來了更加自由的3D特效,但是也極大程度上增加了GPU的電晶體集成度,我們看到了一個又一個龐然大物。綜合研發成本、用戶需求、製作工藝等因素考慮,兩家GPU廠商都認為設計一個成本、功耗、性能合理的GPU更符合當時的要求,同時GPU代工廠商臺積電TSMC也在尋求不斷突破,滿足GPU對於電晶體近乎饑渴的要求。
AMD與TSMC臺積電向來有很好合作
在2007年AMD實施了「Sweet Spot」計劃,側重製造一款玩家買得起的高性能顯卡,第一款產品是Radeon HD 3870,其後AMD的Radeon HD 4870/4850可以說是「Sweet Spot」計劃中的第二代產品,它們強大的性能,合理的價格受到用戶的好評。在這之後,AMD更加注重每一代GPU架構全部產品線的建設,特別是在Radeon HD 5000時代,從400元的HD 5450到4000元的HD 5970,每一個性能檔次都有高性價比的AMD顯卡。
全新GCN圖形體系帶來更好DirectX 11性能
一轉眼我們來到了2012年,這並不是世界末日,也不是少數廠商建立壟斷的時候,而是一個新架構和新工藝同時到來的年代。公元2012年1月9日,經過了艱難的研發和不斷調優,被全球媒體譽為顛覆性架構的AMD全新GCN圖形體系終於誕生了第一個產品,旗艦級Radeon HD 7970終於來了。在迎來優異顯卡HD 7900系列之後,價格稍低的高端顯卡HD7800也順利上市,而在千元級價位讓眾多國內玩家眾望所歸的HD 7700顯卡在今年4月正式來到大陸市場。
定位在800元以下人民幣市場的HD7750顯卡
作為28nm工藝迄今為止最小的核心,Radeon HD7750顯卡代號Cape Verde,這顆核心更加小巧緊湊,成本更加合理和可控。作為應對中端市場需求的產品,它的售價相對來說也更加低廉,中國區官方定價在799元附近。對於一顆核心面積更小的GPU來說,既要保證合理的性能,還要控制發熱和耗電,只有這樣才能把價格控制在用戶能夠接受的範圍之內,Cape Verde核心在中國可是背負了不小的壓力。
HD7750為何在中國區又現特供
面對競爭對手在上一代發布的Geforce GTX550Ti顯卡,AMD本次發布的Cape Verde核心Radeon HD7750顯卡在晶片規模方面控制更加合理,由此帶來的優勢是功耗比對手要低20W以上,散熱和PCB設計也更加輕鬆自如。那麼如何藉助TSMC 28nm工藝和GCN架構的優勢來提升產品性能?AMD選擇了為中國用戶提供更好的做工並提升額定頻率這條最為直接快捷的道路。
HD7750在國外的頻率僅為800/1125MHz
在很多玩家的印象中,千元以下級別的顯卡在性能方面值得期待,但是其性能增值服務並不是重點,因為成本方面的嚴格限制,很多顯卡在供電和PCB方面縮水嚴重,在額定頻率下平穩運行而不考慮性能提升潛力,成為晶片廠商和板卡廠商熟悉的默契。因為其定位原因,Radeon HD7750顯卡在誕生之初也面臨這種尷尬,供電不足和散熱器熱容量較小讓Cape Verde核心無法有效發揮。
中國區HD7750擁有更高頻率
HD7750國外發布上市的版本默認核心/顯存頻率為800/1125MHz;也就是說,國內發售的版本已經在核心頻率上得到了較明顯的提高。經AMD介紹,他們憑藉多年對國內市場的了解,經過反覆論證,最終決定特別針對國內市場推出具備更高頻率的HD7750,從而為消費者帶來更高性價比的選擇。實際上HD7750也將是AMD在國內的主推產品。
HD7700系列顯卡定位清晰
中國版HD7750可以說是一款獨具匠心的特供顯卡,它擁有512個流處理單元、32個紋理單元以及16個光柵單元。它和更高一個級別的HD7770顯卡均配備了1GB容量的GDDR5顯存,顯存位寬同為128-bit。國內上市的HD7750的默認核心/顯存頻率達到了900/1125MHz,核心頻率相對國外版已經有了顯著提升,而顯存頻率則保持了一致。
HD7750之所以具備更高的默認運行頻率,其主要底氣來源於PCB版型從過去的單槽無外接供電轉變成了HD7770公版方案,特別是6-PIN供電的加入讓這款顯卡具備更深的超頻潛能,GPU在高頻之下運行能夠獲得更加充沛的電力保障,這讓新的HD7750大陸版性能較之過去又有了不小的提升。
中國區HD7750和HD7770供電設計完全一樣
我們知道顯卡PCI-E插槽擁有至少75W的供電能力(現在普遍的PCI-E 2.0對這一供電進一步提升到150W左右),而Cape Verde核心在800MHz頻率下運行是不需要外接供電的,但是當頻率提升到900MHz甚至1GHz,就必須要有獨立的6-pin供電來提供新增的75W電力,這一點從海外版HD7750超頻能力受限已經得到了驗證。在供電元件方面,海外版HD7750採用2+1+1項供電方案,而中國版HD7750採用3+1+1項供電方案,GPU晶片在高頻下可以獲得強大且純淨的電流支持,超頻空間進一步擴大。
依靠優勢架構換取更高效率
Radeon HD 7750所使用的GCN架構特色由以下幾個主要的部分組成,它們共同作用提升了GPU在著色器計算和幾何計算方面的性能,其中最有看點的就是AEC引擎和全面向量化的ALU計算單元:
GCN架構特色總覽
1、基於HKMG的TSMC全新28nm工藝,頻率可以得到更輕易提升。
2、包含了幾何引擎、光柵化引擎以及一級線程管理機制的前端ACE( Asynchronous Compute Engine),長期以來成為瓶頸的GPU幾何處理能力將得到突破。
3、負責處理運算任務及Pixel Shader的8個CU(Compute Unit)集群,包含在CU內部負責處理材質以及特種運算任務如卷積、快速傅立葉變換等的Texture Array,二級線程管理機制以及與它們對應的Shared+unified Cache等緩衝體系。
Radeon HD7750顯卡GPU架構分布
Radeon HD 7750顯卡使用的Cape Verde核心擁有8組CU單元,合計512個向量ALU。由於與CU單元綁定這一特性,Cape Verde擁有了32個TA/TMU單元。作為一款中端顯卡,其後端由4組ROP單元組成,每組擁有4個ROP單元,合計可以在一個周期內完成16個光柵化操作。顯存控制器方面則由2個64bit MC構成128bit顯存總線,每個MC對應256K的L2 Cache,這個數值是旗艦級的HD7900系列的2倍。
上述這些特性,讓Cape Verde核心擁有了Tahiti這一AMD當前旗艦級構架31%的ALU規模,50%的ROP規模,66%的L2 cache規模以及27%的顯存帶寬資源,這種資源組合得到的結果是Radeon HD7750擁有更高的單個流處理器執行效率。按照AMD的說法,在1920X1080解析度下Cape Verde的性能是優秀的,更高的解析度和更大的AA設置會導致更多地性能下降,但作為一款中檔顯卡來說,這種下降是可以接受的。
Radeon HD 7750顯卡的核心計算單元ALU團簇的名稱從VLIW SIMD變成了Compute Unit,名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。
Radeon HD7750架構CU單元結構細節
除了負責浮點吞吐的SIMD CORE之外,Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。更新之後的CU單元在計算能力和效率方面有了長足的進步,不僅令Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。
28nm新工藝成為HD7750最堅實支撐
在新工藝的採用方面,AMD一直走在NVIDIA前面,在2010年AMD已經透露出希望能夠成為業界首個推出28nm工藝圖形處理器的廠商,也就是說AMD希望在28nm節點工藝上能夠再次領先其老對手NVIDIA,就如同之前在向90nm, 80nm, 65nm, 55nm以及40nm節點工藝過渡時那樣。藉助今年初Radeon HD 7970顯卡的成功上市,AMD實現了這個期待,而28nm工藝帶給晶片神奇般的性能提升,也是超乎用戶和媒體意料之外的。
TSMC 28nm工藝生產的AMD GPU晶片
通過先進的28nm high-k metal gate (HKMG)工藝,AMD Radeon HD 7750顯卡將能夠進一步提升性能,同時在改進功能的同時也可以進一步降低功耗以及產品成本。同時AMD公司預計其風險也可以得到很好得控制,顯卡默認頻率能夠輕鬆站上1GHz大關,並且擁有足夠的再超頻空間。
工程師與晶片晶圓合影
TSMC的28nm HKMG工藝引入了諸多先進的製造方式以及技術,工藝進步所帶來了更小的節點尺寸以及與之對應的更低的亞閥電壓,不僅更好的控制了晶片的整體發熱和功耗,更可讓晶片面積大幅縮小超過40%,這對於晶片的可製造性有極大的幫助。除了更小的刻線寬度以及對應的更低的亞閥電壓,本次TSMC採用的28nm HKMG工藝還有三個非常值得關注的重要改進,分別是High-K(高介電常數)材料的引入,GateLast(後柵)處理,以及nMOS/pMOS分開處理的金屬柵極。
在使用了28nm工藝之後,GPU晶片相比40nm可將運行功耗降低大約15%、漏電率降低50%以上,最終帶動整體能效提升大約35%,僅有15億個電晶體的Radeon HD 7750顯卡使用的Cape Verde核心因此在每個能量單位(瓦特)上發揮非常好的性能。
Radeon HD7750顯卡Cape Verde核心近照
相比NVIDIA現役的老一代主流級顯卡GTX550 Ti,HD7750通過新工藝獲得的性能功耗比優勢非常明顯。在性能相近的情況下,用戶通常更願意購買省電的產品,因此HD7750在與GTX550 Ti的競爭中無疑佔據了上風。同時對於超頻玩家而言,一款價格在800元以下的顯卡如果擁有強勁的性能,一定會成為接下來一段時間的重點關注對象。