NVIDIA年度重量級顯卡!GTX960首發評測
2025-05-06 16:37:24
泡泡網顯卡頻道1月22日 2014年的Maxwell相信沒有讓大家失望,如果說GTX750Ti僅僅是小試牛刀,那搭載GM204的GTX980就堪稱壓軸之作了!之前筆者曾經預言,Maxwell架構全線產品上市後將引發顯卡市場的一次大規模洗牌,那麼洗牌的主力今天終於來了——NVIDIA GeForce GTX960!
現在大家最為關心的無疑就是GTX960所用的GPU核心了!GTX960使用了Maxwell架構的GM206 GPU,Maxwell在流式多處理器(SM)方面採用了一種全新設計,可大幅提高每瓦特性能和每單位面積的性能。雖然Kepler SMX設計在這一代產品中已經相當高效,但是隨著它的發展,NVIDIA的GPU架構師再次在能效比利用方面突破了難關。
Maxwell SM框架示意圖
Maxwell SM設計實現證明了這一點,控制邏輯分區、負荷均衡、時鐘門控粒度、編譯器調度、每時鐘周期發出指令條數等方面的改進以及其它諸多增強之處讓Maxwell SM(亦稱「SMM」)能夠在效率上遠超Kepler SMX。全新的Maxwell SM架構能夠在GM206中把SM的數量增至五個(Kepler中僅有兩個),而晶片面積僅增加25%。下表提供了高級對比,對比雙方分別為Maxwell以及上一代Kepler GPU:
具體來說,首先Maxwell採用了容量大增的二級高速緩存設計,Maxwell核心架構中二級高速緩存容量為2048KB,而Kpler中的容量僅為256KB。由於片上高速緩存容量更大,因此需要向顯卡DRAM發送的請求更少,從而降低了整體顯卡功耗、提升了性能。
除了上述變化以外,NVIDIA的工程師還雄心勃勃地在電晶體水平上調整了Maxwell GPU中每個單元的實現方式,以便最大限度提高節能性。所有這些努力的最終結果是,採用相同的28納米製造工藝,Maxwell能夠提供相當於Kepler兩倍的每瓦特性能!
雖然說起來簡單,但事實上這些就意味著Maxwell內部所有單元和橫梁結構均得到了重新設計,數據流得到了優化,功率管理實現了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內實現了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯繫在一起。
GM206核心框架示意圖
GM 206 GPU包含2個GPC、8個Maxwell流式多處理器(SMM)以及2個64位顯存控制器(共128位)。這就是這一晶片的完整實現形式,規格大約是GeForce GTX 980中的GM204的一半。
新一代SMM 處理核架構解析
而現在每個SM分為四個獨立的處理塊,每個處理塊具備自己的指令緩衝區、調度器以及32個CUDA核心。新的劃分方法簡化了設計與調度邏輯、節省了電晶體與功耗、降低了計算延遲。
總體而言,在這一全新設計上,每個「SM」的尺寸得到大幅縮減,而性能卻能夠達到一個KeplerSM的90%。更小的電晶體消耗讓NVIDIA能夠在每顆GPU中實現更多數量的SM。通過對比Kepler和Maxwell SM總數的相關指標可發現,後者的峰值紋理性能比前者高25%,CUDA核心數量多1.7倍,著色器性能大約高2.3倍。
SMM架構顯存系統的改進
對GM206來說,要在顯存位寬與上一代Kepler架構核心相同的情況下實現性能大幅提升的目標,增強顯存系統也同樣重要。內部顯存系統帶寬實現了提升,效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關於Maxwell架構的基本信息,例如通過Giga Thread引擎的主PCI Express接口數據流、Polymorph與Raster單元的基本操作等等過於晦澀的知識這裡就不再贅述了。