高效能的秘密 NVIDIA原來有這樣的黑科技

2024-11-22 14:24:10 2

不論CPU還是GPU，性能與功耗都存在糾結——用戶希望性能更強、功耗更低，但同工藝同架構下，性能強就意味著功耗高，這也是廠商不斷研發新工藝、新架構的原因。說到GPU性能與功耗，NVIDIA以前一直戴著高耗高能甚至高耗低能的帽子，有些玩家可能對Fermi及之前的大核心還有印象吧，但這幾代GPU架構以來，特別是從Maxwell開始，NVIDIA顯卡在能耗比上簡直開掛，AMD的RX 480性能比GTX 970略高，但14nm工藝的它在功耗上也沒佔到28nm Maxwell架構多少便宜，而NVIDIA的16nm Pascal顯卡更甚，GPU頻率都要飆到2GHz了，但功耗控制依然出色，比AMD 14nm顯卡更好一些。

NVIDIA這次用了什麼黑科技嗎？對於每代GPU架構的變化，NVIDIA雖然會在白皮書中介紹新架構的特點，但通常不會涉及太細節的技術，甚至某些情況下還會否認GPU功能單元的一些變化。

不過RealworldTech網站不一樣，他們雖然一年都出不了幾篇文章，但一出手就必然是精品，這次他們公布了NVIDIA Maxwell及Pascal架構的一個細節——這兩代架構使用了傳統桌面GPU沒有的貼圖光柵化（Tile-based Rasterization，簡稱TBR）技術。

具體來說，NVIDIA所用的貼圖光柵器可以緩衝像素輸出，而非傳統上那樣全屏直接光柵化，為此他們還做了詳細的視頻，裡面介紹了基本的3D渲染過程、DX渲染演示，還有就是對比了AMD、NVIDIA GPU架構執行代碼的行為，視頻地址在此，時長20分鐘，需要爬牆。

如果你對技術介紹不感興趣，那直接來看這麼做的好處也行：

使用貼圖光柵化以及芯內緩衝光柵化數據可以減少渲染時的內存帶寬佔用，提高性能及能效。與他們假設一致的是，他們的測試還證實了NVIDIA改變了貼圖大小以便光柵器輸出的像素能適應緩存或者芯內緩衝器的固定大小。

就整個顯卡行業來說，TBR貼圖光柵化技術並不是新玩意，PowerVR架構從1990年代就在用TBDR（貼圖延遲渲染）技術了，ARM及高通的GPU也在使用各種類型的貼圖渲染技術，不過在桌面GPU上，貼圖渲染技術被認為是失敗的。1990年代，Gigapixel開發了支持貼圖渲染的GP-1 GPU，後來該公司被3dfx收購了，3dfx又被NVIDIA收購了。

PowerVR曾經也有桌面版，其Kyro顯卡發布於2001年，後來STMicro取消了這款產品。微軟也研究了各種貼圖技術，但是最後也被擱置了。值得一提的是，此前我們介紹DX11.1新技術中，裡面就有TBDR渲染技術支持。

從以往歷史來看，移動GPU的技術往往都是來源於桌面GPU，也就是說桌面GPU下放到移動GPU上，比如可編程渲染器及GPGPU計算都是顯出現在桌面GPU上，之後才用於移動GPU。但貼圖光柵化技術反過來了，首先用於移動GPU，現在開始影響高性能桌面GPU了，這是一個值得興奮的轉折，未來是否還有其他移動GPU技術被桌面GPU吸收也是值得關注的。■