NVIDIA GTX 1080異步運算仍落後A卡!
2023-12-05 03:21:09 2
NVIDIA Pascal架構新卡GTX 1080做了很多努力工作減小Maxwell時代在DX12異步運算(Async Compute)上對A卡的劣勢,我們先來看一下NV的官方介紹——
異步計算
如今,GPU早已不再是單純的圖像渲染,尤其是在DirectX 12時代,GPU往往會被賦予更多的工作,如計算任務等等。
NVIDIA GeForce GTX 1080支持異步計算技術,它可以快速而高效的並行處理多任務,做到動態負載平衡,以及像素級別的任務「搶佔」,實現運行效率的更大化。
在靜態模式下,當GPU同時處理圖形渲染及計算兩個任務時,這兩個任務的完成時間往往是不一樣的。如下圖Static Partitioning所示,圖形任務在60%時間點便完成了,剩下的40%時間則要等待計算任務完成,才能進行下一個任務。這將造成大量的GPU空閒情況發生。
而在動態負載平衡模式下(上圖Dynamic Balancing部分),圖形任務率先完成,用於這部分的GPU資源可馬上接管剩下的計算工作,縮短任務完成時間。
Preemption(搶佔)指的是為了使重要工作可以快速完成,GPU會選擇關閉不太重要的工作,讓重要工作優先處理。Pascal也是目前首個支持像素級別搶佔的GPU架構,它可以讓GPU以更快的速度和更小的性能開銷完成搶佔。
實際表現如何,外媒已經在首款原生DX12遊戲《奇點灰燼》正式版上進行了測試,結果如下——
在4K、2K和1080P三種解析度,開啟異步運算支持後,GTX 1080在4K下並沒有獲得提升,甚至還不如DX11下的幀率。
反之A卡Fury X在三種分辨下都有增長,以1080P分辨為例,Fury X DX12+Async對DX11增幅為16%,GTX 1080為2%。
我們再通過另外一家測試站對4K分辨的考察——
關閉異步運算,R9 Fury X DX12對DX11提高7%,GTX 1080降幀2%,GTX 980 Ti更慘,降幀7%
開啟異步運算,R9 Fury X DX12對DX11暴增18%,GTX 1080降幀3%,GTX 980 Ti降幀8%。
2K分辨——
N卡總算挽回了一些面子,但仍遠輸A卡,另外Maxwell架構對於異步的支持的確是不盡人意。
結論:
總上來看,Pascal的動態分配對於DX12異步運算進行了大幅改進,但相較於先天優勢的GCN存在差距。當然,要強調的是,這僅僅是《奇點灰燼》一款DX12遊戲,而且考察的是提升幅度而非幀數絕對值,後者N卡早發一代的優勢還是很明顯的,僅作參考。
背景資料——AMD異步運算簡介
AMD的做法是,GPU劃分出三條隊列,分別運行渲染、計算、複製任務,而且分別可達100%滿載,互不影響。這樣的好處有三點,其一是可以實現更高的幀速率,讓遊戲更加流暢;第二是在「虛擬實境」中的應用,它可以減少延遲;第三則可以帶來更好的圖像質量。■