耕升RTX 4090炫光OC評測:科幻造型,強勁散熱
2025-06-10 21:09:35
無論是突飛猛進的核心性能,還是驚豔四座的新技術,每一代RTX新顯卡的發布總能令人倍感期待。今年的RTX 40系列也不例外,跨代的製程工藝升級與強大的DLSS 3技術再次令人垂涎。10月12日,首批非公版NVIDIA GeForce RTX 4090顯卡性能終於迎來正式解禁,我們也首發上手了耕升GeForce RTX 4090 炫光OC,一起來看看這張新晉卡皇究竟會有怎樣的表現。
01/ Ada Lovelace架構與RTX 4090
Ada Lovelace架構核心
GeForce RTX 4090 顯卡所採用的AD102-300核心採用全新的NVIDIA Ada Lovelace 架構和與TSMC 4N NVIDIA定製工藝,實現了高達2倍的性能功耗比飛躍,以及N卡史上最 高的2.52GHz的運行頻率。
與此同時,Ada Lovelace架構核心還大幅度提升了其L2緩存,完整版的Ada Lovelace架構核心擁有最 高96MB的L2緩存(RTX 4090為72MB),大容量的L2緩存帶來了數據命中率的有效提升。在現階段顯存帶寬提升有限的情況下,通過升級更大容量的L2緩存,可以進一步提升數據命中表現,帶來性能方面的升級。
在Ada Lovelace架構上,專用於光追計算第三代RT Core有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。這將滿足未來更加複雜的光追計算,為次世代級別的畫質表現提供更好的支持,如即將上線的《賽博朋克:2077》OVERDRIVE畫質可對每個像素執行635次的光追計算來確定光照,相比四年前首批光追遊戲《戰地5》增加了多達16倍。
光追需要光線面對不同物體、環境的多次反射、折射,處理強度不同的負載,著色器面對的工作量是複雜多變的,往往有的已經完成了,有的還在執行,需要等待。
面對這一問題,Ada Lovelace引入了著色器執行重排序(SER)技術,通過即時重新安排著色器的負載,將凌亂的信息排序整齊,從而提高執行效率,更好地利用GPU資源。
以為光追帶來最 高3倍的性能提升,整體遊戲性能提升也可達25%,以《賽博朋克2077》、《Portal RTX》、《Racer RTX》等遊戲為例,性能可以分別提升44%、29%、20%。
DLSS 3
不過即便有了上述的升級,光線追蹤技術所需的性能開銷仍然不容小覷。GeForce RTX顯卡一直憑藉著基於Tensor Core張量核心的DLSS超解析度技術,實現光追模式下畫質與幀率兼得的體驗。
而基於Ada Lovelace光流加速器(算力305Tops)、第四代Tensor張量核心(1.4PFlops算力)、NVIDIA超級計算機平臺(AI算力1EFlops)三大硬體基礎,RTX40系顯卡帶來了全新的DLSS 3。
DLSS技術前兩代的原理是超解析度,提升幀率的方式簡單說就是以低解析度渲染,然後通過AI訓練重建高解析度畫面返回輸出。如4K解析度下打開DLSS那麼實際的計算過程是先以1080p解析度渲染幀畫面,然後AI學習經過訓練的更高解析度的幀,再將這個幀畫面壓縮到4K最終輸出。因為中間相差的這3/4部分的像素信息主要是通過Tensor Core的AI計算來添加的,所以GPU每一幀所需的計算量就少了,幀率自然也就提高了。
而DLSS 3則是在包含DLSS 2超解析度技術的基礎上,進一步加入了DLSS光學多幀生成技術。DLSS幀生成技術通過光流處理器所得到的一系列數據後,以光流加速技術(OFA)來生成畫面信息,而AI算力則負責來對畫面進行進一步的優化,從而在遊戲中加入了更多的幀畫面,進行幀數的提升。
DLSS 3可直接生成遊戲第1幀3/4的像素以及整個遊戲第2幀,相當於使用1/8的算力,就完成了整個計算過程,進一步帶來更好遊戲體驗。同時這也意味著生成的畫面中,有一半都完全由GPU計算得出,不需要由CPU參與,所以理論上可以將原本受限於CPU性能的遊戲幀率提高一倍。
而在DLSS 3的幀生成技術上,由於可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲。而根據NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術,可以使得遊戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
在應用支持方面,NVIDIA向開發者表示,DLSS 3與DLSS 2大部分引擎開發接口是相通的,還可以通過Streamline這一NVIDIA發布的開源平臺進行集成,極大的簡化了遊戲開發者對新技術的集成工作,支持DLSS 2技術的遊戲將會很容易地升級到對DLSS 3的支持。
首批宣布即將支持DLSS 3的遊戲及應用等有35款,不僅包括《巫師3:狂獵》《黑神話: 悟空》《賽博朋克2077》《逆水寒》《殺手3》《微軟模擬飛行》等熱門遊戲,還得到了寒霜引擎、Unity 、虛幻引擎4 & 5 等知名遊戲引擎的支持。
首次支持第八代NVENC AV1雙編碼器
Ada Lovelace架構核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC AV1雙編碼器,這一全新的第八代NVENC雙硬體編碼器整合了對AV1視頻編碼格式的支持,可以在傳統的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對於AV1格式的編碼與解碼,有效提升了生產力方面的表現,對於創作型用戶、遊戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數據顯示,第八代NVENC雙硬體編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
RTX 4090
RTX 4090採用的是AD102-300 顯示核心,採用了TSMC 4N NVIDIA定製工藝進行製造,晶片面積為608.5平方毫米,電晶體密度達到了763億,相比較於上一代產品提升非常明顯,而這一代的核心還進一步提升了頻率,因此能帶來更好的性能表現。
RTX 4090配備了24GB的GDDR6 X顯存,大顯存配合性能上的提升更可以為遊戲以及創作者帶來更好的使用體驗,RTX 4090可謂是現階段消費級顯卡中頂尖存在。
而值得注意的是,現階段發布的RTX 4090採用的並非是完整版的ADD 102核心,是在完整版的Ada Lovelace架構核心上屏蔽了一部分的GPG而來的產品,並且其L2緩存也從完整版的96MB降低為了72MB。因此我們猜測,RTX 4090或有可能不是NVIDIA旗下RTX 40系列的最旗艦產品,或有可能存在使用完整AD 102核心的RTX 4090Ti或者RTX TITAN將會在後續進行推出。
我們可以通過下方的規格表來直觀的看到RTX 4090和RTX 3090Ti的規格差距,而我們此次拿到的耕升RTX 4090炫光OC進一步提升了Boost頻率,在實際的表現上能有更進一步的發揮。
02/ 外觀拆解
耕升 GeForce RTX 4090炫光 OC外觀採用了全新升級的第二代「炫之黑曜石」散熱器,流線型的亮面外殼靜態下頗具神秘感,上機點亮後還會亮起科幻感十足的燈效。它支持5V ARGB可調燈效,也支持連接市面上主流主板的神光同步。
第二代「炫之黑曜石」散熱器不僅升級了外觀和燈效設計,還升級優化耕升專用的「炫風之刃」扇葉。
由 2 個 102mm 和 1 個 92mm 組合而成的三風扇,經過升級後能提升風流量的同時減低聲噪,更高速有效地散熱,以應對高達600W TGP功耗下的溫度。
顯卡外殼採用了PCB板花紋設計,能讓顯卡在通電運行時呈現出電路板的紋路,使得顯卡整體更加具備未來感和設計感。顯卡背面印著「GeForce RTX」的字樣和 NVIDIA 核心AIC之一「耕升」的英文名稱,同時採用了穿透式金屬散熱背板在右方進一步加大積鏤空間。
在供電方面,耕升 GeForce RTX 4090 炫光 OC使用的是12VHPWR供電接口,包裝內附贈一根電源轉接線,玩家們也不用擔心自己的電源適配問題。耕升 GeForce RTX 4090 炫光 OC 450W~600W 的TGP功耗建議使用850W及以上電源,確保顯卡能在功率充足穩定的電源中使用。
顯卡側板是顯示器連接口,也有DP 1.4a*3/HDMI 2.1a *1,可以支持最多四聯屏輸出。
隨包裝還附贈了一個官方顯卡支架,無需拼裝直接使用,還可以自由調節高度。顯卡支架可以起到支撐作用,防止顯卡過重導致主板上的顯卡槽變形甚至斷裂,這對於較重的旗艦卡而言非常重要。
上機效果展示:
拆解:
耕升RTX 4090炫光OC採用了類公版的PCB設計,18相核心供電和4相顯存供電, 穩定輸出持久耐用。
PCB正中間是AD102-300-A1核心。
周圍有12顆顯存顆粒圍繞,均是美光的GDDR6X顯存,型號為美光的D8BZC,單顆2GB容量,32-bit位寬,12顆一共組成24GB 384-bit的顯存規格。
和RTX 3090 Ti一樣,由於換用了單顆2GB的顯存,所以24GB的顯存顆粒都可以貼在正面,背面已經沒有顯存了,這對顯存的散熱是更加友好的。
第二代「炫之黑曜石」散熱器還升級了特大面積散熱鰭片,內建8根複合式熱導管,加入鍍鎳設計加強抗氧化能力。配合升級後的第三組風扇和鏤空PCB設計,可讓顯卡溫度得到進一步降低,延長顯卡使用壽命。
03/ 理論性能及散熱測試
由於首發測試的時候,13代酷睿平臺還沒有上市,所以本次評測搭配的是12代酷睿的旗艦型號i9-12900K,同時在主板BIOS內開啟Resizable BAR技術,儘可能充分地發揮出耕升RTX 4090炫光OC的性能。
DLSS 3是RTX 40系列顯卡帶來的全新技術,在維持高畫質的情況下也可以實現更為流暢的遊戲表現,這也讓玩家可以更好的享受4K光追遊戲帶來的畫質體驗,所以4K性能將作為後面遊戲測試的重點。為了更好的感受RTX4090顯卡在遊戲方面的升級,我們在測試RTX4090顯卡時也選擇了愛攻&保時捷(Porsche Design)聯合設計的PD32M顯示器。
這款顯示器為31.5英寸,採用MIni LED背光技術,擁有3456顆LED顆粒以及1152個獨立分區,擁有1600尼特峰值亮度,8000萬:1動態對比度,並通過HDR1400認證,在畫質上有著更為出色的表現。此外,PD32M擁有4K解析度以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆蓋,並且擁有HDMI 2.1接口,是一款旗艦級電競顯示器。
GPU-Z顯示的耕升RTX 4090炫光OC規格信息如下:
在3DMark基準測試中,耕升RTX 4090炫光OC對比上代旗艦RTX 3090Ti,除了1080P下運行的Fire Strike項目提升50%外,其餘項目提升均在70%左右。顯而易見,單從跑分成績來看,RTX4090顯卡的性能提升堪稱是非常大的。
3DMark基準測試新增加了DLSS功能測試(DLSS 3)。該測試項目目前還需要測試階段,需要下載NVIDIA提供的測試版程序。
根據實測來看,在開啟DLSS 3之後,RTX4090顯卡在2K、4K解析度下均實現了巨大的FPS提升。
在更高的8K解析度下,開啟DLSS 3之後RTX4090顯卡的FPS依然能跑到60幀以上。可以說在DLSS 3技術的助力之下,RTX4090顯卡能夠暢玩的8K遊戲會更多。
室溫26°C開放平臺,在10分鐘Furmark烤機測試中,耕升RTX4090炫光OC在滿載功耗430-450W功耗下,核心溫度僅64.7°C,散熱表現相當好。
04/ 遊戲測試
傳統遊戲
首先我們測試七款主流遊戲,看看RTX 4090對比RTX 3090 Ti實際表現到底提升有多大。
遊戲實測——《地鐵:離去》
遊戲實測——《刺客信條:奧德賽》
遊戲實測——《戰爭機器5》
遊戲實測——《幽靈行動:荒野》
遊戲實測——《光明記憶:無限》
遊戲實測——《古墓麗影:暗影》
遊戲實測——《無主之地3》
對比上一代卡皇RTX3090Ti,新一代卡皇RTX4090的遊戲性能提升是非常顯著的,也基本符合理論測試的70%提升。
DLSS 3遊戲
由於首測時,DLSS 3版本目前均處於測試階段,進行測試的話需要下載NVIDIA提供的測試版遊戲,此次評測項目包括《賽博朋克2077》、《逆水寒》、《瘟疫傳說:安魂曲》的測試版本。
DLSS 3遊戲測試版——《逆水寒》默認開啟
DLSS 3遊戲測試版——《瘟疫傳說:安魂曲》
DLSS 3遊戲測試版——《賽博朋克2077》
通過上述三款DLSS 3遊戲來看,DLSS 3技術為RTX40系列顯卡帶來的性能提升是巨大的。NVIDIA的DLSS 3技術除了能夠助力遊戲幀數的大幅提升之外,還有一大優勢,那就是助力遊戲畫質的提升。
上圖這個《賽博朋克2077》遊戲場景,開啟DLSS質量模式之後,籃球架上面的針葉樹的樹葉模型要更加精細。
上圖這個《逆水寒》遊戲場景,開啟DLSS質量模式之後,屋簷下燈籠的模型要更加精細。
上圖這個《瘟疫傳說:安魂曲》遊戲場景,開啟DLSS畫質模式之後,樹葉的模型要更加精細。
05/ 生產力測試
AV1硬體加速編解碼測試
為什麼AV1編解碼技術越來越受歡迎?理由很簡單,AV1編解碼的視頻能夠以更低的碼率,實現其它主流編解碼視頻相同的畫質。說白了,在視頻畫質相同的情況下,採用AV1編解碼的視頻文件體積會更小,以至於能夠為視頻創作者們節省大量的硬碟空間。
目前萬興喵影、達文西等視頻軟體已可支持AV1硬體加速編/解碼功能。以萬興喵影為例,分別利用AV1編解碼和H.264編解碼導出一部碼率基本相同的MP4視頻。
最終,AV1編解碼的視頻體積僅為853MB,而H.264編解碼的視頻體積則達到了1.22GB。怎麼樣,AV1編解碼技術可以高效地幫助你節省硬碟空間。
目前達文西這款軟體已推出了支持N卡AV1硬體加速編解碼的測試版。
將一部12GB容量的4K視頻,利用N卡AV1硬體加速編解碼導出一部MP4視頻。最終,利用RTX4090的加速效果,視頻導出時間僅為48秒,速度相當快。
H.265硬體加速編解碼測試
將一部12GB容量的4K視頻,利用H.265硬體加速編解碼導出一部MP4視頻。此項測試對比了RTX 3090 Ti的成績。
最終,RTX4090的成績為43秒,而RTX3090Ti的成績為85秒。新卡皇的H.265加速能力也要比老卡皇好上很多。
工業設計領域測試
利用SPECviewperf 13這款基準測試軟體,筆者再來實測下RTX4090顯卡在工業設計領域的表現。
顯而易見,RTX4090在工業設計領域的性能提升也是相當大的。
06/ 總結
上一代RTX30系顯卡首發的時候,我們已經非常驚嘆於高端卡相比上代產品50%的提升,沒想到這一代進步的速度竟然更勝以往,RTX 4090即便是面對前代旗艦級的RTX 3090 Ti也提升也了超過70%,而且這還是在維持450W功耗牆不變的情況下實現的。
同時NVIDIA作為目前市場佔有率領先的顯卡廠商,此次為RTX 40顯卡加入開創性的光學多幀生成功能,以及AV1編解碼等特性,並積極推動對應生態的發展,對於整個顯卡行業來說也有路標式的引導意義。
而我們此次評測的非公版型號—耕升RTX4090炫光OC,不僅有著頗具未來科幻風格的前衛設計,高端的ARGB燈控支持,以及高於公版的OC頻率,「炫之黑曜石」散熱器的散熱表現也十分不俗,算是首批非公型號中兼具顏值實力,性價比也很不錯的選擇。