三張新顯卡齊發布!一文總結英偉達RTX 40系列顯卡亮點何在
2025-05-11 04:07:31
9月20日的晚上11點,英偉達召開了主題為「AI 和元宇宙時代的加速計算大會」的GTC活動。在此次的GTC活動上,英偉達在時隔兩年後,正式發布了新一代的顯卡產品——RTX 40系列顯卡。
此次英偉達發布的RTX40系列顯卡共有三款產品,分別是RTX 4090、RTX 4080 16GB、RTX 4080 12GB三款顯卡,這三款顯卡都換用了全新的核心架構,其架構命名延續了英偉達從歷史知名科學人物上取材的命名傳統,定名為Ada Lovelace (艾達·洛夫萊斯)架構。
關於Ada Lovelace (艾達·洛夫萊斯):這一位女性是著名英國詩人拜倫之女,數學家。電腦程式創始人,建立了循環和子程序概念,被認為是電腦程式的創始人。
關於此次發布的RTX 40系列顯卡:
英偉達在這一次發布的RTX 40系列顯卡採用的是全新的Ada Lovelace (艾達·洛夫萊斯)架構核心,這核心採用的是來自臺積電的4nm工藝製造,擁有760億個電晶體和超過18000個CUDA核心,相比較於上一代Ampere架構核心多了70%。
作為此次發布的RTX 40系列顯卡核心,Ada Lovelace 核心將其中的SM多單元處理器、RT Core(光追核心)以及Tensor Core(可理解為AI核心)都進行了換代升級,其中的RT Core(光追核心)擁有兩倍的光線與三角形求交性能,並且通過全新的引擎來減少了開銷,Tensor Core則是提升了性能。
Ada Lovelace 核心性能提升的一大關鍵是來自於SM多單元處理器方面的升級,英偉達全新引入了Shader Execution Reordering這一項著色器執行重排序技術,通俗的話說起來就是讓GPU的處理過程也有了類似於CPU處理過程中的亂序處理能力,可以有效的提升性能,可獲得2-3倍的光線追蹤性能提升。
而RTX 40系列顯卡除了換用全新的Ada Lovelace 核心獲得性能提升以外,還加入了DLSS 3.0技術,DLSS 3.0技術包含四項組件,而在其中最為關鍵的是新加入的AI幀生成器。而這一個技術相比較於DLSS 2.0此前採用AI在高幀率幀和低幀率幀中進行讀取重渲染的過程而生成中間幀的過程有所區別,DLSS 3.0是利用深度學習的AI在像素級幀到幀方向的運動、速度信息基礎上進行預測並通過一系列的處理在不影響原有遊戲處理管線的情況下進行中間幀的生成,大幅度提高了遊戲的幀數表現。這一個DLSS 3.0技術在英偉達的演示中,表現非常出色,也是此次發布的三張RTX 40系列顯卡原有極大性能提升的一個關鍵。
在具體的參數規格上,由於目前尚未更多的信息流出,例如RT核心數量、Tensor Core數量等信息,所以筆者匯總的這一個表格是RTX 40系列顯卡的部分關鍵參數,大致可以作為參考。
從英偉達公布的參數以及筆者收集到的參數信息可知,RTX 4090使用AD102-300核心 臺積電4nm製程,配備24GB的美光GDDR6X顯存擁有384bit顯存位寬,顯存帶寬為1008GB/s。其核心配備的CUDA數量為16384,核心頻率基準頻率為2230MHz,BOOST頻率為2520MHz,設計TGP為450W,定價為1599美刀,國內建議12999元起步。
RTX 3080 16GB使用AD103-300核心,臺積電4nm製程,配備16GB的美光GDDR6X顯存擁有256bit顯存位寬,顯存帶寬為720GB/s。其核心配備的CUDA數量為9728,核心頻率基準頻率為2210MHz,BOOST頻率為2505MHz,設計TGP為350W,定價為1199美刀,國內建議9199元起步。
RTX 3080 12GB使用AD103-400核心,臺積電4nm製程,配備16GB的美光GDDR6X顯存擁有192bit顯存位寬,顯存帶寬為504GB/s。其核心配備的CUDA數量為7680,核心頻率基準頻率為2310MHz,BOOST頻率為2610MHz,設計TGP為285W,定價為899美刀,國內建議7199元起步。
(個人認為這一個RTX 4080 12GB的規格更像是RTX 4070 Ti級別或者70級別的規格,但是老黃這波拉到80級別了,價格也是非常感人)。
以上是老黃髮布的三款全新顯卡參數以及價格,那麼相比較於RTX 30系列同級別的顯卡,這三種顯卡提升在哪?
相比較RTX 30系列同級別顯卡:
此次發布的RTX 40系列顯卡從參數上一眼可知的就是其CUDA數量的大幅度升級,以及頻率上的極大提升。這部分提升應該是得益於英偉達的設計改進以及臺積電4nm工藝的組合,因此在性能方面,RTX 40系列的升級相比較於RTX 30系列的升級肯定是有,但具體的多少還需要實際測試才知道。
個人認為RTX 40系列相比較於RTX 30系列最大的升級來自於全新的SM多單元處理器、RT Core、Tensor Core加上DLSS 3.0技術帶來的提升。個人的想法是,RTX 40系列顯卡核心所配備的SM多單元處理器加入的Shader Execution Reordering帶來了處理能力上的提升,RT Core則在光追性能上帶來了升級。最為關鍵的提升應該是Tensor Core帶來的AI算力、深度學習能力提升,以及建構在AI性能上DLSS 3.0帶來的渲染中間幀性能升級,從而帶來了遊戲性能的提升(具體等待實測)。
相比較於RTX 30系列顯卡,RTX 40系列可謂是在Shader+RT Core+Tensor Core+DLSS 3.0都擁有了全方位的提升,特別是其中Tensor Core+DLSS 3.0的升級,也符合了英偉達在後續提出的生產力以及自動駕駛等方面技術的一大基點(AI性能的需求升級)。除此之外,RTX 40系列的能耗比根據英偉達的說法,也是升級了不少,從RTX 4090系列相比較於RTX 3090僅提升100W的TGP而理論性能提升近翻倍的情況下,確實控制得還算可以。
RTX 40系列顯卡相比較於RTX 30系列顯卡的升級,個人認為提升應該是較為明顯的,但需要實測進一步來體現,對於遊戲玩家來說,還需要等待一系列遊戲適配支持,來充分發揮顯卡的性能優勢。而對於面向渲染、AI之類的學習來說,RTX 40系列的也是相比較於RTX 30好上不少。
當然RTX 40系列的價格也是相比較於RTX 30系列高上挺多,RTX 4080 12GB的價格居然要拉到899美刀起售,國內建議零售價為7199元起,這個價格,擺明了老黃想繼續清RTX 30系列顯卡的心態了。
總結一下想法:
其實看完發布會全程,可以發現,老黃對於顯卡的介紹匆匆帶過,後續講的很多的內容都是圍繞本次大會的主題:「AI 和元宇宙時代的加速計算大會」,重點講述了英偉達Omniverse在元宇宙這一方面的強力作用。AI在自動駕駛領域等方面的應用等,整一場大會的核心內容是To B端的,RTX 40系列更像是在To B過程中拿出一部分的技術進行下放帶給To C用戶的內容,RTX 40系列顯卡上升級非常明顯的Tensor Core加上DLSS 3.0或許就是來源於To B的技術。
重點轉向To B,加上此前傳聞RTX 30系列顯卡擁有過多的擠壓庫存,或許就是此次RTX 40系列顯卡定價高昂的一大原因,單價的提升有利於英偉達在市場整體需求下降的情況下,可以用更高的利潤率來獲得相近的收入,而我們也可以看到,相比較於往年的80/70級別顯卡,此次的RTX 4080顯卡定價可謂非常高。在今晚發布的三張RTX 4090系列顯卡中,RTX 4090顯卡或將擁有最高的性價比,對於極致發燒的遊戲玩家、渲染工作的用戶、需要AI能力來「煉丹」的用戶來說,RTX 4090相比較於RTX 3090提價並不多,性價比應該是最高的。(但是這一代顯卡的價格是真貴啊,不知道有多少計劃購買80/70級別顯卡的遊戲玩家這波要被勸退,DIY市場太難了)
英偉達在這一次GTC大會提出的部分觀點個人也是比較認可的,隨著顯卡性能的提升,未來的遊戲可以無預先的烘焙,而是來自實時的烘焙渲染技術而來的,未來的遊戲世界將是仿真的世界。因此希望無論是遊戲也好、元宇宙也罷,隨著技術的發展,可以為我們帶來另一種平行世界的時空體驗吧。