砍了這麼多 TitanX憑啥賣1200美元?
2024-11-22 13:53:11
NVIDIA之前出人意料地發布了Tiatn X顯卡,這是Pascal架構的「泰坦」顯卡,將成為GTX Titan X的繼任者,8月2日就會正式開賣,售價1200美元。官方資料顯示Tiatn X顯卡擁有3584個CUDA核心,規格看起來跟之前GP100核心一樣,但它實際上是完全不同的GP102核心,砍了HBM 2顯存,砍了FP64雙精度,而且也不是完整的GP102核心,是閹割版,而對高玩來說,你們再也不能愉快地用四路Titan X玩(zhuang)耍(bi)了。
NVIDIA的Titan X顯卡售價1200美元
對於Titan X顯卡,此前的發布新聞中我們已經得知了它的一些規格——3584個CUDA核心,基礎頻率1417MHz,加速頻率1531MHz,顯存為GDDR5X,位寬384bit,頻率10Gbps,帶寬480GB/s。
不過官方公布的信息還是有點少,關注Titan X顯卡的高玩顯然需要更全面了解該卡的資料,現在有些信息可以分享一下:
·關於GP102核心:架構與GP100不同,Titan X不是完整版核心
NVIDIA的Tesla P100使用的是GP100大核心,專為高性能計算而生,消費級市場上不會有GP100大核心,取而代之的是GP102核心,Titan X就是GP102核心的第一款產品,但它並不是完整版核心,而且GP102的架構跟GP100不同,倒是跟10系列核心的GP104核心相同。
GP104核心如圖所示,GP102相當於GP104的150%放大版
這也很好理解,GP100因為要支持HBM 2顯存、NVLink等,而且FP64雙精度單元很變態,但這些設計在GP102上沒什麼意義了,而且會大幅增加成本,這個GP102核心的架構跟GP104差不多,只是規模上不同。
具體來說,我們知道GP104核心擁有4組GPC單元,每組由5個SM單元組成,每個SM單元又有128個CUDA核心,搭配256bit位寬,而GP102核心擁有6組GPC單元,完整版是30組SM單元,3840個CUDA核心,位寬384bit,規模比GP104提升50%。
只不過Tiatn X用的GP102核心閹割了,砍掉了2組SM單元,CUDA核心從3840降至3584個,而完整版GP102核心用在了剛發布不久的Quadro P6000顯卡上了——後者擁有384個CUDA核心,性能要比Titan X更強。
有個小細節大家注意了沒——NVIDIA官方對Titan X的描述是「Ultimate」(可以理解為終極、旗艦),但不像以往的Titan顯卡發布時那樣強調世界最快或者世界最強顯卡(先別提Pro Duo這樣的雙卡),而Quadro P6000上NVIDIA官方博客描述的才是世界最快顯卡,官方肯定知道Titan X並非世界最快顯卡了。
Titan顯卡用閹割版核心並非第一次,第一代Titan顯卡用的就是閹割版GK110核心,之後的GTX Titan Black用的才是完整版GK110核心,但是後面的GTX Titan X就沒用過閹割版核心了,高玩們現在被慣壞了,如果用閹割版核心做超旗艦,特別是售價超過1200美元,估計心裡會不爽吧。
·關於浮點性能:閹割了FP16雙精度/FP16半精度,新增FP8精度
GP100核心最讓人震驚的地方之一就是重新強化雙精度計算,甚至比之前的GK110核心還要變態,每個SM單元中按照2:1的比例塞入了大量FP64單元,也就是說FP64性能達到了FP32單精度的一半,FP32浮點性能是10.6TFLOPS,FP64性能為5.3TFLOPS,真的是為了計算而生。
此外,針對深度學習,NVIDIA還在GP100核心上增加了FP16半精度全速運算支持,因為並不是所有運算都需要高精度的,深度學習對性能要求更高,所以FP16性能達到了21.6TFLPOPS。不過在GP102身上,雙精度被砍是必然的,因為FP64單元不僅會佔用大量核心面積,對功耗、發熱也會有影響,更重要的是在非專業計算市場上,FP64精度的需求並不高。
意外的是FP16半精度運算也砍了,但NVIDIA取而代之的是FP8精度,性能為44TFLOPS,這也是NVIDIA一直在強調的事。
需要說明的是,閹割了FP64和FP16不代表GP102完全不支持這兩種運算精度,FP64估計會回到目前1/32的水平,詳細資料還需要等待NVIDIA白皮書進一步確認。
不過閹割FP64的好處也是有的,GP100核心的面積為610mm2,電晶體數量153億,GP102核心面積是471mm2,120億電晶體,有助於降低成本、功耗及發熱。
·關於SLI:土豪也別想3/4路SLI了,玩好雙路SLI吧
如果你並關心Titan X顯卡的核心架構、規格,只想做個好好玩顯卡的土豪玩家,那麼SLI方面的變化可能會讓這些土豪玩家不高興——以前可以用四路GTX Titan SLI接受眾人敬仰,但Titan X就不會這麼痛快了。
從GTX 1080顯卡開始,NVIDIA就開始刻意限制多卡SLI,特別是3路、4路SLI,連個可信服的理由都沒有,官方就是這麼任性——玩SLI就玩雙卡吧,3卡、4卡限制多多,此前說是需要玩家去官方申請密鑰解鎖,但直到現在NVIDIA還是沒有給出具體的解鎖流程,所以3卡、4卡SLI現在基本上是個擺設了,難道NVIDIA真的擔心玩家多卡會毀滅地球?
至於Titan X顯卡的3卡、4卡SLI支持,NVIDIA並沒有給出明確的回答,在官方頁面上可以看到NVIDIA是這樣描述的,如下圖所示:
Titan X支持SLI,支持SLI HB橋
支持SLI是必然的,而且也支持NVIDIA的SLI HB橋——但是你們要知道,NVIDIA的SLI HB橋只推出了2-Way的,沒有3卡、4卡的(有3插槽、4插槽位的,別弄混了),而且售價39.99美元。
綜上所述,SLI支持方面,Titan X雖然理論上還是有4卡能力,但實際操作起來並不容易,官方限制多多,再也不能愉快地裝X了。
·關於Titan X命名:去掉GeForce是因為這不僅僅是遊戲卡
這次的Titan X顯卡並沒有換名字,但大家也注意到了它已經不叫GeForce了,官方的稱呼也是New Titan X(庫克大人的New iPad命名深入人心啊),這個改變容易讓人搞混,不知道有沒有JS會用上代的GTX Titan X騙人呢,好在GTX Titan X現在應該也沒什麼庫存了。
NVIDIA為什麼要去掉GeForce品牌名呢?對於這個問題,官方解釋說GeForce是消費級顯卡的品牌,但Titan X顯卡的目標用戶不僅僅是遊戲玩家,有些專業用戶也可以選擇它——估計這也是NVIDIA強調FP8精度運算的原因吧,畢竟FP8運算說GP104核心也不支持的。
這麼說吧,售價1200美元的Titan X在遊戲顯卡中算是相當貴了,但如果以專業用戶的角度來看,一千美元只能算是入門級,便宜多了,用作吃飯的傢伙也算是賺了——這就是NVIDIA官方的打算。
好了,現在大家對Titan X顯卡應該有個清晰的了解了,1200美元的價格比前代漲了20%,對用戶來說雖然閹割核心、HBM 2等規格有些不爽,但最關鍵的是Titan X性能值不值得買,官方表示其性能比GTX Titan X高了60%,但是這是就浮點性能來說的,而且現在有GTX 1080顯卡在前,其售價約為Titan X的一半,顯存容量8GB,也是GDDR5X,Tiatn X的理論性能優勢只有20-30%左右(11 vs.9 TFLOPS),這兩天曝光的性能實測也證實了一點——除非有極強的說服力,否則Titan X真的是靠200%的信仰來吸引消費者了,不過NVIDIA並不擔心Titan X的銷售,有錢人的想法和玩法不一樣,他們並不斤斤計較性價比。■