NVIDIA帕斯卡GP100揭秘:3840流處理器
2023-12-05 01:04:19
沉寂了許久的GPU顯卡市場終於熱鬧起來了!AMD的北極星、NVIDIA的帕斯卡兩大真正全新的架構即將隆重登場,各種爆料讓人激動不已。
今天,TechPowerUp又拿到了帕斯卡家族優異大核心GP100的架構示意圖,對它的基本規格也終於有了一個清楚的認識。
可以看出,帕斯卡架構的GP100核心在大體上仍然沿用了NVIDIA GPU這些年的設計思路,但規模更加強大,也有一些增強之處。
GP100核心架構總圖
整個核心被分成了6組GPC(圖形處理簇),這是具備高度獨立性的GPU單元,擁有自己的渲染前端和後端。
每個GPC內包含10組SM(流式多處理器單元),而每個SM擁有64個CUDA核心,也就是整個GPU擁有60組SM、3840個CUDA核心,同時還有240個紋理單元。
已經宣布的高性能計算卡Tesla P100隻開啟了56組SM、3584個CUDA核心,即便如此也比麥克斯韋家族GM200核心(3072個CUDA核心)大了整整四分之一!
在圖片邊緣可以看到八組顯存控制器,組成了4096-bit HBM2的規格,可提供720GB/s的超高帶寬(理論上最高能做到1TB/s)。
GP100核心SM單元架構圖
另外還可以看到一個新的「High-speed Hub」(高速控制中心),由此伸出四個NVLink總線埠,官方號稱單向帶寬80GB/s,但不清楚是每個埠的,還是集體的。
NVLink總線類似多處理器系統中的Intel QPI、AMD HT,可以高速直連多個GPU,並支持真正的內存虛擬化,可大大加速GPU計算性能。
儘管規模如此龐大,帕斯卡核心依然可以運行在超高頻率上,Tesla P100的核心基礎、加速頻率就分別有1328MHz、1480MHz,熱設計功耗300W。
別忘了,GP100核心可是和AMD Fiji一樣集成了四顆HBM2顯存和中介層,能做到如此大規模、高頻率,實在不容易。■