無縫融合核芯顯卡 圖形性能再攀高峰
2025-01-15 15:18:08
泡泡網筆記本頻道12月29日 雖然2010年初發布的酷睿系列也自帶了圖形核心,但是CPU是雙內核封裝–32nm的CPU和45nm的GPU。而Sandy Bridge全新設計採用與CPU核心同步的32nm工藝製造GPU則進一步顯著提高了其性能。最為關鍵的是GPU和CPU融為一體了,成為新一代CPU的標準組成部分,所以這樣的CPU被稱為核芯顯卡。
目前大家熟悉的Core i5、Core i7都支持睿頻加速(Turbo Boost)技術,而Sandy Bridge的核芯顯卡有自己的電源島和時鐘域,同時也支持Turbo Boost技術,可以配合CPU的各個計算內核協調進行加速或降頻。這種按需智能變化頻率的最大好處是在不繁忙的時候可以為用戶節省大量能耗,並且顯著降低發熱量,而在需要速度的時候迅速提速。
Sandy Bridge的GPU與一般的集成顯示核心最大的不同就是顯示驅動會控制訪問處理器內核的三級高速緩存,GPU和CPU計算內核處於同樣的位置訪問可以共享的高速緩存,這也正是核芯顯卡名字的由來之一。核芯顯卡不等同於集成顯卡,因為集成顯示核心則只能將圖形數據放在系統內存當中,要知道內存的速度相比三級高速緩存可就慢太多了,並且要更「遙遠」一些,單是路程的時間就大大制約了其性能。如此說來,將圖形數據放在高速緩存裡對提升性能、降低功耗都有事半功倍的效果。
Sandy Bridge的核芯顯卡全面使用固定功能硬體,功能特性和硬體單元相對應,這樣的好處是性能、功耗、核心面積都大大優化。而其性能提升的重點在於廣泛使用全面可編程硬體,也就是我們被稱為EU的東西,包含著色器、核心、執行單元等,可以從多個線程雙發射時取指令。
在此前的圖形架構中,寄存器堆棧都是即時重新分配,如果其中某一個線程的需求量降低,節省的部分會分配給其他線程,這樣做最大的好處是節省了核心面積,但是,在一些情況下卻有發生線程沒有寄存器可用的尷尬,大大降低其性能。其他集成顯示核心每線程平均64個寄存器,到了Westmere酷睿的GPU提高到平均80個,Sandy Bridge的核芯顯卡則每個線程固定為120個,如此說來,性能的大幅度提升就成了必然結果。
內部ISA映射和DX10 API指令幾乎一一對應,架構很像CISC,結果就是有效擴大了EU的寬度,IPC也顯著提升。並且,抽象數學運算也有EU內的硬體負責,性能得到同步提升,就英特爾表示,正弦(sine)、餘弦(cosine)操作的速度比現在酷睿中的高清顯卡提升了幾個數量級。所有這些改進加起來,Sandy Bridge核芯顯卡裡每個EU的指令吞吐量都比現在酷睿的高清顯卡增加了一倍。
當然,Sandy Bridge的核芯顯卡也會人為拉開性能差距,分為2個性能不同的版本,通過EU分成兩個版本,擁有12個或者6個EU。但是即便擁有6個EU,得益於每個EU吞吐量翻番、運行頻率更高、共享三級高速緩存等特點,其性能也令人相當滿意。更何況擁有12個EU的性能更可以直接威脅到獨立中低端顯卡市場。
如果說Sandy Bridge的核芯顯卡主要是提升3D性能以及畫面質量只能佔一半作用,那麼另一半作用就是數字媒體的處理能力。目前高清視頻已經非常普及,很多獨立顯卡也打著高清顯卡的旗幟。目前的Core i3也已經可以流暢播放高清視頻,所以,最基本的流暢播放已經不是技術門檻,但是英特爾還要繼續研發下去,將視頻以及衍生功能繼續發揚光大。
Sandy Bridge中有一個媒體處理器,專門負責視頻解碼、編碼,並且新的硬體加速解碼引擎中,整個視頻管線都通過固定功能單元進行解碼,這樣做最大的好處就是在播放視頻的時候功耗可以降低一半。
全新的視頻編碼引擎雖然並沒有對外公布其具體細節,但是在IDF現場的一個演示片段卻透露了其強大的性能。一段3分鐘的1080P 30Mbps的高清視頻,轉換成640×360的iPhone格式,如果是一般用戶的電腦可能需要幾分鐘,但是Sandy Bridge只需要14秒,轉換速度高達400FPS,而這一切發生在大約3平方毫米的核心面積之上。並且,我們可以預計的是,英特爾還會與更多軟體廠商密切合作,相信這種視頻轉碼技術會很快得到廣泛支持。
如果您有任何意見或建議,或者有問題需要向編輯諮詢以及投遞相關新聞線索,歡迎通過郵件或微博與我們聯繫。期待與您的溝通,感謝您支持泡泡網筆記本電腦頻道。■