新四季網

輕鬆讀懂移動處理器 CPU微架構全解析

2025-04-01 06:41:24

    泡泡網CPU頻道1月26日 原文標題為《》,對不起,你被標題欺騙了,實際上對許多讀者來說要讀懂本文並不是那麼輕鬆:p

隨著半導體工藝的日趨先進,智慧型手機(Smartphone 或者 Superphone)、平板電腦(Tablet 或者 Pad)已經成為許多網友最常使用、最多關注、更新最快的電子消費產品,高度便攜性是這類產品的最關鍵成功原因。

所謂便攜性自然是指產品必須足夠輕便而且需要有足夠的續航能力,因此這就要求產品的原件必須足夠省電,只有這樣才能減少散熱和電池體積這兩個最佔體積和重量的問題。

要達到這個目標,肯定要做功能和性能上的妥協,至少相對個頭更大的筆記本電腦、臺式機而言,像降低吞吐率或者增加時延,從實測性能而言,目前智慧型手機或者平板電腦的 CPU、圖形處理器性能基本上相當於 6 到 10 年前桌上型電腦的水準。

舉個簡單的例子,在俄羅斯網站 ixbt 的討論區上,,一位名為 ssvb 的網友採用 origenboard.org 的一片 Samsung Exynos 4210 開發板(配有 Exynos 4210 處理器具備兩個 ARM Cortex-A9 處理器內核)跑出來的 High Performance Linpack (HPL)性能是 1.307 GFLOPS,同貼中還有 Intel Atom N450(Pineview 架構,45nm,單核) 1.66GHz 的測試結果——0.944 GFLOPS 以及 。

NVIDIA 官網上的一份 也表明 Tegra 2(ARM Cortex-A9 雙核 1GHz,理論雙精度浮點性能 2GFLOPS)的 HPL 性能為 1.15GFLOPS( 57% 效率,200MFLOPS/瓦) 。

這都是一個什麼概念?我曾經在 06 年的時候用 Pentium D 820 2.8GHz 跑出來的 HPL 性能為 10.12 GFLOPS,Athlon64X2 2.6GHz 為 9.158 GFLOPS。

那麼現在臺式機的 HPL 性能狀況如何?

在去年我用 Core i7 2600K 3.4GHz 配合未支持 AVX 指令的 GotoBLAS(數學庫)上得到的 HPL 性能為 51.18 GFLOPS 左右,後來又用支持 AVX 的 OpenBLAS(原 GotoBLAS 開發者停止更新後的其中一個後續開源社區版)得出的 HPL 性能為 99.38 GFLOPS,到 2013 年支持 AVX2 指令集的 Haswell 架構出來後,這個測試結果應該還能接近再翻番,達到 200 GFLOPS 級別。

也許你會說手機、平板要雙精度幹啥呢?請不要忘記在 30 年前的 x86 處理器根本沒有集成任何硬體浮點單元,現在的情況又如何?曾經做出號稱最強 x87 協處理器的 Cyrix 後來一頭扎進整數為王的產品策略後現在影都沒了。

「幹啥」這個問題往往是硬體具備並達到一定性能條件後就會有答案的,臺式機上的性能測試軟體和方案會隨著手機、平板性能日益強大而變得在這類設備上運行也理所應當,除了上面說的 HPL 外,各類 PC 上流行的測試工具例如 SPEC CPU20xx、3DMark 等也會是如此。

傳統的 CPU 性能測試的確不能完全適用於手機、平板的 SoC 晶片(人們把可以在行動作業系統上跑應用軟體的 SOC 稱作應用處理器,簡稱 AP),但是請注意我說這句話是因為 SoC 並不僅僅有 CPU,還有 GPU、音視頻編解碼器、存儲控制器、非易失性存儲單元、數模/模數轉換器以及各種輸入輸出周邊等,這使得我們要單純評價一款 SoC 是否非常好的的時候可能會感到頗為傷神。

話雖如此,不過總的來說,SoC 中和性能最密切相關的依然是 CPU、GPU,因為智能設備裡幾乎所有程序的運行都必須依仗兩者來執行,與用戶的使用感受有直接關係(請注意,我們這裡說的只是指 SoC 晶片中,而非手機或者平板電腦整體)。因此,縱然手機、平板處理器型號各異並且內中千頭萬緒,我們還是應該從大家最關心的 CPU、GPU 著手來了解。

現在情況簡單多了,按照 ISA(指令集架構)劃分,因為目前的手機、平板 CPU 無非是 ARM、Intel/AMD 兩大陣營,潛在的還有 MIPS,不過目前 MIPS 似乎在這個領域還成不了氣候,更像是一個備胎。 

如果你對計算機科學還不是很了解的話,對 ISA 這個詞可能也不會很了解,雖然它經常出現在一些時髦的技術文章中。

電腦顯然並不能直接明白 C、Java、Basic 這樣的高級語言(雖然有人嘗試過開發高級語言處理器,但是無不失敗告終),搭建在高級語言和 CPU 本機代碼之間的就是 ISA。

ISA 的全稱是 instruction set architecture,中文就是指令集架構,有時候直接稱呼為架構(architecture),是指程式設計師實際「可見」的指令集,包含了程式設計師編寫一個能正確運行的二進位機器語言程序的所有信息,涉及到指令、 I/O 設備等。例如 Intel 的 IA-32、Intel 64(曾經名為 IA32e、EM64T 等);ARM 的 ARMv7、ARMv8 等等。

這裡的 IA32、Intel 64 或者 ARMv7、ARMv8 其實是指各自指令集架構的不同版本,有時候我們嫌囉嗦,所以把前兩者統稱 x86,後兩者統稱 ARM。

將 ISA 變成真正可以使用的實物需要經過「實現」,它包括兩個層面:組成和硬體。

組成是從計算機設計的高階層面而言,例如:存儲系統、存儲互連接、CPU(包括算術、邏輯分支、數據傳輸的實現)設計,有時候「組成」又被稱作微架構(microarchitecture),英特爾 Nehalem、NVIDIA Kepler、ARM Cotrex-A57 都可以屬於各自某系列晶片的微架構,其中 Kepler 的 ISA 是 CUDA PTX 和 Cortex-A57 的 ISA 屬於 ARMv8。

硬體通常是指電腦的規格,包括具體的邏輯設計、封裝技術,同一系列的產品可能有相同的 ISA、近乎一樣的微架構,但是存在某些具體規格的差別,例如 NVIDIA Tegra 3,有 AP30、AP33、T30、T33、T30S、T33S、T30SL 等具體的型號,它們都屬於 Tegra 3 微架構,但是頻率規格、內存規格等地方都有差別。

而 GPU 方面則複雜一些,有 PowerVR、高通、NVIDIA、ARM、Intel 等等,其中使用最廣泛的就是 PowerVR,這得益於 PowerVR 10年前就決定全面切換到行動裝置上,鋪橋搭路的功夫很紮實,而 NVIDIA 和 Intel 的商業模型都是只用於自家產品(當然 NVIDIA 也曾經在遊戲機領域做過 RSX 這樣的 IP core 授權)的,所以目前未能在其他 SoC 上看到。

下面的表格給出了這兩年來比較熱門的手機或者平板電腦 ARM 處理器,它們基本上都被應用於各公司的旗艦級產品中。

2011/2013 SoC 對比表
SoC製程CPUGPU內存總線發布時間
Apple A545nm/32nm2 x ARM Cortex A9 w/ MPE @ 1GHzPowerVR SGX 543MP22 x 32-bit LPDDR22011-10-4
Apple A5X45nm2 x ARM Cortex A9 w/ MPE @ 1GHzPowerVR SGX 543MP44 x 32-bit LPDDR22012-3-16
Apple A632nm2 x Apple Swift @ 1.3GHzPowerVR SGX 543MP32 x 32-bit LPDDR22012-9-12
Apple A6X32nm2 x Apple Swift @ 1.4GHzPowerVR SGX 554MP44 x 32-bit LPDDR22012-10-23
NVIDIA Tegra 240nm2 x ARM Cortex A9 @ 1GHzULV GeForce T21 x 32-bit LPDDR22010-1-8
NVIDIA Tegra 3/Kal-El40nm4 x ARM Cortex A9 w/ MPE @ ~1.3GHzULV GeForce T31 x 32-bit LPDDR22011-11-8
NVIDIA Tegra 4/Wayne28nm4 x ARM Cortex A15MPCore w/MPEULV GeForce T42 x 32-bit LPDDR22012-1
Samsung Exynos 421045nm2 x ARM Cortex A9 w/ MPE @ 1.2GHzARM Mali-400 MP42 x 32-bit LPDDR22011-2-10
Samsung Exynos 421232nm2 x ARM Cortex A9 w/ MPE @ 1.5GHzARM Mali-400 MP42 x 32-bit LPDDR22011-10-1
Samsung Exynos 525032nm2 x ARM Cortex A15MPcore w/ MPE @ 1.7GHzARM Mali-6042 x 32-bit LPDDR22011-11-30
Qualcomm MSM8060/8260/866045nm2 x Scorpion @ 1.5GHzAdreno 2201 x 32-bit LPDDR2*2011-2-10
Qualcomm MSM896028nm2 x Krait @ 1.5GHzAdreno 2252 x 32-bit LPDDR22011-2-14
Qualcomm MSM8960T28nm2 x Krait @ 1.7GHzAdreno 3202 x 32-bit LPDDR22012-2-27
Qualcomm APQ806428nm4 x Krait @ 1.7GHzAdreno 3202 x 32-bit LPDDR22011-2-14

它們都屬於 ARMv7 架構,架構寄存器數量為 16 個,其中 Tegra 2/3、Exynos、A5/A5X 的 CPU 核心是 Cortex A9 或者 Coretx A15,都是來自於 ARM 的 IP core 授權,而 A6/A6X 的 Swift 和高通的 Scorpion/Krait 則分別是蘋果和高通獲得 ARM 架構授權後而各自自行開發的。

眾所周知,IP core 的全稱是 Intellectual Proerty core,意即智慧財產權內核,是目前各種嵌入式應用、個人智能消費類設備中最為常見技術類型,數十億計的產品都採用了來自 ARM、MIPS 的 IP core。IP core 被設計成可以和晶片中其他邏輯單元(例如視頻編解碼器、I/O 界面、內存界面)協同運作形成一枚可以支持特定應用的處理器。

IP core 分為兩類:硬核(hard core......不要會錯意了)和軟核(soft core)。硬核是針對特定半導體廠商而優化的,對外人來說是一個提供了外部界面、不修改的「黑盒子」,獲得授權的廠商通常只能對核外的邏輯參數進行修改,例如 L2 cache 大小,但是 IP core 本身不可修改。而軟核的設計代碼則是可以針對不同半導體廠商做編譯和修改,當然這要求設計廠商具備強大的研發實力和經驗,因為現在的 IP core 相當複雜。

簡而言之而言,硬核的性能更高、佔用管芯面積更小,而軟核則可以讓不同廠商作進一步的修改。

同类文章
銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

銳龍7000馬甲太多?全新貼紙一招快速辨別Zen4處理器

  今年,AMD銳龍7000系列筆記本處理器四種架構五大系列混雜,其中只有兩個系列採用了全新架構,其餘為舊款重製的馬甲型號,這可能讓不少普通消費者感到困惑,無從辨別哪一款才是全新的「Zen4」架構CPU。  最近,AMD向合作夥伴發布了新的材料,解釋稱當筆記本電腦上的橙色貼紙意味著它基於 Zen4
AMD品牌日來襲 京東11.11促銷火熱進行中

AMD品牌日來襲 京東11.11促銷火熱進行中

  隨著前兩天AMD京東11.11開門紅活動盛大開啟,豐富的AMD全線產品促銷盛宴讓廣大玩家激動不已,而活動仍然在火熱進行中,現已成功進入第二階段,更多驚喜的超值促銷等待著DIY玩家們的繼續參與。本次活動11月6日為AMD品牌日,活動熱力持續升級包含了直降秒殺、滿減、套包鉅惠、返E卡等豐富的活動豪禮

優異旗艦處理器還用矽脂?Intel這波可不夠良心

    Intel 在今年發布了全新發燒級的酷睿處理器i9,性能一下子有了不小的提升,玩家們也都開玩笑說道,多年來擠牙膏的 Intel 這次是擠多了。在性能提升的同時,玩家們還希望的就是 Intel 能夠放棄使用矽脂,不過先發售的i9-7900X並沒有做到。    在處理器的核心與頂蓋之間使用釺焊代
AMDQ1虧損超1億 賣X86技術給中國廠商

AMDQ1虧損超1億 賣X86技術給中國廠商

    Intel日前的財報表現還不錯,但為了轉型,依然要裁員1.2萬人。老對手AMD今天也發布了今年Q1季度財報,當季營收8.32億美元,下滑了19%,不出意外地還是虧損了1.09億美元,但與去年同期1.8億美元的虧損相比已經收窄,已經在改善業績了。對AMD來說,他們開闢新業務還是蠻成功的,AMD
國產新超算推遲?棄Intel換自主CPU

國產新超算推遲?棄Intel換自主CPU

    目前世界上最快的超級計算機的我國的「天河2號」,它每秒能完成5億億次運算,超算廣州中心主任尹學峰近日稱,天河2號利用率在60%,可見需求還是很廣泛。    剛剛,曙光公司總裁歷軍近日在接受記者採訪時表示,繼千萬億次超級計算機曙光「星雲」之後,「十億億次」超級計算機曙光7000已開始研發。  
Intel會推配備優異核顯Skylake-C嗎?

Intel會推配備優異核顯Skylake-C嗎?

    由於14nm工藝的延期及戰略調整,Intel今年的桌面版Broadwell處理器有些尷尬——比預定時間晚了一年,沒發布多久就碰上了Skylake處理器上市。但另一方面,Broadwell桌面版又非常讓人期待,因為它是首款配備128MB緩存優異核顯的桌面處理器,圖形性能比普通核顯強多了。考慮到
體驗14nm的魅力 Skylake主機配置推薦

體驗14nm的魅力 Skylake主機配置推薦

    伴隨著更多Intel 14nm Skylake處理器、面向主流玩家的B150晶片組主板上市開售,以及DDR4內存的售價逐漸步入廣大普通消費者能夠接受的範圍,大傢伙終於可以在不擔心「預算爆表」的前提下愉快的組一套新主機來體驗14nm工藝帶來的「快感」了。    為什麼要這麼說呢?因為在Inte
桌面Broadwell要停產?Intel:不可能!

桌面Broadwell要停產?Intel:不可能!

    Broadwell五代酷睿是Intel歷史上比較奇怪的一代產品,主要精力都放在了移動平臺上(當然還有下一步的伺服器),而桌面上只有區區兩款i7-5775C、i5-5675C,還都是直接從移動版移植過來的。    這倆稀缺之物還有一個與眾不同的亮點,那就是保留了GT3e Iris Pro核芯顯
散熱器損壞Skylake處理器:真的掰彎了

散熱器損壞Skylake處理器:真的掰彎了

    之前有消息稱Skylake處理器很可能因為PCB變薄導致大型散熱器損害處理器,本來以為這個問題只不過是示警,但現在已經有杯具案例了——已經有用戶的Skylake處理器真的變彎了,甚至主板插槽也變形了,這下可要真的注意了。此外,除了鐮刀、貓頭鷹之外,越來越多的散熱器廠商也表態了。    之前我
Intel確認:Skylake處理器存死機Bug

Intel確認:Skylake處理器存死機Bug

    雖然PC走勢漸弱,Intel也把精力開始投入到了虛擬實境、物聯網等領域,但談及2015最激動的事,Intel CEO前不久亮相CES時還是把榮耀頒給了Skylake處理器。    作為第六代酷睿,Skylake驚喜並沒有達到讓所有人眼前一亮,性能就不談了,上市後還被曝出像是i3 TDP弄錯、