全新酷睿2架構!Merom vs. Yonah對比
2023-07-13 11:00:01 1
Intel新一代Core微架構移動處理器Merom正式登場,將移動計算機性能推升至新紀元,究竟Merom和Yonah在微架構上有何不同、Centrino平臺Napa Refresh與即將在2007年Q2面市的Santa Rosa之間差異何在!?HKEPC編輯部找來Intel Core 2 Duo T7600與上代Core Duo T2700,作性能對比測試。
● 全新Core微架構-- Intel Merom移動處理器
儘管Intel Core微架構是基於Mobile平臺的Yonah核心所設計,但卻有超過7成的架構和線路被重新改良,並加入5項主要的改革,包括Intel Wide Dynmaic Execution、Intel Intelligent Power Capability、Intel Advanced Smart Cache、Intel Smart Memory Access及Intel Advanced Digital Media Boost。
Core(Merom) | Mobile Dual Core(Yonah) | NetBurst | AMD Mobile Dual Core | |
L2 Cache | Shared L2 & Higher BW | Shared L2 | Independent L2 | Independent L2 |
L2 Cache Size | 4MB | 2MB | 2MB x 2 | 512KB x 2 |
SSE Throughput | 128Bit/Cycle | 64Bits/Cycle | 64Bits/Cycle | 64Bit/Cycle |
Issue Width | 4 Issue | 3 Issue | 3 Issue | 3 Issue |
Pipeline Stage | 14 Stage | 13 Stage | 31 Stage | 12 Stage |
System Bus | Up to 800MHz for Mobile | Up to 667MHz | Up to 1066MHz | 800MHz HT |
Power Efficiency | Ultra Fine Power Gating | Aggressive Power Gating | Power Gating | Power Gating |
Memory Access | Improved Prefetch | Baseline Prefetch | Baserline Prefetch | Integrated Memory Controller |
Intel Wide Dynamic Execution -- Merom處理器擁有4組Decoder (3 Simple decoders + 1 Complex Decoders),比上代Yonah核心多出1組(2 Simple Decoders + 1 Complex Decoders) 可多處理1組Simple Coder指令, 進一步提升每周期的執行效率及提升處理器的能源效益。
雖然Merom的Pipeline Stage由Yonah的13 Stage輕微上升至14 Stage,但Merom的Branch Predictor Bandwitdh提升20Bytes(Yonah為16Bytes), 因此其分支預測的能力及準確性效率保持相若。
此外,Merom處理器不單保留了Micro-op Fusion技術,並同時追加全新的 Macro-Fusion 技術,在舊世代的微架構中,每個指令被送來時其解碼及執移動作是完全獨立的,但Intel Core微架構可以讓常見的指令組,例如1個Compare指令配隨後擁有1個Jump指令,組合成單一的Micro-Op指令,這令Merom處理器在特定情況下每個周期有運算5組指令,據Intel表示,大部份x86程序,約每10至15個指令就會出現1組可透過Macro -Fusion被組合,因此減少了程序執行所需運算時間、提升性能卻不會增加處理器的功耗,為此Intel亦改良ALU(Arithmetic Logic Unit)部份以支持Macro-Fusion技術。
Intel Intelligent Power Capability -- Merom處理器的電晶體數目對比Yonah大幅提升,功耗消耗亦會相對增加,而為令Merom處理器的功耗表現保持於合理水平,Merom加入Ultra Fine Grained省電設計,細微的邏輯控制機能獨立開關各運算單元,只有需要時才會被開啟,避免閒置時出現不必要的功耗浪費,稱為 Sleep Transistors技術,此外,把核心各個Buses及Array採用獨立控制其VCC電壓,當此部份被閒置時,將會被運作於低功耗模式中,因此Merom處理器在功耗表現可保持和Yonah處理器相約。
Intel Adcanced Smart Cache -- 早在Yonah處理器中,Intel已加入了Smart Cache架構,通過核心內部的Shared Bus Router共享相同的L2 Cache,而Merom進一步加強Prefetch能力,每顆核心均擁有3個獨立Prefetchers (2 Data and & 1 Instruction) 及2個L2 Prefetchers,能同時地偵出Multiple Streaming及Strided Acess Patterns,L2 Cache方面比Yonah倍增至 16-Way 256Bit 4MB容量,但Latechy卻保持在12-14ns之間,令Merom處理的Cache架構性能進一步提升。
Intel Smart Memory Access -- 為了提升內存讀取效率, Merom處理器加入全新的內存讀取技術稱為Memory Disambiguation,透過Out of Order過程把內存讀取次序作出分析,當發現某數據是完全獨立,則可讓它提早執行以減少處理器的等候時間減少閒置,同時減低內存讀取的延遲值。
Intel Adavanced Digital Media Boost -- Merom處理器擁有128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準度Floating-Point Operations。傳統的處理器設計只有64Bit的SIMD interger arithmetic及Floating-Point Operations,因此在執行 128Bit的SSE、SSE2及SSE3指令時,需要把指令分拆為2個64Bit指令,並需要2個頻率周期完成,但Core微架構則只需要1個頻率調期便能完成,執成效率提升達1倍,現時SSE指令集已經十分普遍地用於主流的軟體中,包括繪圖、影像、音像、加密及數學運算等用途,單周期128Bit處理器能力以頻率以外的方法提升性能,令處理器擁有高能源效益表現。