異構計算將會為AI應用帶來強大支持
2023-03-31 16:36:28 1
除了算法和數據,異構計算將為人工智慧應用提供更強大的支持,異構計算,尤其是加速器的開發和創新,將為行業、終端用戶和初創企業帶來更多無限的商機。
在一個由灶神主持的餐廳吃飯。慢慢發球。一定要等待。因為只有一個灶神。但是在競爭激烈的市場中,人工智慧技術的應用不能等待,否則它可能會被市場顛覆和淘汰。
人工智慧(AI)的研究已經持續了60多年,最近,人工智慧已經呈現出一種爆炸性的趨勢,不僅因為算法的改進和大數據的積累,而且由於計算能力的巨大改進和變化,企業和Inte。RNETGrand有自己的算法和數據,但它們在計算能力的獲取上總是有一個很高的門檻。今天我們關注的是AI時代的計算能力。
近年來,隨著矽片物理極限的逼近和經濟成本的增加,摩爾定律已經失效,傳統的通用處理器方法已經不能滿足人造int各種應用的爆炸性和高計算要求。因此,具有GPU、ASIC、FPGA或其他加速器(Accelerator)等高並行、密集計算能力的異構計算將繼續成為熱點,異構計算將成為支持更高級、更複雜的人工智慧應用的必然選擇。未來。
異構計算(HeterogeneousComputing,HeterogeneousComputing)是由具有不同指令集和體系結構的計算單元組成的計算系統,它是一種平衡性能、成本和功耗的技術。它還允許最合適的專用硬體做最合適的事情,如密集計算或外圍管理,從而實現性能和成本的優化。
CPU(CentralProcessingUnit)作為一種通用處理器,我們熟悉的CPU(CentralProcessingUnit)更注重對控制流數據的支持,CPU的每個物理核中的大部分硬體資源都做成控制電路和緩存,以提高指令的兼容性和效率。真正用於計算的邏輯運算單元(ALU)只佔CPU的一小部分。在沒有AI或其他高計算能力要求的情況下,CPU可以應付更多的工作。在人工智慧或計算能力要求較高的情況下,從計算任務執行效率的角度來看,雖然CPU可以與大量指令兼容,但實際計算效率不高。異構系統中核心功能的協調與控制。
打個比方,CPU可以看作是廚師,每個烹飪系的大廚都像手掌一樣,可以做出各種不同口味的菜餚,以滿足各種人的需要。但是因為廚師負責廚房的各個方面,他不能應付lar。葛數特種複合處理,如1000名客人食用各種馬鈴薯絲,如酸辣馬鈴薯絲、青椒馬鈴薯絲、油炸馬鈴薯絲,需要助手在短時間內切出大量相同長度和厚度的馬鈴薯絲。需要找到一個幫手(GPU,FPGA或ASIC)來幫助。這個助手可以同時處理許多土豆(並行處理),而且非常快(低延遲)。最後,通過與廚師的合理分工,可以滿足顧客對菜餚的需求。
也許有人會說,僱用另一個廚師來組成一個同質的廚房(均質計算)不好當然,這是多CPU以前所做的,但是基於目前基於AI應用的計算密集型負載,這種同構廚房具有明顯的缺點。首先,廚師很貴,而且他們不擅長某些特定的應用,比如快速切土豆絲。其次,廚師是健忘的,需要經常查看菜譜(訪問記憶)。因此,一個高效的廚房需要廚師和一群擅長各種任務的廚師之間的有效溝通和協作。
我們知道,在異構計算廚房中,除了主廚CPU之外,還有很多輔助設備,如GPU、ASIC、FPGA、DSP等,那麼這些計算單元的優勢是什麼
GPU是圖形處理單元的縮寫。顧名思義,它是一種專門處理個人計算機、工作站、遊戲機以及一些行動裝置(如平板電腦、智慧型手機等)的圖像的微處理器。其主要原因是它適合GPU的多核結構,用於大規模多任務的簡單操作,如神經網絡。這就像成千上萬的客人同時點了酸辣的馬鈴薯絲,他們需要很多幫助才能快速地切出數萬盤馬鈴薯絲。
然而,儘管GPU能快速而好地切土豆,但是如果你想告訴他切多少土豆,切多少土豆,再加入多少青椒,那麼你就到冰箱裡去買些豬肉,做一道複雜的菜,這超出了你的能力。複雜的控制過程會產生大量的分支,而GPU中的控制單元負責多個計算單元,因此,如果要使用GPU,就必須有簡單的指令,尤其是控制分支越少,效果越好。
此外,GPU還有CPU廚師的問題:健忘(需要從內存中讀取指令)。這帶來了一系列的問題,如存儲牆、高功耗、基於指令系統、解碼等。
專用集成電路(ASIC)的全稱是應用專用集成電路(ApplicationSpecificIntegrationCir.),它是定製的,這意味著不需要糾纏於CPU和GPU如何分配控制資源和計算資源,以及如何分配這些資源。
程式語言越接近底層硬體,其運行速度就越快。所有的ASIC設計都直接建立在物理硬體(門電路)上。同時,由於具有高度定製性,可以設計用於PPA優化的晶片(PPA是性能、功耗和面積的縮寫)。
這樣,ASIC就像一個全自動定製馬鈴薯切碎機。你只要把土豆扔進粉碎機,土豆絲就會很快被切掉,形狀一致性好,能耗低,節省空間。
可以看出,這種定製的機器是廚房工件,它已經贏得了CPU和GPU。但是定製的機器也有它的缺點。如果顧客想改變口味,吃土豆和烤雞,他們需要把土豆切成塊。這樣,切割機就沒用了,市場上也沒有現成的切割機,需要重新定製。
現場可編程門陣列,或稱現場可編程門陣列,是在PAL、GAL、CPLD等可編程器件的基礎上進一步發展的產物。關鍵字是可編程的,這意味著靈活性。E可用於布線資源。當顧客需要土豆絲時,他們可以定製為碎紙機。當他們需要馬鈴薯片時,他們就會變成碎紙機。而且,正是由於FPGA中大量的可編程邏輯使得它可以真正並行實現。不同的處理操作不需要競爭相同的資源。每個獨立的處理任務都配備有專用電路,可以獨立操作,不受其他邏輯塊的影響,因此,當增加更多的處理任務時,不會影響其他應用程式的性能。
當然,在FPGA的開發中也存在著不足之處,主要問題在於開發上,大多數異構算法的開發人員都是軟體人員,對FPGA和數字電路的結構缺乏了解,程式語言也不統一(CPUenD是C、C++;FPGA端是VHDL、Verilog等底層硬體描述語言。目前對該問題的解決方案是OpenCL和HLS(高級綜合)技術,支持C和C++代碼直接編譯成Verilog。目前,這些技術的成熟還需要一段時間,轉換效果還有待提高。
總之,一個有效的人工智慧計算能力(廚房)系統對每個人都是必要的。這個廚房需要有經驗的廚師(CPU)和熟練的廚師(加速器)。在廚師的協調指導下,在各自展會實力的幫助下,進行有效的合作,從而做到飽滿。充分滿足顧客不斷變化的美味菜餚需求。
CPU和加速器之間協作的一個好例子是使用IBMPOWER9處理器的新一代伺服器。POWER9是為當前和未來計算密集型AI工作負載而設計的。它是嵌入PCI-Express4.0、新一代NVIDIANVLink2.0(GPU和CPU之間的無縫連接)和OpenCAPI25Gbps(PCIe3.0的3倍吞吐量)中的第一個通道,這是支持異構的最現實的著陸實體。計算。
當然,除了支持異構計算之外,POWER9伺服器還優化了AI負載,例如大大提高了諸如Chainer、TensorFlow和Caffe等主要AI框架的性能,以及加速了諸如Kinetica之類的資料庫。速度更快,包括深入學習洞察力、實時欺詐檢測和信用風險分析。POWER9也是美國能源部首腦會議和獅子山超級計算機的核心,它們已成為世界上最強大、最智能的超級計算機之一。此外,谷歌還採用了基於POWER9處理器的異構計算平臺,用於各種複雜的人工智慧負載。
除了算法和數據,異構計算將為人工智慧應用提供更強大的支持,異構計算,尤其是加速器的開發和創新,將為行業、終端用戶和初創企業帶來更多無限的商機。