新四季網

面向層次形全連通的片上網絡的核映射方法

2023-05-18 19:26:56 3

專利名稱:面向層次形全連通的片上網絡的核映射方法
技術領域:
本發明涉及系統級晶片和片上網絡領域,特別是涉及一種層次形全連通的 片上網絡上的核映射方法。
背景技術:
隨著納米級CMOS集成電路技術和片上系統(SoC)技術的不斷發展,片上多 處理器(CMP)技術開始朝多核化(幾十或上百個核)和異構化(即包含不同類型的 核)的方向發展。目前,SoC設計中廣泛採用的共享總線結構存在許多問題,是 影響CMP性能的主要瓶頸-
(1) 帶寬限制。總線是一種共享介質的互連結構,某一時刻只允許一個設備 使用總線,仲裁邏輯允許高優先級的設備獲得總線的使用權。在總線被佔用期 間,其他所有請求被阻塞,直到總線空閒。當很多部件爭用一條總線時,會造 成嚴重阻塞,並會降低總線頻率等。
(2) 信號集成度。更低的電源電壓及更小的特徵線寬使得整個SoC系統對電 流中的噪聲更加敏感,而共享介質上的功能部件則進一步加重了噪聲。
(3) 信號延遲。隨著集成特徵尺寸的下降,連線延遲成為影響信號延遲的主 要因素。總線結構是全局控制的,在10億電晶體時代,全局連線延遲大於時鐘 周期,因此,總線結構的全局連線使得時鐘的偏移很難管理。
(4) 全局同步。全局連線上的信號延遲決定了系統的時鐘周期,為了保持甚 至提高系統時鐘頻率,只能對全局連線進行分布式流水線模式,或採用全局異 步局部同步(GALS)的時鐘模式。
由於共享總線結構己經無法滿足SoC系統的需要,因此把互連網絡用於片 上系統設計,解決片上組件之間的通信問題,即片上網絡(Network-on-chip, NoC)。 NoC技術以其支持同時訪問、可靠性高、可重用性高等特點成為更理想的 大規模CMP互連技術。NoC克服了總線結構可擴展性差的缺點,為10億電晶體 時代提供了一種可行的片上系統通信機制。它除了可以連接更多的IP組件,與 總線結構相比,還有高可重用性等特點。可重用性是SoC設計的一個重要設計 原則。可重用性設計可以節省設計成本、提高設計的可靠性、縮短產品的上市 周期。在基於總線的SoC設計中,各個IP組件是可重用的,但通信結構無法重 用,必須重新設計;在NoC中,各組件是可重用的,片上通信結構及片上通信服務也是可重用的。設計新系統時,只須在原系統上添加路由部件和功能部件, 大大加快了設計的進度。
NoC上的核映射是NoC設計中的一個重要步驟,確定了SoC所選用的IP核之 後,核映射就決定了從IP核到NoC體系結構的對應關係。不同的映射結果,對於 系統的通信時延、通信能耗等性能有著重要的影響。為了減小NoC上的通信能耗, 需要找到一種核映射結果使得所有核之間的通信帶寬要求與通信距離的乘積和 要儘可能的小。NoC上的核映射等同於受約束的二次分配問題,直接的做法是用 智能算法來尋找較優的映射結果。但是當NoC規模變大時,智能算法的執行時間 會呈指數級增長。因此,許多研究者提出了各種算法來縮短尋找映射結果的時 間。但目前只有在二維網格結構的片上網絡上來尋找映射結果的算法,還沒有 針對層次形全連通的片上網絡提出一種快速尋找映射結果的算法。

發明內容
本發明的目的在於提供一種面向層次形全連通的片上網絡的核映射方法。 本發明解決其技術問題採用的技術方案如下
1) 快速產生初始核映射
第一步,根據片上網絡中全連通網絡結構來對核進行聚類,使得通信帶寬 要求大的核聚集到同一個類中,類的個數等於全連通網絡結構中的節點數,每 個類中的核的數量相等;
第二步,對第一步中產生的類進行聚類,重複執行第一步中的聚類過程, 直到新產生的類中核的數量等於片上網絡中全連通網絡結構的節點數;
第三步,計算下一次聚類產生的每個類與不是自己所在的上一次聚類產生 的每個類之間的通信帶寬要求來確定下一次聚類產生的每個類在片上網絡上的 映射位置;重複進行迭代計算過程,直到確定了每個核在片上網絡上的映射位
2) 用遺傳算法優化初始核映射
用初始核映射作為遺傳算法的種子,設定遺傳算法的迭代次數,在迭代過 程結束後產生最終的核映射結果。
與現有技術相比,本發明的有益效果是-
(1)高效性。本發明實現了一種面向層次形全連通的片上網絡的核映射方 法,在片上網絡規模變大時,用遺傳算法來尋找映射結果時隨機產生遺傳算法 的種子的時間會呈指數級增長,而本發明的方法能夠快速地產生初始核映射作為遺傳算法的種子,因此明顯縮短了層次形全連通的片上網絡的核映射時間。 而且本發明的方法產生的初始核映射把通信帶寬要求大的核放到相臨較近的位 置,比隨機產生的核映射的結果要好,因此產生相等的核映射結果本發明的方 法中遺傳算法需要的迭代次數要少,縮短了遺傳算法的運行時間,從而縮短了 層次形全連通的片上網絡的核映射時間。
(2) 可靠性。本發明通過對層次形全連通的片上網絡的結構進行仔細的分 析,仔細地設計了產生層次形全連通的片上網絡的初始核映射的過程,並仔細 地設計了遺傳算法的運行過程,保證了算法最終能夠產生核映射結果。
(3) 實用性。本發明提出的一種面向層次形全連通的片上網絡的核映射方 法,可以稍做修改用於不同拓撲結構的片上網絡中。


圖1是16個節點的層次形全連通的片上網絡的示意圖。 圖2是64個節點的層次形全連通的片上網絡的示意圖。 圖3是產生層次形全連通的片上網絡的核映射結果的算法示意圖。
具體實施例方式
1) 層次形全連通的片上網絡
層次形全連通的片上網絡(WK-recursive NoC)是一種非常重要拓撲結構的 片上網絡。層次形全連通的片上網絡是由基本單元遞歸地構造,基本單元可以 是任意節點數的全連通網絡。下面為了方便,用WK(d,t)來表示一個有t層網絡, 基本單元是d個節點的全連通網絡的層次形全連通的片上網絡,其中d>l, 21. 圖1是16個節點的層次形全連通的片上網絡,可以用WK(4,2)表示,4表示基 本單元是4個節點相互之間都連通的網絡,2表示整個層次形全連通的片上網絡 有兩層遞歸的網絡結構。圖2是64個節點的層次形全連通的片上網絡,可以用 WK(4,3)表示,3表示整個層次形全連通的片上網絡有三層遞歸的網絡結構。
2) 快速產生初始核映射
下面用WK(4,3)的層次形全連通的片上網絡來說明整個算法的運算過程,如 圖3所示
第一步,根據片上網絡中全連通網絡結構來對核進行聚類,使得通信帶寬 要求大的核聚集到同一個類中,類的個數等於全連通網絡結構中的節點數,每 個類中的核的數量相等
WK(4,3)的層次形全連通的片上網絡中的全連通網絡結構的節點數是4,所 以把64個核分成4類,每個類中有16個核。首先,從64個核中選出相互之間
5通信帶寬要求最大的兩個核,然後從剩下的62個核中選出一個與前面已經選出 的兩個核通信帶寬要求的和最大的核,接著選出一個與前面已經選出的三個核 通信帶寬要求的和最大的核,直到選出了16個核,這樣就構成了一個類。把第 一個選出的類放到圖2中標號以"0"為開頭的WK(4,2)的層次形全連通的片上 網絡中,重複前面的過程,把接著選出的三個類按先後順序分別放到標號以"l" 為開頭、以"2"為開頭、以"3"為開頭的WK(4,2)的層次形全連通的片上網絡 中.
第二步,對第一步中產生的類進行聚類,重複執行第一步中的聚類過程, 直到新產生的類中核的數量等於片上網絡中全連通網絡結構的節點數
對第一步中產生的4個類都重複第一步的過程,把每個類都再分成4個類。 因為這樣新產生的每個類中都包含4個核,等於全連通網絡結構的節點數4,所 以第二步的運算完成。如果是WK(4,4)的層次形全連通的片上網絡,第二步就需 要重複執行兩次第一步中的聚類過程。
第三步,計算第二次聚類產生的每個類與不是自己所在的第一次聚類產生 的每個類之間的通信帶寬要求來確定第二次聚類產生的每個類在片上網絡上的 映射位置
現在要調整每個基本單元在WK(4,2)中的位置。分別計算標號以"0"為開 頭的WK(4,2)的層次形全連通的片上網絡中的4個基本單元與不是自己所在的 另外三個WK(4,2)之間的通信帶寬要求。把通信帶寬要求最大的基本單元放到位 置最近的位置上,假如前面的計算得到基本單元(000,001,002,003)和標號以"2" 為開頭的WK(4,2)的通信帶寬要求最大,則把原來基本單元(000,001,002,003)上 的核放到基本單元(020,021,022,023).接著分別調整通信帶寬要求第二和第三大 的基本單元的位置來縮短通信距離,最後把通信帶寬要求最小的核放到基本單 元(000,001,002,003).重複前面的過程,分別調整另外三個WK(4,2)的層次形全連 通的片上網絡中的基本單元的位置。
第四步,在第三步的映射結果基礎上,重複進行第三步的迭代計算過程, 直到確定了每個核在片上網絡上的映射位置
在每個WK(4,2)的層次形全連通的片上網絡中,計算每個核與不是自己所在 的另外三個基本單元之間的通信帶寬要求,按照第三步的過程來調整每個核的 位置。
3)用遺傳算法優化初始核映射
用初始核映射作為遺傳算法的種子,設定遺傳算法的迭代次數,在迭代過程結束後產生最終的核映射結果。
遺傳算法的所有種子都是前面產生的初始核映射,根據核映射結果的要求 來設定遺傳算法的迭代次數,在遺傳算法運算結束時產生最終的核映射結果。
權利要求
1. 一種面向層次形全連通的片上網絡的核映射方法,其特徵在於1)快速產生初始核映射第一步,根據片上網絡中全連通網絡結構來對核進行聚類,使得通信帶寬要求大的核聚集到同一個類中,類的個數等於全連通網絡結構中的節點數,每個類中的核的數量相等;第二步,對第一步中產生的類進行聚類,重複執行第一步中的聚類過程,直到新產生的類中核的數量等於片上網絡中全連通網絡結構的節點數;第三步,計算下一次聚類產生的每個類與不是自己所在的上一次聚類產生的每個類之間的通信帶寬要求來確定下一次聚類產生的每個類在片上網絡上的映射位置;重複進行迭代計算過程,直到確定了每個核在片上網絡上的映射位置;2)用遺傳算法優化初始核映射用初始核映射作為遺傳算法的種子,設定遺傳算法的迭代次數,在迭代過程結束後產生最終的核映射結果。
全文摘要
本發明公開了一種面向層次形全連通的片上網絡的核映射方法。本發明實現了快速產生初始核映射和用遺傳算法來優化初始核映射。本發明是充分利用了層次形全連通網絡拓撲的片上網絡的特點從而有效地實現了層次形全連通的片上網絡上的核映射方法。在遺傳算法運行前快速產生一種比隨機產生要好的初始核映射,明顯地縮短了層次形全連通的片上網絡的核映射時間。本發明可用於不同拓撲結構的片上網絡中。
文檔編號G06N3/00GK101505271SQ20091009595
公開日2009年8月12日 申請日期2009年2月26日 優先權日2009年2月26日
發明者吳斌斌, 居立晗, 施青松, 滿 曹, 超 王, 威 胡, 度 陳, 陳天洲, 馬建良 申請人:浙江大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀