新四季網

Mimo檢測方法

2023-09-15 10:42:35 2

專利名稱:Mimo檢測方法
技術領域:
本發明涉及無線通信技術領域,尤其涉及一種MIMO檢測方法。
背景技術:
在分布式無線通信系統(DWCS)中,越來越多地將多輸入多輸出(MIMO)技術與正交頻分復用(OFDM)技術相結合。這是因為MIMO技術能夠通過增強無線通信系統的分集和容量來提高數據傳輸速率,而OFDM技術能夠通過減少頻率選擇性衰落的影響而降低均衡器複雜度,同時提高頻譜效率。將兩者有機結合構成的MIM0-0FDM系統,已經在4G無線通信標準中廣泛使用,例如LTE/LTE-Advanced、WiMAX等。而在MIM0-0FDM系統中,一個關鍵的模塊是MIMO信號檢測模塊。常用的MIMO檢測算法可以分為線性檢測算法(最小均方誤差(MMSE)、迫零(ZF)等)和非線性檢測算法 (基於最大似然(ML)、球形解碼(SD)、K-Best等)兩大類。其中,基於最大似然的檢測算法誤碼率最小,但複雜度最高,特別適用於存在大頻率選擇性衰落的惡劣信道。而最小均方誤差算法誤碼率相對較高,但實現複雜度較低。考慮到降低數據突發錯誤率的需要,現有技術在LTE/LTE-Advanced等4G協議中採用了自適應信道估計、預編碼矩陣指示(PMI)反饋等技術,從而大大提高了信道質量。此時,與最大似然算法相比,MMSE檢測算法也可以達到期望的誤碼率。由於MMSE檢測算法需要對大量信道矩陣進行求逆運算,且無線通信系統特別是在高速傳輸的新型無線通信系統中,對數據業務實時性要求非常高。傳統的基於CPU的 MMSE檢測器運算複雜、檢測耗時長,很難達到數據業務實時性要求。

發明內容
(一)要解決的技術問題本發明要解決的技術問題是如何降低MIM0-0FDM系統中MIMO信號檢測運算的複雜度、縮短檢測時間。( 二 )技術方案為解決上述問題,本發明提供了一種MIMO檢測方法,包括以下步驟A 將信道矩陣和接收信號數據從CPU設備端的內存傳輸到GPU設備端的全局存儲器中;B 根據匪SE算法調用CUDA內部函數在GPU上多線程並行計算匪SE檢測子的符號估計值,並將所得符號估計值存儲到所述全局存儲器中;C 將所述符號估計值從所述全局存儲器傳輸到CPU設備端的內存中。優選地,所述步驟B中,根據MMSE算法調用CUDA內部函數在GPU上多線程並行計算匪SE檢測子的符號估計值包括Bl 計算匪SE檢測子的內核J,J = HhH+Im/P,其中P表示信噪比,Im表示MXM 維的單位陣,上標H表示共軛轉置;
B2 計算內核J的逆矩陣Γ1 ;B3 計算匪SE檢測子Gmmse及相應的符號估計結果i ;Gmmse = J-1Hh
_7] i = GMMSEy。優選地,所述步驟B1、B2和B3,進一步包括將計算結果存儲於所述全局存儲器中的步驟。優選地,所述步驟Bl和B2,進一步包括使一個計算線程塊處理多個信道矩陣,且計算線程塊中的一個計算線程對信道矩陣的一行或一列進行處理的步驟。優選地,所述步驟A,進一步包括利用函數cudaMemcpyAsync將信道矩陣和接收信號數據從CPU設備端的內存拷貝到GPU設備端的全局存儲器中的步驟。優選地,所述步驟C,進一步包括利用函數cudaMemcpyAsync將所述符號估計值從所述全局存儲器拷貝到CPU設備端的內存中的步驟。(三)有益效果本發明的方法採用基於流水線的CPU與GPU協同工作模式,在CPU與GPU進行數據傳輸的同時,能夠在GPU上進行數據的並行處理。並且本發明的方法通過採用三個核函數,將任務進行拆分,在達到快速同步的同時,降低了運算的複雜度、減小了傳輸時延,提高了整個算法的執行效率,縮短了檢測時間。


圖1為本發明實施方式中所述MIMO檢測方法的流程圖;圖2為本發明實施方式中所述不同數據量下吞吐量的比較圖。
具體實施例方式下面結合附圖和實施例,對本發明的具體實施方式
作進一步詳細描述。以下實施例用於說明本發明,但不用來限制本發明的範圍。如圖1所示,本發明所述的MIMO檢測方法,包括以下步驟A 將信道矩陣和接收信號數據從CPU設備端的內存傳輸到GPU設備端的全局存儲器中;本步驟中,利用函數cudaMemcpyAsync將信道矩陣和接收信號從CPU設備端的內存傳輸到GPU的全局存儲器。B 根據匪SE算法調用CUDA內部函數在GPU上多線程並行計算匪SE檢測子的符號估計值,並將所得符號估計值存儲到所述全局存儲器中;具體可通過以下步驟實現Bl 計算匪SE檢測子的內核J,J = HhH+Im/P,其中P表示信噪比,Im表示MXM 維的單位陣,上標H表示共軛轉置;B2 計算內核J的逆矩陣Γ1 ;B3 計算匪SE檢測子Gmse及相應的符號估計結果i ;Gmnse = T1Hh
4
χ = GMMSEy。所述步驟B1、B2和B3,進一步包括將計算結果存儲於所述全局存儲器中的步驟。所述步驟Bl和B2中,可使一個計算線程塊處理多個信道矩陣,且計算線程塊中的一個計算線程對信道矩陣的一行或一列進行處理。例如,本發明設定一個線程塊處理多個矩陣,即對於1個MXM的矩陣,設一個線程塊含有M個線程,每個線程依次把矩陣中的元素讀入到共享存儲器中,再按照上述公式分別進行矩陣共軛轉置、矩陣乘法、矩陣加法、矩陣求逆等處理。這樣,就可以把在CPU上對各個信道矩陣的串行MIMO信號檢測,轉換為同時對多個信道矩陣的並行執行。C 將所述符號估計值從所述全局存儲器傳輸到CPU設備端的內存中。本步驟中,可利用函數cudaMemcpyAsync將所述符號估計值從所述全局存儲器拷貝到CPU設備端的內存中。一個帶有M根發射天線、N根接收天線的MIM0-0FDM系統可以表示為y = Hx+w, 其中,y = [y。,Y1,... , yN-JT是NX 1維的接收信號矢量,上標T表示轉置,H是NXM維的 MIMO信道矩陣,χ是MX 1維的發射信號矢量,w是MX 1維的高斯白噪聲矢量。基於匪SE準則的MIMO檢測算法的基本思想是最小化估計值的均方誤差,即
min|^[(i-xf (i-x)]},其中,Ε[ ·]表示對隨機變量求數學期望,上標H表示共軛轉
置。那麼,匪SE檢測子可以表示為Gmmse = (HhH+Im/ ρ ) -1Hh = J-1Hh其中,P表示信噪比,Im表示MXM維的單位陣。相應的符號估計結果可以表示為
X - ^MMSEy。最新的NVIDIA Fermi架構的GPU,由14個流多處理器(SMs)組成,每個流多處理器包含32個CUDA核。每個SM可以作為一個單指令多線程(SIMT)的處理器,並且最高支持1536個並發線程。並且,每個SM還擁有48KB的共享存儲器,能夠支持快速低時延的數據訪問。在CUDA編程模型中,若干個線程(thread)組織在一起構成線程塊(block),若干個線程塊再組成一個網格(grid)。本發明還採用了一種基於多個子流的CPU與GPU協同工作方法,即將CPU與GPU 之間的數據傳輸與GPU上的核函數執行相重疊,在CPU向GPU傳輸數據的同時,可以在GPU 上繼續進行運算。類似地,在GPU運行時,可以將部分已經計算處理的結果傳回CPU。從而進一步提高了 MIMO檢測算法的速度。為了測試加速結果,本發明選取一個滿足LTE標準的測試床進行實驗,分別考慮 MIM0-0FDM系統的帶寬為5MHz、1 OMHz、15MHz、20MHz的情況,此時分別對應於0. 5ms的子幀間隔中存在300,600,900,1200個可用OFDM子載波。實驗中所採用的硬體配置如下CPU為 Intel Core i7_950 (主頻 3. 07GHz,內存6GB) ;GPU為 NVIDIA Tesla C205(K448個CUDA核處理器,主頻1. 15GHz,顯存3GB);作業系統是Win764位專業版;編程環境為Visual Studio 2008 ;CUDA版本為4. 0。為了便於描述加速結果,用Tepu表示基於匪SE的MIMO檢測算法在 CPU上的執行時間,用Tepu表示相應程序在GPU上的執行時間(包括GPU上核函數的運行時間與CPU和GPU之間數據拷貝時間的總和),用TmiZtepu表示加速倍數。表1給出了一個 4X464QAM的MMO-OFDM系統,信噪比固定為20dB,進行1000次獨立實驗時,不同帶寬下的CPU與GPU運行時間比較。從表中可以看出,對於相同接收信號而言,加速比隨著帶寬的增加而增加。並且GPU的處理時間小於信號駐留時間。
表 權利要求
1.一種MIMO檢測方法,其特徵在於,包括以下步驟A 將信道矩陣和接收信號數據從CPU設備端的內存傳輸到GPU設備端的全局存儲器中;B 根據匪SE算法調用CUDA內部函數在GPU上多線程並行計算匪SE檢測子的符號估計值,並將所得符號估計值存儲到所述全局存儲器中;C 將所述符號估計值從所述全局存儲器傳輸到CPU設備端的內存中。
2.如權利要求1所述的MIMO檢測方法,其特徵在於,所述步驟B中,根據MMSE算法調用CUDA內部函數在GPU上多線程並行計算MMSE檢測子的符號估計值包括B1:計算匪SE檢測子的內核J,J = HHH+IM/P,其中P表示信噪比,Im表示MXM維的單位陣,上標H表示共軛轉置; B2:計算內核J的逆矩陣Γ1;B3 計算匪SE檢測子G_及相應的符號估計結果i ; G_ = ΓΗηx = Gmmsb y。
3.如權利要求2所述的MIMO檢測方法,其特徵在於,所述步驟Bi、B2和B3,進一步包括將計算結果存儲於所述全局存儲器中的步驟。
4.如權利要求1所述的MIMO檢測方法,其特徵在於,所述步驟Bl和B2,進一步包括 使一個計算線程塊處理多個信道矩陣,且計算線程塊中的一個計算線程對信道矩陣的一行或一列進行處理的步驟。
5.如權利要求1所述的MIMO檢測方法,其特徵在於,所述步驟A,進一步包括利用函數cudaMemcpyAsync將信道矩陣和接收信號數據從CPU設備端的內存拷貝到GPU設備端的全局存儲器中的步驟。
6.如權利要求1所述的MIMO檢測方法,其特徵在於,所述步驟C,進一步包括利用函數cudaMemcpyAsync將所述符號估計值從所述全局存儲器拷貝到CPU設備端的內存中的步馬聚ο
全文摘要
本發明公開了一種MIMO檢測方法,涉及多輸入多輸出信號檢測技術領域,該方法包括以下步驟A將信道矩陣和接收信號數據從CPU設備端的內存傳輸到GPU設備端的全局存儲器中;B根據MMSE算法調用CUDA內部函數在GPU上多線程並行計算MMSE檢測子的符號估計值,並將所得符號估計值存儲到所述全局存儲器中;C將所述符號估計值從所述全局存儲器傳輸到CPU設備端的內存中。本發明的方法採用基於流水線的CPU與GPU協同工作模式,在CPU與GPU進行數據傳輸的同時,能夠在GPU上進行數據的並行處理。並且本發明的方法通過採用三個核函數,將任務進行拆分,在達到快速同步的同時,降低了運算的複雜度、減小了傳輸時延,提高了整個算法的執行效率,縮短了檢測時間。
文檔編號H04B17/00GK102523054SQ20111040492
公開日2012年6月27日 申請日期2011年12月7日 優先權日2011年12月7日
發明者李雲洲, 王京, 許希斌, 趙明, 鍾曉峰, 隋丹 申請人:清華大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀