新四季網

一種基於神經元網絡的數據降維系統及其降維方法

2023-05-23 21:03:46 5

一種基於神經元網絡的數據降維系統及其降維方法
【專利摘要】一種基於神經元網絡的數據降維系統及其降維方法,包括數據採集系統,所述的數據採集系統同控制系統相連接,所述的控制系統中帶有基於神經元網絡的數據降維模塊。並結合其降維方法可有效避免現有技術中的運算量還是很大、鄰域確定的不確定性以及無實用性的缺陷。
【專利說明】一種基於神經元網絡的數據降維系統及其降維方法

【技術領域】
[0001] 本發明屬於數據降維【技術領域】,具體涉及一種基於神經元網絡的數據降維系統及 其降維方法。

【背景技術】
[0002] 目前的圖像、視頻還有一些複雜的通信信號在數據採集系統傳輸到控制系統中, 通常是以高維的數據形式進行存儲的,這樣就帶來了在使用過程中佔用控制系統的資源過 多並且運算量大非常耗時的問題,嚴重的甚至可以導致控制系統崩潰的問題。
[0003] 因此現有的控制系統普遍採用了把從數據採集系統得來的諸如圖像、視頻還有一 些複雜的通信信號所構成的高維數據在使用之前進行降維處理,但是現有的降維方式普遍 存在以下問題:
[0004] (1)運算量還是很大:比如在現有的降維算法下的基於k近鄰圖的測地線距離步 驟的時間複雜度為0(kN2logN),而保距映射步驟的時間複雜度為0(N3),這樣的運算下時間 複雜度是非常大的;
[0005] (2)鄰域確定的不確定性:現有的降維算法使用k近鄰圖進行測地線距離的計算, 但是早在2002年science雜誌中就有文章發表質疑,k過大導致短路誤差,k過小導致碎片 的問題,並且解決的方法只能是選擇合適的k來進行不確定的降維,這樣同樣會導致運算 量的複雜度的增加,往往會出現降維結果同原高維數據的誤差相比誤差過大,甚至於完全 失真;
[0006] (3)無實用性:新來高維數據點會改變整個k近鄰圖,需要全部重新計算,難以在 線處理從而無實用性。


【發明內容】

[0007] 本發明的目的提供一種基於神經元網絡的數據降維系統及其降維方法,包括數據 採集系統,所述的數據採集系統同控制系統相連接,所述的控制系統中帶有基於神經元網 絡的數據降維模塊。並結合其降維方法可有效避免現有技術中的運算量還是很大、鄰域確 定的不確定性以及無實用性的缺陷。
[0008] 為了克服現有技術中的不足,本發明提供了一種基於神經元網絡的數據降維系統 及其降維方法方法的解決方案,具體如下:
[0009] -種基於神經元網絡的數據降維系統,包括數據採集系統1,所述的數據採集系統 1同控制系統2相連接,所述的控制系統2中帶有基於神經元網絡的數據降維模塊3。
[0010] 所述的一種基於神經元網絡的數據降維系統的測量降維方法,步驟如下:
[0011] 步驟1 :首先數據採集系統把採集來的圖像或者視頻這樣的信號數據發送到控制 系統2中,然後控制系統2啟動基於神經元網絡的數據降維模塊3先把發送來的圖像或者 視頻這樣的信號數據構造成高維數據集進行存儲;
[0012] 步驟2:接著基於神經元網絡的數據降維模塊3對高維數據進行確定流形拓撲結 構基準點的處理,所述的對高維數據進行確定流形拓撲結構基準點的處理,具體說來所述 的對高維數據進行確定流形拓撲結構基準點的處理的具體過程為先進行初始化,所述的 初始化包括首先設定基準點集合A= ,其中A為基準點集合,1^為第一基準點,L2S 第二基準點,第一基準點和第二基準點是隨機的從高維數據集中選取的兩個高維數據;然 後基於神經元網絡的數據降維模塊3設定邊集合C、初值均為0的兩個激活數變量、初值為 |LfL2| |的兩個範圍閾值變量和初值為0的第一連接年齡變量,所述的Cgjxi 並且其初值為空集,AXA表示基準點集合的基準點之間的連接關係,初值為空集表示第一 基準點和第二基準點之間沒有初始連接,所述的兩個激活數變量分別為針對第一基準點的 激活數變量和針對第二基準點的激活數變量,針對第一基準點的激活數變量和針對第二 基準點的激活數變量分別為,所述兩個範圍閾值變量分別為第一範圍閾值變量 7^和第二範圍閾值變量&,所述的第一連接年齡變量^表示的是第一基準點和 第二基準點的連接時長;
[0013]步驟3 :接著進入輸入與競爭階段,所述的輸入與競爭階段包括數據採集系統繼 續一個採集圖像或者視頻這樣的信號數據,並把採集來的一個圖像或者視頻這樣的信號數 據發送到控制系統中,控制系統中的基於神經元網絡的數據降維模塊3先把接收到的一個 圖像或者視頻這樣的信號數據存儲為一個高維數據,所述的高維數據作為一個新的數據樣 板€GRD,其中所述的新的數據樣板為L所述的RD表示高維實數空間,所述的R表示實 數,D表示高維數據的維度,然後計算出A中的每個基準點和新的數據樣板I的歐氏距離, 所得到的最小的歐式距離所對應的基準點和倒數第二小的歐式距離所對應的基準點分別 為勝者基準點Sl和亞軍基準點s2,也就是如公式(1)和公式(2)所表示的勝者基準點Sl和 亞軍基準點s2 :

【權利要求】
1. 一種基於神經元網絡的數據降維系統,包括數據採集系統,所述的數據採集系統同 控制系統相連接,所述的控制系統中帶有基於神經元網絡的數據降維模塊。
2. 根據權利要求1所述的一種基於神經元網絡的數據降維系統的測量降維方法,其特 徵在於,步驟如下: 步驟1 :首先數據採集系統把採集來的圖像或者視頻這樣的信號數據發送到控制系統 中,然後控制系統啟動基於神經元網絡的數據降維模塊先把發送來的圖像或者視頻這樣的 信號數據構造成高維數據集進行存儲; 步驟2:接著基於神經元網絡的數據降維模塊對高維數據進行確定流形拓撲結構基準 點的處理,所述的對高維數據進行確定流形拓撲結構基準點的處理,具體說來所述的對高 維數據進行確定流形拓撲結構基準點的處理的具體過程為先進行初始化,所述的初始化包 括首先設定基準點集合A = {Lp L2},其中A為基準點集合,U為第一基準點,L2為第二基 準點,第一基準點和第二基準點是隨機的從高維數據集中選取的兩個高維數據;然後基於 神經元網絡的數據降維模塊設定邊集合C、初值均為0的兩個激活數變量、初值為| IU-L」 的兩個範圍閾值變量和初值為0的第一連接年齡變量,所述的CgixJ並且其初 值為空集,AXA表示基準點集合的基準點之間的連接關係,初值為空集表示第一基準點和 第二基準點之間沒有初始連接,所述的兩個激活數變量分別為針對第一基準點的激活數變 量和針對第二基準點的激活數變量,針對第一基準點的激活數變量和針對第二基準點的 激活數變量分別為,所述兩個範圍閾值變量分別為第一範圍閾值變量2^和第 二範圍閾值變量&,所述的第一連接年齡變量表示的是第一基準點和第二基準點 的連接時長; 步驟3 :接著進入輸入與競爭階段,所述的輸入與競爭階段包括數據採集系統繼續一 個採集圖像或者視頻這樣的信號數據,並把採集來的一個圖像或者視頻這樣的信號數據發 送到控制系統中,控制系統中的基於神經元網絡的數據降維模塊3先把接收到的一個圖像 或者視頻這樣的信號數據存儲為一個高維數據,所述的高維數據作為一個新的數據樣板 € GRd,其中所述的新的數據樣板為L所述的RD表示高維實數空間,所述的R表示實數, D表示高維數據的維度,然後計算出A中的每個基準點和新的數據樣板I的歐氏距離,所得 到的最小的歐式距離所對應的基準點和倒數第二小的歐式距離所對應的基準點分別為勝 者基準點Sl和亞軍基準點s2,也就是如公式(1)和公式(2)所表示的勝者基準點Sl和亞軍 基準點s2 :
勝者基準點Sl和亞軍基準點s2就成為了最相似的兩個基準點;隨後進入基準點更新 階段,所述的基準點更新階段包括基於神經元網絡的數據降維模塊3判斷如果 或者||< -&||>Z;2成立,就為新的數據樣板〖放到基準點集合A中來生成一個新的值為€ 基準點,也就是A = A U { € },然後返回步驟3中執行; 步驟4 :如果Sl與s2間不存在連接,執行C = C U {(Sl,s2)}的操作,即為兩個最相 似基準點之間建立連接,再設定初值為0的第二年齡變量%^+,2丨,所述的第二年齡變量 ?盡氣、表示的是勝者基準點Si和亞軍基準點s2的連接時長;接著判斷如果(Sl,LJ e C, 貝U執行響(il#=呢e(m+1的操作,餵 + 1的操作表示與Si相連的所有的基準 點的連接時長加1,所述的咕> 為第三年齡變量,第三年齡變量表示的是勝者基準點Sl同 與之連接的所有基準點Q的連接時長,i為自然數變量,設定針對勝者基準點Sl的激活數 變量M5i,並對針對勝者基準點Sl的激活數變量Msi執行MSi =¥^+1的操作,MS1的值是從 〇開始遞增,再執行Si = Si+ e (t) I I l-Si I I和s2 = s2+ e ' (t) I I € -S21 I的操作,也就是 執行Si與s2向新的數據樣板移動的操作,其中
t為基於神經元網絡 的數據降維系統的運行時間; 步驟5 :基於神經元網絡的數據降維模塊檢查所有的基準點之間的連接(LpLj) e C和 每一組基準點之間的連接Lp所對應的當前的年齡參數,如果就 從C移除該連接,其中age_是預先定義的連接時長最大值,其中所述的所有的基準點之 間的連接為Lp e C,其中i和j為不相等的自然數,所述為化名)之間的連 接時長; 步驟6 :基於神經元網絡的數據降維模塊接著執行基準點的範圍閾值的更新階段,所 述的基準點的範圍閾值的更新階段包括將Sl和s2的範圍閾值7;和?:.2通過公式(3)和公式 (4)分別更新為與Sl和s2相鄰基準點的最大距離
所述的7;和分別為針對勝者基準點Sl的範圍閾值和亞軍基準點s2的範圍閾值,然 後進入去噪階段,所述的去噪階段包括通過基於神經元網絡的數據降維模塊判斷如果當前 輸入的數據樣本總數是設定的界定值A的整數倍,檢查所有的基準點集合A中的基準點, 如果存在某一個基準點Q只有一個相連接的基準點,並且小於設定的激活數最小值 Mmin,就在基準點集合A中刪去該基準點Q,所述的為針對某一個基準點Q的激活數變 量,返回步驟中執行; 步驟7 :接著基於神經元網絡的數據降維模塊進入計算基準點相似度階段; 步驟8 :將自然數變量i值加1,將提取一個基準點Q (i = 1,…,n),其中n為在基準 點集合A中的基準點數目,針對該基準點Q進入計算基準點相似度階段的初始化階段,首 先執行S= {L^UzA-lLi}的操作,S為第一中間量集合,U為第二中間量集合,然後把 n*n的相似度矩陣DG(n*n)中的DG(i,i)元素的值設置為0,所述的DG(i,i)元素表示該基 準點Q和自身的相似度值,對於U中的每一個基準點h (h G U),如果Q與h相連接,即 (LpLj) G C,貝ljDG(i,j)元素值設置為| iLi-Ljl | ;否貝ljDG(i,j)元素值設置為所述的 De(i,j)元素標示所述的該基準點Q和U中的元素的Lj之間的相似度值 步驟9 :進入中間點選取階段,所述的中間點選取階段包括從U中選取與同該基準點Q 相似度值最小的基準點Lmin,即Lmin = argminDe(i,j)並且Lmin G U,將Lmin加入S,即S = S U {Lfflin},U = U-{Lfflin}; 步驟10 :然後進入邊拓展階段,所述的邊拓展階段包括對於U中每一個基準點 Lk(LkGU),k 為自然數,如果 Lmin與 Lk相連接,即(Lmin,Lk) GC,並且DG(i,min) + ||Lmin-Lk| 〈Wakhmin為1^"的序列號,則執行更新操作如公式(5)所示: DG(i,k) =DG(i,min) + | |Lmin-Lk| (5) 然後重複執行步驟9和步驟10直到S = A,= 0為止; 步驟11 :返回步驟8執行,等到i值達到n時,表示基準點集合A中的基準點全部執行 完畢後,得到n*n的相似度矩陣De(n*n); 步驟12 :接著基於神經元網絡的數據降維模塊進入基準點降維映射階段,所述的基準 點降維映射階段包括通過公式(6)計算距離平方矩陣An(i,j): A,0'v/) = Dc(Uj) ^ Dc{iJl(iJ = 1,. ? ?) r6) 然後通過公式(7)計算均值向量g : 之=(W."+4,) /n (7) 所述的I.代表An(i,j)的第i列,i取值為1到n; 步驟13 :通過公式⑶計算均值中心化矩陣Hn :
其中s (i,j)為中間參數,一般取l,Hn(i,j)表示均值中心化矩陣扎第1行第j列的 元素值; 步驟14 :通過公式(9)內積矩陣Bn :

步驟15 :計算特徵值特徵向量,所述的計算特徵值特徵向量包括計算Bn最大的d個正 特徵值^,…與其對應的特徵向量,其中d為降維的目標維數; 步驟16 :進入基準點的降維映射階段,所述的降維映射階段包括通過公式(10)來得到 用於基準點的降維映射的矩陣L : 用於基準點的降維映射的矩陣L的n個d維的
, 列向量分別為n個基準點在d維空間的坐標; 步驟17 :進入在線數據降維映射階段,所述的在線數據降維映射階段包括確定新數 據點所屬基準點,通過公式(11)確定距離新的數據樣板I最近的基準點La :
步驟18:根據公式(12)得到新的數據樣板€與所有基準點的相似度%(1,1^): DsU.Li) = | | l-La | |+DG(a,i) (12) 步驟19 :根據公式(13)得到距離平方向量:
步驟20 :根據公式(14)得到偽逆轉置矩陣,記L#為基準點的降維映射的矩陣L的偽逆 轉置矩陣:
步驟21 :根據公式(15)對新的數據樣板I進行低維映射得到低維映射向量:
【文檔編號】G06F19/00GK104346520SQ201410362559
【公開日】2015年2月11日 申請日期:2014年7月28日 優先權日:2014年7月28日
【發明者】申富饒, 幹強, 趙金熙 申請人:南京大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀