一種特徵加權的模糊緊緻散布聚類方法
2023-04-25 13:52:01 2
一種特徵加權的模糊緊緻散布聚類方法
【專利摘要】針對現有的WFCM算法在聚類時沒有考慮樣本硬劃分實際情況,FCS算法沒有考慮硬劃分邊界點的情況以及忽略樣本特徵參數對聚類影響的問題,本發明公開了一種特徵加權的模糊緊緻散布聚類方法。本發明通過對樣本隸屬度、特徵權重進行調整,遵循了樣本硬劃分的實際情況,並充分考慮樣本特徵參數對樣本劃分的影響,儘可能使得樣本類內緊緻、類間分散,解決了位於硬劃分邊界的樣本隸屬度問題,對於噪聲數據和異常數據實現了更有效的劃分。聚類性能良好,收斂速度快、迭代效率高。實驗證明,本算法聚類性能良好,收斂速度快、迭代效率高。與現有方法相比,本發明聚類準確率高,耗時明顯減少,適於應用在工業控制中實時性要求高的場合。
【專利說明】一種特徵加權的模糊緊緻散布聚類方法
【技術領域】
[0001]本發明屬於數據處理【技術領域】,尤其是涉及一種特徵加權的模糊緊緻散布聚類方法。
【背景技術】
[0002]在自然科學和社會科學中,存在著大量的分類問題,聚類方法是研究(樣品或指標)分類問題的一種統計分析方法,同時也是數據挖掘的一個重要算法,應用領域非常廣泛。模糊C-均值(FCM)聚類算法是常用的無監督模式識別方法,有很多對FCM算法的改進,其中基於特徵加權的FCM(WFCM)聚類算法考慮了樣本各特徵參數對聚類中心的影響,改善了噪聲、異常數據影響等情況。但是,這些基於FCM的聚類算法,實質都只考慮了樣本的類內緊緻性(類內散度),而忽略了樣本類間散布性(類間散度)。Kuo-Lung Wu等人提出的FCS (Fuzzy Compactness and Separation)算法考慮了類內緊緻和類間散布,併兼容了樣本的硬劃分和模糊劃分,這更符合實際情況;國內有宋風溪等人提出了最大散度差判別準則的分類方法,該準則綜合考慮類間散度和類內散度來求最優投影向量以對樣本進行分類;皋軍等人將模糊度引入了最大散度差判別準則提出了 FMSDC(fuzzy maximum scatterdifference discriminant criterion)算法,在模糊聚類的同時進行了降維;支曉斌等人指出皋軍等人的算法中的錯誤,提出FMSDC-FCS聚類算法,該算法是皋軍等人算法的正確版本,利用FCM算 法初始化隸屬度和樣本均值,再用FMSDC算法進行降維,用FCS算法對降維數據進行聚類,其聚類實質還是採用FCS算法。
[0003]而在利用上述算法進行數據分類的過程中,我們發現,實際數據有些處於某類硬劃分區域和硬劃分邊界上,這些數據的隸屬度就不需要模糊化,這是FCM算法以及相關擴展FCM算法所不能解決的。FCS算法雖然考慮了樣本硬劃分問題,但是卻沒有考慮處於硬劃分邊界上的樣本情況,這就導致了對實際數據進行分類時,遇到邊界數據時出現分類準確度不高或運算耗時過長的問題。
【發明內容】
[0004]針對現有的WFCM算法在聚類時沒有考慮樣本硬劃分實際情況,FCS算法沒有考慮硬劃分邊界點的情況以及忽略樣本特徵參數對聚類影響的問題,本發明公開了一種特徵加權的模糊緊緻散布聚類方法。
[0005]為了達到上述目的,本發明提供如下技術方案:
[0006]一種特徵加權的模糊緊緻散布聚類方法,包括如下步驟:
[0007]步驟一:設置隸屬度指數m、特徵加權指數a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次數P = O以及迭代誤差ε > O,隨機生成初始聚類
中心Bjai為第i類聚類中心),(c為類別數);
c
[0008]步驟二:根據下式計算係數η i:
【權利要求】
1.一種特徵加權的模糊緊緻散布聚類方法,其特徵在於,包括如下步驟: 步驟一:設置隸屬度指數m、特徵加權指數a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次數P = O以及迭代誤差ε > O,隨機生成初始聚類中心Bi,6?=! (C為類別數); 步驟二:根據下式計算係數Hi:
2.根據權利要求1所述的特徵加權的模糊緊緻散布聚類方法,其特徵在於:所述樣本隸屬度μ ij和特徵權重Qk通過如下步驟計算: 建立目標函數:
3.一種基於特徵加權的模糊緊緻散布聚類方法的工業數據分類方法,包括如下步驟:獲得傳感器採集到的數據後,通過權利要求要求I或2所述的特徵加權的模糊緊緻散布聚類方法對採集的數據進行分類,再根據分類結果判斷工業設備或工藝的當前狀態。
4.根據權利要求3所述的基於特徵加權的模糊緊緻散布聚類方法的工業數據分類方法,包括如下步驟:所述傳感器採集的是航空發動機狀態數據,判斷的是航空發動機的健康狀態。
【文檔編號】G06F17/30GK104008197SQ201410265975
【公開日】2014年8月27日 申請日期:2014年6月13日 優先權日:2014年6月13日
【發明者】周媛, 何軍, 夏景明 申請人:南京信息工程大學