一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法
2023-06-06 05:22:31 2
一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法
【專利摘要】一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法,其特徵在於所述遺傳算法的基本運算過程:1)數據初始化:設置最大進化代數,隨機生成的個體數及其所構成的群體。選擇個體數20個,最大迭代次數100代。2)個體評價:計算群體中各個個體的適應度,本申請中適應度為樣本分類的準確率。3)選擇運算:利用選擇算子對群體中的各個個體進行隨機選擇。本申請中利用輪盤賭法結合個體評價的準確率對個體進行選擇,從而將適應度較高的個體信息可以遺傳到下一代。4)交叉運算:利用交叉算子對個體中的個體進行疊加重組產生新的個體,集成上代個體中的特徵信息。5)變異運算:利用變異算子對個體按概率進行隨機變異。群體經過選擇、交叉、變異運算之後得到下一代群體。6)終止判斷:若迭代次數達到最大代數或適應度達到所需要求則停止迭代。
【專利說明】一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法
【技術領域】
[0001]本申請涉及一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法。
【背景技術】
[0002]我國蜂蜜產量居世界首位,近年來產量一直保持快速增長的趨勢,由2001年的25.2萬噸增加到2009年的40.2萬噸,佔世界總產量也由近20%提高到30%多。但由於經濟利益的驅動,目前蜂蜜市場摻假嚴重,導致摻假蜂蜜佔據了蜂蜜市場的20%?30%,有些地區摻假造假的蜂產品佔50%左右,嚴重損壞了消費者利益、影響蜂蜜產業健康發展、打擊出口貿易創匯。
[0003]由於缺乏檢測手段的影響,導致摻假打擊面臨困難,其根本原因如下:(1)由於蜂蜜本身的主要物質結構比較簡單,包含水和糖類成分,給摻假提供了便利條件,同時,單靠檢測這幾種物質含量的多少根本沒辦法判別是否摻假;(2)由於蜂蜜受蜜源植物種類、蜜蜂群勢強弱、蜜期時間長短、空氣的溫度和溼度,以及蜂蜜的加工、貯存、結晶等多種因素影響,造成蜂蜜主要物質的含量範圍變化較大,使得蜂蜜摻假簡單、方便;(3) C4等摻假檢測費用高、無法大規模用於實際檢測和執法。
[0004]香氣是產品品質體現的重要屬性之一,產品香氣表徵需要突出其客觀性、真實性與全面性。目前氣相色譜(GC)、氣相色譜-質譜聯用(GC-MS)和氣相色譜-嗅辨(GC-O)等方法,只能檢測產品中有限的單體香氣物質,並且這些香氣之間存在協同、變調等現象,很難從整體上反映樣品的香氣品質。而智能嗅覺系統(電子鼻)能夠模擬人類嗅聞特徵,綜合表徵香氣的整體信息,體現香氣的嗅覺特徵和整體品質,同時比人的嗅覺更加客觀、可靠。目前已在食品新鮮度、食用油變質判別、果蔬成熟度檢測、茶葉產地品種識別、酒類品牌界定等方面開展了相關研究。
[0005]蜂蜜中含有300多種芳香物質,因此它是研究智能嗅覺表徵的重要樣例;同時不同蜜源、不同產地其風味物質各異,並且蜂蜜摻假與否或品質優劣能在整體香氣上有所體現,使得香氣成為蜂蜜品質檢測與摻假鑑別的重要指標之一;充分說明採用智能嗅覺表徵蜂蜜品質具有可行性,也為蜂蜜品質檢測及摻假鑑別提供了一種快速、經濟、準確且利於實時應用的檢測方法。因此選擇蜂蜜作為研究對象具有實用意義,對其行業健康發展更具深遠價值。
[0006]採用電子鼻進行產品品質判別或摻假鑑別分析,其本質是利用智能嗅覺圖譜的整體香氣信息,尋找樣品間的差異性,其核心是尋找代表樣品間差異性的圖譜信息,即「差異化信息」,也叫「智能嗅覺的差異化圖譜信息」。但是電子鼻的傳感器陣列具有交叉敏感性,即每根傳感器對每個香氣都有不同程度的響應,因此通過電子鼻採集的呈香物質圖譜具有廣譜、重疊等特點,很難單獨用肉眼從圖譜上區分不同樣品,需要進行「信號挖掘」,特別是「代表樣品間差異化信息的挖掘」,挖掘的差異性化信息越多,就越有助於快捷的區分產品特徵與品質。但目前在差異化信息挖掘方面還很薄弱,也是制約電子鼻發展的瓶頸。
【發明內容】
[0007]—種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法,根據我國地理區域西部、華南、華北、華東、東北的劃分,選擇5種不同蜜源作為研究樣本,分別為:1)油菜蜜,採自西部地區的重慶涪陵區和永川區;2)荔枝蜜,採自華南地區的廣西南寧;3)荊條蜜,採自華北地區的北京密雲等地;4)洋槐蜜,採自華東的山東萊陽;5)椴樹蜜;利用氣敏傳感器陣列與不同揮發性成分的吸附差異對待測樣品蜂蜜進行檢測,其特徵在於所述遺傳算法的基本運算過程如下:
1)數據初始化:設置最大進化代數,隨機生成的個體數及其所構成的群體;
選擇個體數20個,最大迭代次數100代;
2)個體評價:計算群體中各個個體的適應度,所述適應度為樣本分類的準確率;
3)選擇運算:利用選擇算子對群體中的各個個體進行隨機選擇;
其中利用輪盤賭法結合個體評價的準確率對個體進行選擇,從而將適應度較高的個體信息可以遺傳到下一代;
4)交叉運算:利用交叉算子對個體中的個體進行疊加重組,從而產生新的個體,集成上代個體中的特徵信息;
5)變異運算:利用變異算子對個體按概率進行隨機變異,保證了新個體的產生; 群體經過選擇、交叉、變異運算之後得到下一代群體;
6)終止判斷:若迭代次數達到最大代數或適應度達到所需要求則停止迭代;
優化後訓練集的準確率為96.25%,c=3.2277,r=0.1354,在此條件下,判別準確率為97.4684%,即蜂蜜樣本77/79,其中油菜蜜23/23,椴樹蜜16/17,洋槐蜜38/39。
【專利附圖】
【附圖說明】
[0008]圖1異常點剔除結果:(a)馬氏距離判別結果;(b)槓桿值判別結果;
圖2基於方差比的特徵提取結果
圖3基於單項量判別的特徵點提取結果 圖4蟻群算法流程圖 圖5基於蟻群算法的特徵提取結果 圖6基於核主成分分析的特徵點提取結果 圖7基於獨立成分分析的特徵點提取結果 圖8基於網格搜素的支持向量機參數優化結果 圖9基於遺傳算法的支持向量機參數優化結果 圖10基於粒子群算法的支持向量機參數優化結果
【具體實施方式】
[0009]I關於樣本收集與製備
為使所研究的蜜源差異具有代表性,根據我國地理區域(西部、華南、華北、華東、東北)的劃分,選擇5種不同蜜源作為研究樣本,分別為:1)油菜蜜,採自西部地區的重慶涪陵區和永川區;2)荔枝蜜,採自華南地區的廣西南寧;3)荊條蜜,採自華北地區的北京密雲等地;4)洋槐蜜,採自華東的山東萊陽;5)椴樹蜜,採自東北的吉林敦化及黑龍江哈爾濱等地。為保證實驗樣本的真實性和準確性,避免市場商業蜜加工工藝的幹擾,樣品通過中國農業科學院蜜蜂研究所直接由蜂農處購得。[0010]樣品採集後按照不同蜜源、不同產地分別置於不同試劑瓶中。為確保研究不受檢測條件差異的幹擾,樣品採集後儲存於-18°C條件下,待所有樣品採集完畢後統一進行試驗。實驗前,樣品從_18°C下取出後,5種蜜源樣品各取60g左右,置於40°C恆溫水浴箱中,水浴加熱15min,使蜂蜜樣品融化,剩餘樣品繼續置於-18°C下保存。水浴加熱時為保證樣品融化完全,無結晶,水浴時需每3min震蕩一次。樣品水浴完成後,取出置於室溫下冷卻Ih以上,直至樣品溫度與室溫(20°C )—致。
[0011]2電子鼻檢測方法
電子鼻利用氣敏傳感器陣列與不同揮發性成分的吸附差異對待測樣品蜂蜜進行檢測。蜂蜜揮發性成分與傳感器特徵吸附(包括物理吸附與化學吸附)後,改變半導體傳感器表層電流強度。通過數字轉換,獲得各樣品的響應曲線,從而對樣品進行檢測分析。本發明採用Fox 4000型電子鼻(Alpha MOS, France),該電子鼻由18根金屬氧化物半導體氣敏傳感器(MOS)與HS100頂空自動進樣器組成。
[0012]儀器具體操作流程如下:
I)將水浴後冷卻至室溫的蜂蜜樣品根據要求加入容積為IOml的頂空瓶中。將裝好樣品的頂空瓶置於託盤上。HS100自動進樣器最多容納2個託盤,每個託盤可放置32個頂空瓶。
[0013]2)根據要求設定儀器檢測條件,包括頂空制樣條件和電子鼻檢測條件。根據蜜源種類和檢測順序,對託盤上各頂空瓶進行編碼。
[0014]3)頂空瓶根據設置的條件被放入頂空室內進行加熱,加熱時頂空瓶間歇震蕩,保證頂空氣體均一性。頂空制樣結束後,抽取頂空氣體,注入檢測器中,並將頂空瓶從頂空室內取出。Fox 4000為連續型氣流注射,氣體進入檢測氣後與各傳感器發生吸附與解吸附反應,並各自生成響應的響應曲線。
[0015]單一樣品可獲得18 (18根傳感器)*t (檢測時間)的信號矩陣。傳統方法將各傳感器的最大(小)值作為該傳感器的響應值進行分析。
[0016]3基於電子鼻信息的蜂蜜品質建模方法
利用提取出的電子鼻特徵信息建立支持向量機判別模型,對不同蜜源的樣本進行分類。傳統的模式識別方法是建立在大量樣本基礎上的漸進理論,但實際生產應用中個,由於各方麵條件的限制,大量的樣本數往往難以得到較好的保證,在小樣本的條件下,根據傳統的統計學基礎,很難取得較理想的學習效果和泛化效果。但支持向量機適用於小樣本條件下的建模需求,由此對不同蜜源樣本進行模式識別判定。
[0017]支持向量機(SupportVector Machine, SVM)理論是 Vapnik (1995)在傳統的統計學習基礎上,結合結構風險最小化原則,針對有限樣本的特點所提出的。該方法可以有效減少傳統模式識別模型中參數設定的隨意行,克服了模型建立過程中經驗風險與期望風險發生較大差別的不足,具體SVM理論如下。
[0018]在模式識別中,求出一個最優化函數f (X,w),使其在對未知樣本集(Xi, Yi)(i=l,2…,n;y e {-1,1}為樣本標號)進行評估時,期望風險R(W)最小:
【權利要求】
1.一種基於遺傳算法的支持向量機分類器參數選擇的蜂蜜檢測方法,根據我國地理區域西部、華南、華北、華東、東北的劃分,選擇5種不同蜜源作為研究樣本,分別為:1)油菜蜜,採自西部地區的重慶涪陵區和永川區;2)荔枝蜜,採自華南地區的廣西南寧;3)荊條蜜,採自華北地區的北京密雲等地;4)洋槐蜜,採自華東的山東萊陽;5)椴樹蜜;利用氣敏傳感器陣列與不同揮發性成分的吸附差異對待測樣品蜂蜜進行檢測,其特徵在於所述遺傳算法的基本運算過程如下: .1)數據初始化:設置最大進化代數,隨機生成的個體數及其所構成的群體; 選擇個體數20個,最大迭代次數100代; .2)個體評價:計算群體中各個個體的適應度,所述適應度為樣本分類的準確率; .3)選擇運算:利用選擇算子對群體中的各個個體進行隨機選擇; 其中利用輪盤賭法結合個體評價的準確率對個體進行選擇,從而將適應度較高的個體信息可以遺傳到下一代; . 4)交叉運算:利用交叉算子對個體中的個體進行疊加重組,從而產生新的個體,集成上代個體中的特徵信息; .5)變異運算:利用變異算子對個體按概率進行隨機變異,保證了新個體的產生; 群體經過選擇、交叉、變異運算之後得到下一代群體; .6)終止判斷:若迭代次數達到最大代數或適應度達到所需要求則停止迭代; 優化後訓練集的準確率為96.25%,c=3.2277,r=0.1354,在此條件下,判別準確率為.97.4684%,即蜂蜜樣本77/79,其中油菜蜜23/23,椴樹蜜16/17,洋槐蜜38/39。
【文檔編號】G01N27/00GK103487466SQ201310323358
【公開日】2014年1月1日 申請日期:2013年7月30日 優先權日:2013年7月30日
【發明者】史波林, 趙鐳, 劉寧晶, 汪厚銀, 裴高璞, 支瑞聰, 解楠, 張璐璐 申請人:中國標準化研究院