一種基於高光譜圖像和深度學習算法的菸葉分級方法與流程
2023-05-31 20:57:21

本發明涉及一種菸葉分級方法,特別涉及一種基於高光譜圖像和深度學習算法的菸葉分級方法。
背景技術:
目前,大多數人利用紅外或近紅外光譜來進行菸葉分級,但是還沒有見過利用高光譜圖像結合深度學習的方法來進行菸葉分級技術的研究。
在《計算機應用研究》劉建偉等的文獻中,我們知道深度學習架構由多層非線性運算單元組成,每個較低層的輸出作為更高層的輸入,可以從大量輸入數據中學習有效的特徵表示,學習到的高階表示中包含輸入數據的許多結構信息,是一種從數據中提取表示的好方法,能夠用於分類、回歸和信息檢索等特定問題中。基於這種思想,我們嘗試用深度學習方法進行菸葉分級。
深度學習的概念由Hinton等人於2006年提出。在文獻《A Fast Learning Algorithm for Deep Belief Nets》中,基於深度信念網絡(DBN),提出非監督貪婪逐層訓練算法,為解決深層結構相關的優化難題帶來希望。本文就採用這種方法進行特徵提取。
同機器學習方法一樣,深度機器學習方法也有監督學習與無監督學習之分,不同的學習框架下建立的學習模型很是不同。深度信念網絡(Deep Belief Nets,簡稱DBNs)就是一種無監督學習下的機器學習模型。
一個典型的深度信念網絡就是一個高度複雜的有向無環圖,它是由一系列的限制性玻爾茲曼機(RBM)堆疊組成。訓練深度信念網絡需要通過自下而上的逐層訓練這些限制玻爾茲曼機來實現,因為限制玻爾茲曼機可以採用分層對比散度算法進行快速訓練,所以通過訓練限制玻爾茲曼機可以避免從整體上訓練深度信念網絡的高度複雜性,簡化為逐個訓練限制玻爾茲曼機的過程。大量研究證明,深度信念網絡可以解決傳統反向傳播算法訓練多層神經網絡收斂速度慢,容易陷入局部最優等問題。
技術實現要素:
有鑑於此,本發明的目的是提供一種利用高光譜圖像技術,並聯合深度學習對菸葉進行智能化、無損分組、分色和分級的方法。
本發明的目的是以下述方式實現的:
一種基於高光譜圖像和深度學習算法的菸葉分級方法,所述方法包括以下步驟:
步驟1、獲取待測菸葉樣本的高光譜圖像數據;高光譜成像系統的硬體平臺包括光源、分光模組、面陣CCD偵測器和裝有圖像採集卡的計算機;利用成像系統進行圖像信息採集的時候可同時獲得光譜信息,不用分開採集,縮短時間;
步驟2、對圖像進行高層特徵提取,對數據進行降維,本步驟中先利用卷積神經網絡進行預處理,然後利用深度信念網絡進行特徵提取;
步驟3、對獲取的圖像信息和光譜信息進行分類:然後在其頂層添加一個Softmax層,將得到的特徵輸入softmax回歸分類器實現分類。
所述步驟1中的高光譜圖像數據包括圖像與光譜。
所述步驟2中利用BP算法對網絡進行微調。
所述步驟2具體包括如下步驟:
201、先利用卷積神經網絡進行圖像分割(2層的神經網絡);
202、分割之後,繼續利用卷積神經網絡進行圖像去噪(2層的神經網絡);
203、去噪後的圖像作為輸入,賦給深度信念網的第一個RBM(限制性玻爾茲曼機)的可見層(6層);深度信念網由3個RBM(限制性玻爾茲曼機)組成,每層RBM有1個隱藏層,1個可見層,總共6層,輸入層(可見層)的維度為m維,隱藏層維度分別為n1,n2,n3,深度信念網絡的訓練流程如下:
(a)初次提取特徵:訓練第一個RBM網絡,即用輸入層m維和第一個隱藏層n1維構成的RBM網絡。輸入為原始的輸入數據,訓練第一個RBM,並得到訓練樣本在隱藏層的輸出值(看作初次提取的特徵),以及相應的權值和偏置。
(b)去相關,進行特徵篩選:利用步驟(a)中隱藏層的輸出值作為第2個RBM網絡訓練的輸入值,用第一個RBM的輸出與第二層隱藏層構成輸入層為n1維和隱藏層為n2維的RBM網絡,但是固定步驟(a)的權值和偏置不變。同步驟(a)中的方法,計算出隱藏層的輸出值、權值和偏置。依次類推,用同樣的方法訓練接下來的第3個RBM網絡。第3個RBM的輸出作為優化以後的特徵。
204、優化:利用BP算法(反向傳播算法)對網絡參數進行微調,從而使模型收斂到局部最優點,保證最後取到的特徵是最優的。
205、優化過後,將最終得到的網絡的權值和偏置,賦給從卷積神經網絡開始的原始輸入數據到深度信念網的最後一個RBM網絡構成的網絡中,這樣便完成了特徵的提取過程,深度信念網中最後一個RBM的輸出便為最優提取的特徵。
所述步驟(a)中對於一個RBM網絡,只有輸入輸出,在訓練RBM時,可見單元的個數為原始的輸入數據,RBM的訓練過程以及權值的更新如下:
(1)隨機初始化權值矩陣w和可見層的偏置向量a,隱藏層的偏置向量b;
(2)將原始的輸入數據輸入到可見層單元,輸入矩陣x正向傳播,利用公式:
計算出隱藏層單元的二值狀態;
(3)在所有隱層單元的狀態確定以後,按反方向傳播,利用公式:
其中,激活函數計算出可見層矩陣x'的激活概率,x'是可見層的一個重構;
(5)再對x'進行正向傳播,根據公式(1)(2)計算出隱藏層的矩陣h'的二值狀態、h'的激活概率,h'為隱藏層的一個重構;
(6)用步驟(2)中得到的隱藏層h的激活概率p(h|x)減去步驟(5)中得到h'的激活概率,其結果作為隱藏層h對應的偏置b的增量,用可見層x的激活概率減去x'的激活概率,其結果作為可見層x對應的偏置a,用步驟(2)中得到的正向傳播的概率向量減去步驟(5)中得到的反向傳播的概率向量,其結果作為輸入層和輸出層之間的權值增量。每次迭代中,權值的更新和偏置的更新都是同時進行的,所以應該是同時收斂的。結合其對應的學習率,根據公式更新權值和偏置:
Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))
bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))
at=at-1+ε(x·p(h|x)-x'·p(h'|x'))
其中,ε為學習率;
(7)重複計算步驟(2)到(6),直至收斂或者達到最大迭代次數。如此,便完成了一個RBM的訓練。
相對於現有技術,本發明:
1、提出基於深度信念網絡的特徵提取方法,嘗試用深度學習的方法來進行菸葉分級,相對於之前很多人所用的淺層學習的方法有了很大的改進。
2、提出基於圖像特徵的菸葉智能分級的算法和模型。算法模型致力於提高分組分色分級速度和正確識別率(吻合率)。
3、採用或部分採用深度學習的無監督算法,以提高系統的推廣泛化能力。
採用上述技術方案的本發明,能最大限度的做到無損分級、能準確的劃分菸葉等級,確保收購的各方利益不受損失。
附圖說明
圖1為深度信念網的原理框圖。
圖2為高光譜成像系統通用結構圖。
圖3為RBM的結構示意圖。
圖4是一個菸葉等級B1K光譜圖像實施例示意圖。
具體實施方式
本實施例中,高光譜圖像聯合深度學習進行菸葉分級的方法,包括以下步驟:
步驟1、實時獲取待測菸葉的圖像信息和光譜信息。如圖2所示,高光譜成像系統的硬體平臺包括光源、分光模組、面陣CCD偵測器和裝有圖像採集卡的計算機;利用成像系統進行圖像信息採集的時候可同時獲得光譜信息,不用分開採集,縮短時間。本實施例中利用光譜儀完成圖像信息採集,存儲於計算機,上述的圖像信息指的是菸葉為整片菸葉的圖像;且採集的菸葉圖像既可以同時利用菸葉的透射和反射兩種圖像,或者也可以僅利用透射圖像。需要指出的是,本實施例中可以利用圖像採集卡的二次開發功能,實時控制採集的圖像信息並存儲於計算機,便於實時識別分組(分部位)、分色和分級和再次學習。並且,本實施例中利用高光譜儀進行光譜信息採集,其採集範圍可以為200-2500nm或其中任意部分。一個菸葉等級B1K光譜圖像示意圖如圖4所示。
步驟2、對獲取的圖像信息和光譜信息進行特徵提取:(假設使用10層神經網絡)
201、先利用卷積神經網絡進行圖像分割(使用2層的神經網絡);
202、分割之後,繼續利用卷積神經網絡進行圖像去噪(使用2層的神經網絡);
203、去噪後的圖像作為輸入,賦給深度信念網的第一個RBM(限制性玻爾茲曼機)的可見層(一共為6層);
深度信念網由3個RBM(限制性玻爾茲曼機)組成,每層RBM有1個隱藏層,1個可見層,總共6層,輸入層(可見層)的維度為m維,隱藏層維度分別為n1,n2,n3,深度信念網絡的訓練流程如下:
(a)初次提取特徵:訓練第一個RBM網絡,(每個RBM的形式如圖3所示)即用輸入層m維和第一個隱藏層n1維構成的RBM網絡。輸入為原始的輸入數據,訓練第一個RBM,並得到訓練樣本在隱藏層的輸出值(看作初次提取的特徵),以及相應的權值和偏置。
一個RBM的訓練過程如下:
對於一個RBM(限制性玻爾茲曼機)網絡,只有輸入輸出,在訓練RBM時,可見單元的個數也就是原始的輸入數據的個數,即圖像的像素。RBM的訓練過程以及權值的更新如下:
(1)隨機初始化權值矩陣w和可見層的偏置向量a,隱藏層的偏置向量b。
(2)將原始的輸入數據輸入到可見層單元,輸入矩陣x正向傳播,利用公式:
計算出隱藏層單元的二值狀態。
(3)在所有隱層單元的狀態確定以後,按反方向傳播,利用公式:
其中,激活函數計算出可見層矩陣x'的激活概率,x'也是可見層的一個重構。
(5)再對x'進行正向傳播,根據公式(1)(2)計算出隱藏層的矩陣h'(隱藏層的一個重構)的二值狀態、h'的激活概率。
(6)用步驟(2)中得到的隱藏層h的激活概率p(h|x)減去步驟(5)中得到h'的激活概率,其結果作為隱藏層h對應的偏置b的增量,用可見層x的激活概率減去x'的激活概率,其結果作為可見層x對應的偏置a,用步驟(2)中得到的正向傳播的概率向量減去步驟(5)中得到的反向傳播的概率向量,其結果作為輸入層和輸出層之間的權值增量。每次迭代中,權值的更新和偏置的更新都是同時進行的,所以應該是同時收斂的。結合其對應的學習率,根據公式更新權值和偏置:
Wt=Wt-1+ε(x·p(h|x)-x'·p(h'|x'))
bt=bt-1+ε(x·p(h|x)-x'·p(h'|x'))
at=at-1+ε(x·p(h|x)-x'·p(h'|x'))
其中,ε為學習率。
(7)重複計算步驟(2)到(6),直至收斂或者達到最大迭代次數。如此,便完成了一個RBM的訓練。
(b)去相關,進行特徵篩選:利用步驟(a)中隱藏層的輸出值作為第2個RBM網絡訓練的輸入值,用第一個RBM的輸出與第二層隱藏層構成輸入層為n1維和隱藏層為n2維的RBM網絡,但是固定步驟(a)的權值和偏置不變。同步驟(a)中的方法,計算出隱藏層的輸出值、權值和偏置。依次類推,用同樣的方法訓練接下來的第3個RBM網絡。第3個RBM的輸出作為優化以後的特徵。
204、優化:利用BP算法(反向傳播算法)對網絡參數進行微調,從而使模型收斂到局部最優點,保證最後取到的特徵是最優的。
205、優化過後,將最終得到的網絡的權值和偏置,賦給從卷積神經網絡開始的原始輸入數據到深度信念網的最後一個RBM網絡構成的網絡中,至此,完成了菸葉圖像的特徵提取過程,深度信念網中最後一個RBM的輸出就是菸葉圖像中用於分類的最優特徵。
步驟3、對獲取的圖像信息和光譜信息進行分類:特徵提取之後,進行分類時,在其頂層添加一個Softmax層,將得到的特徵輸入到softmax回歸分類器來進行分類。
以上所述的僅是本發明的優選實施方式,應當指出,對於本領域的技術人員來說,在不脫離本發明整體構思前提下,還可以作出若干改變和改進,這些也應該視為本發明的保護範圍。