新四季網

基於協同進化和反向傳播的深度神經網絡優化方法與流程

2023-11-03 03:12:47


本發明屬於深度學習與進化算法領域的結合,主要解決深度神經網絡的參數優化問題,具體提供一種基於協同進化和反向傳播的深度神經網絡優化方法,實現深度神經網絡參數的優化。



背景技術:

20世紀80年代以來,神經網絡(Neural Network,NN)進入了發展的快車道,新的科學理論的重大突破和高性能計算機的飛速發展使NN重煥生機。1982年加利福利亞理工學院的教授Hopfield提出了著名的Hopfield神經網絡模型,從而有力地推動了NN的研究。到了八十年代中期,Ackley,Hinton和Sejnowski,在Hopfield NN模型中基於模擬退火思想引入了隨機機制,並基於此模型分析了生物計算與傳統的AI計算之間的區別,提出了Boltzmann機,為NN優化計算跳出局部極小值提供了一個有效的方法,第一次成功實現了多層神經網絡的功能,並明確了NN中的隱單元的概念。第二年,反向傳播算法(Back-Propagation algorithm,BP)獲得進展,Rumelhart和McClelland提出的並行分布處理理論對反向傳播算法的應用產生了重要影響。這兩種模型或理論,對神經網絡的發展具有非常重要的作用和意義。

近些年來,神經科學研究人員發現,哺乳類動物的大腦皮質,在傳遞表示信息時,大腦皮質未曾對感官信號數據直接進行特徵提取處理,接收到的刺激信號經過一個複雜的層狀神經元網絡時,呈現的特徵會被逐層識別出來,然後每層的特徵作為下一層的輸入信號,逐層進行處理後再次傳遞。人腦是根據經過聚集和分解處理後的外部世界感知信息對物體進行識別,這種感知系統的層次結構極大降低了神經系統的數據處理量,同時仍保留了有效的物體結構。而深度學習神經網絡系統,也是通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,最後得到數據的分布式特徵表示的一種特殊網絡模型-深度神經網絡(Deep Neural Network,DNN)。DNN在很多領域都有著應用,例如:語音識別,文本圖像分類,天氣預測,人臉識別等等。

目前的深度神經網絡的優化算法,一種是:基於梯度的反向傳播算法,該算法隨著網絡結果和數據的複雜性的增加,容易陷入局部最優解;另一種是進化算法,由於參數維數的不斷增加,傳統的進化算法不再適用。

隨著數據規模的不斷增加,在處理這種大規模,無序的數據集時,人們越來越發現深度神經網絡的優勢,深度神經網絡必將有著更好的前景。



技術實現要素:

本發明的目的是克服上述已有技術的不足,提供一種基於協同進化和反向傳播的深度神經網絡優化方法,避免了反向傳播算法容易陷入局部最優解的缺陷,同時也利用反向傳播算法快速有效的優點,提高進化算法的搜索速度,通過一種迭代方式將這兩種方法的優點很好的結合到一起來優化深度神經網絡的參數。

為此,本發明提供了基於協同進化和反向傳播的深度神經網絡優化方法,包括如下步驟:

步驟101:開始基於協同進化和反向傳播的深度神經網絡優化方法;

步驟102:設定一個深度神經網絡結構,用Li表示網絡的第i層,Ni表示第i層的節點個數,初始化權重W和偏差b,設置學習率η,自定義參數H;

步驟103:向步驟102的深度神經網絡輸入訓練樣本,然後使用反向傳播算法對深度神經網絡進行訓練,直到深度神經網絡連續兩次的迭代誤差變化值σ在範圍[0,H]內,停止反向傳播算法;

步驟104:採用協同進化算法對步驟103中採用反向傳播算法訓練的權重和偏差進行優化;

步驟105:採用協同進化算法優化完權重和偏差之後,繼續使用反向傳播算法進行優化,直到深度神經網絡連續兩次的迭代誤差變化值σ在範圍[0,H]內,停止反向傳播算法,再次使用協同進化算法進行優化,不停的進行迭代,最後直到迭代次數為50次,迭代終止;

步驟106:得到深度神經網絡的優化參數,即權重和偏差。

所述的步驟103,包括如下步驟:

步驟301:開始反向傳播算法;

步驟302:輸入訓練樣本到深度神經網絡,計算訓練樣本的誤差,根據誤差的梯度來反向調整深度神經網絡每一層的權重:

其中,W是調整前的權重,W′是調整後的權重,E是誤差,η是學習率;

步驟303:每次迭代,隨機選取Ds個樣本,根據步驟302中的權重調整公式來不斷更新權重;

步驟304:計算連續兩次迭代的誤差變化σ,當0≤σ≤H時,停止反向傳播算法的迭代過程;

步驟305:結束反向傳播算法。

所述的步驟104,包括如下步驟:

步驟401:開始使用協同進化算法對深度神經網絡進行優化;

步驟402:在反向傳播算法得到的權重基礎上,使用協同進化算法進行優化,將深度神經網絡按層按節點劃分為子問題;

步驟403:計算劃分後的每個子問題的成熟度M,並將這些成熟度按照從小到大的順序進行排序,選取成熟度排在前30%的子問題使用差分進化算法進行優化;

步驟404:採用差分進化算法優化完成之後,選取最優的解去替換步驟402的權重中相應位置的參數,直到所有被選取的子問題被優化完成;

步驟405:結束協同進化算法。

所述的步驟105,包括如下步驟:

步驟501:再次開始反向傳播算法;

步驟502:如果連續兩次的迭代誤差值σ在範圍[0,H]內,停止反向傳播算法,開始進行協同進化;

步驟503:按照步驟402將深度神經網絡按層按節點劃分為子問題,再按照步驟403進行子問題的選取,然後使用差分進化算法對這些子問題進行優化,選取最優的解來替換步驟502的權重中對應的參數;

步驟504:再次開始反向傳播算法,然後不斷的重複步驟502和步驟503,最後直到迭代次數為50次,迭代終止;

步驟505:結束基於協同進化和反向傳播的深度神經網絡優化方法。

所述的步驟103和步驟304中的誤差變化σ:

σ=|E(t)(x)-E(t-1)(x)|

其中,E(t)(x)和E(t-1)(x)分別是第t次和第t-1次迭代的誤差。

所述步驟403中的成熟度M的定義:

其中,Mi是第i個子問題的成熟度,N是樣本的數量,表示第j個樣本在第i個子問題上的輸出,函數g(x)的定義如下:

其中,α是一個自適應參數,可以被設置成0.3或0.4。

本發明的有益效果:1、本發明是針對反向傳播算法在訓練參數的過程中容易陷入局部最優解的缺點,並且由於網絡的參數維數太大,單獨使用傳統的進化算法根本沒有辦法對其進行優化,因此提出了一種結合協同進化和反向傳播算法的方法來優化網絡,使得能夠更好的優化深度神經網絡的參數。

2、本發明將進化算法的優點應用到深度神經網絡的訓練中,針對大規模的參數,使用協同進化進行優化,同時結合反向傳播算法,並且設計一種選擇策略,來提高協同進化的優化速度,使得整個網絡能夠更高效的被訓練完成;

3、仿真結果表明,本發明採用的基於協同進化和反向傳播的深度神經網絡優化方法,優化性能好,提高了網絡的分類正確率。

以下將結合附圖對本發明做進一步詳細說明。

附圖說明

圖1是基於協同進化和反向傳播的深度神經網絡優化方法的主流程圖;

圖2是反向傳播算法(BP)的流程圖;

圖3協同進化的流程圖;

圖4是手寫數字識別數據集的一些樣例,每個小的數字圖片大小為28*28;

圖5是在神經網絡的結構:784-300-100-10時,反向傳播算法(BP)和本申請的方法(BP-CCDE)的比較,只進行一次協同進化,在迭代次數iter=4時,開始進行協同進化,縱坐標表示average error,橫坐標表示迭代次數;

圖6是在神經網絡的結構:784-300-100-10時,反向傳播算法(BP)和本申請的方法(BP-CCDE)的比較,進行了兩次協同進化,在迭代次數iter=4和iter=19時,分別開始進行協同進化,縱坐標表示average error,橫坐標表示迭代次數。

圖7是在神經網絡的結構:784-500-300-10時,反向傳播算法(BP)和本申請的方法(BP-CCDE)的比較,只進行一次協同進化,在迭代次數iter=12時,開始進行協同進化,縱坐標表示average error,橫坐標表示迭代次數;

圖8是在神經網絡的結構:784-500-300-10時,反向傳播算法(BP)和本申請的方法(BP-CCDE)的比較,進行了兩次協同進化,在迭代次數iter=12和iter=24時,分別開始進行協同進化,縱坐標表示average error,橫坐標表示迭代次數。

具體實施方式

下面結合附圖和實施例對本發明提供的基於協同進化和反向傳播的深度神經網絡優化方法進行詳細的說明。

本發明提出了一種基於協同進化和反向傳播的深度神經網絡優化方法,包括如下步驟:

步驟101:開始基於協同進化和反向傳播的深度神經網絡優化方法;

步驟102:設定一個深度神經網絡結構,用Li表示網絡的第i層,Ni表示第i層的節點個數,初始化權重W和偏差b,設置學習率η,自定義參數H;

步驟103:向步驟102的深度神經網絡輸入訓練樣本,然後使用反向傳播算法對深度神經網絡進行訓練,直到深度神經網絡連續兩次的迭代誤差變化值σ在範圍[0,H]內,停止反向傳播算法;

步驟104:採用協同進化算法對步驟103中採用反向傳播算法訓練的權重和偏差進行優化;

步驟105:採用協同進化算法優化完權重和偏差之後,繼續使用反向傳播算法進行優化,直到深度神經網絡連續兩次的迭代誤差變化值σ在範圍[0,H]內,停止反向傳播算法,再次使用協同進化算法進行優化,不停的進行迭代,最後直到迭代次數為50次,迭代終止;

步驟106:得到深度神經網絡的優化參數,即權重和偏差。

所述的步驟103,包括如下步驟:

步驟301:開始反向傳播算法;

步驟302:輸入訓練樣本到深度神經網絡,計算訓練樣本的誤差,根據誤差的梯度來反向調整深度神經網絡每一層的權重:

其中,W是調整前的權重,W′是調整後的權重,E是誤差,η是學習率;

步驟303:每次迭代,隨機選取Ds個樣本,根據步驟302中的權重調整公式來不斷更新權重;

步驟304:計算連續兩次迭代的誤差變化σ,當0≤σ≤H時,停止反向傳播算法的迭代過程;

步驟305:結束反向傳播算法。

所述的步驟104,包括如下步驟:

步驟401:開始使用協同進化算法對深度神經網絡進行優化;

步驟402:在反向傳播算法得到的權重基礎上,使用協同進化算法進行優化,將深度神經網絡按層按節點劃分為子問題;

步驟403:計算劃分後的每個子問題的成熟度M,並將這些成熟度按照從小到大的順序進行排序,選取成熟度排在前30%的子問題使用差分進化算法進行優化;

步驟404:採用差分進化算法優化完成之後,選取最優的解去替換步驟402的權重中相應位置的參數,直到所有被選取的子問題被優化完成;

步驟405:結束協同進化算法。

所述的步驟105,包括如下步驟:

步驟501:再次開始反向傳播算法;

步驟502:如果連續兩次的迭代誤差值σ在範圍[0,H]內,停止反向傳播算法,開始進行協同進化;

步驟503:按照步驟402將深度神經網絡按層按節點劃分為子問題,再按照步驟403進行子問題的選取,然後使用差分進化算法對這些子問題進行優化,選取最優的解來替換步驟502的權重中對應的參數;

步驟504:再次開始反向傳播算法,然後不斷的重複步驟502和步驟503,最後直到迭代次數為50次,迭代終止;

步驟505:結束基於協同進化和反向傳播的深度神經網絡優化方法。

所述的步驟103和步驟304中的誤差變化σ:

σ=|E(t)(x)-E(t-1)(x)|

其中,E(t)(x)和E(t-1)(x)分別是第t次和第t-1次迭代的誤差。

所述步驟403中的成熟度M的定義:

其中,Mi是第i個子問題的成熟度,N是樣本的數量,表示第j個樣本在第i個子問題上的輸出,函數g(x)的定義如下:

其中,α是一個自適應參數,可以被設置成0.3或0.4。

需要說明的是:反向傳播算法(英:Backpropagation algorithm,簡稱:BP算法)是一種監督學習算法,常被用來訓練多層感知機。反向傳播算法(BP算法)主要由兩個環節(激勵傳播、權重更新)反覆循環迭代,直到網絡的對輸入的響應達到預定的目標範圍為止。差分進化算法是一種新興的進化計算技術,和其它演化算法一樣,DE(差分進化算法的外文縮寫)是一種模擬生物進化的隨機模型,通過反覆迭代,使得那些適應環境的個體被保存了下來。但相比於進化算法,DE保留了基於種群的全局搜索策略,採用實數編碼、基於差分的簡單變異操作和一對一的競爭生存策略,降低了遺傳操作的複雜性。同時,DE特有的記憶能力使其可以動態跟蹤當前的搜索情況,以調整其搜索策略,具有較強的全局收斂能力和魯棒性,且不需要藉助問題的特徵信息,適於求解一些利用常規的數學規劃方法所無法求解的複雜環境中的優化問題。進化算法是一種成熟的具有高魯棒性和廣泛適用性的全局優化方法,具有自組織、自適應、自學習的特性,能夠不受問題性質的限制,有效地處理傳統優化算法難以解決的複雜問題。

以上三種算法都是現有的成熟的技術,其具體的定義和操作過程在此不作詳細的敘述。

本發明的效果可以通過以下仿真實驗進一步說明:

1、仿真參數

對於手寫數字識別數據集進行分析,可進行定量的結果分析:

①平均誤差:所有樣本的平均誤差,不同算法下的樣本誤差;

②分類正確率:測試樣本的正確分類的個數比上測試樣本的總的個數。

2、仿真內容

本發明方法首先對手寫數字識別數據集訓練,只使用反向傳播算法(BP)和本方法(BP-CCDE)進行比較,比較平均誤差和分類正確率。

3、仿真實驗結果及分析

手寫數字識別數據集如圖4所示,每個樣本的大小為28*28,訓練樣本一共60000個,測試集10000個,下面對兩種不同隱含層節點數的網絡進行驗證。

1.深度神經網絡的結構:784-300-100-10,含有兩個隱含層,在同樣的結構和初始化的條件下;通過BP和BP-CCDE的平均誤差結果如圖5所示,其中,實線和虛線分別表示BP和BP-CCDE方法隨著BP的迭代次數,平均誤差的變化;可見在加入協同進化之後,誤差有一個明顯的下降,圖5中在iter=4時,開始使用協同進化。在圖6中,使用了兩次協同進化,平均誤差都有一個明顯的下降,分別是iter=4和iter=19時,可以看出引進協同進化之後,能夠使得誤差下降明顯。使用BP和BP-CCDE方法對手寫數字識別在不同的協同進化次數下的分類正確率如表1所示。

表1 BP和BP-CCDE方法對手寫數字識別的分類正確率

表1中BP的迭代次數iter=50,K表示協同進化的使用次數;從表1中可以看出,在進行協同進化之後,本發明方法的分類正確率明顯高於BP算法。

2.深度神經網絡的結構:784-500-300-10,含有兩個隱含層,在同樣的結構和初始化的條件下;通過BP和BP-CCDE的平均誤差結果如圖7所示,其中,實線和虛線分別表示BP和BP-CCDE方法隨著BP的迭代次數,平均誤差的變化,圖7中在iter=4時,開始使用協同進化。在圖8中,使用了兩次協同進化,平均誤差都有一個明顯的下降,分別是iter=6和iter=23時,使用協同進化。使用BP和BP-CCDE方法對手寫數字識別在不同的協同進化次數下的分類正確率如表2所示。

表2 BP和BP-CCDE方法對手寫數字識別的分類正確率

表2中BP的迭代次數iter=50,K表示協同進化的使用次數;從表2中可以看出,在不同網絡結構下,在進行協同進化之後,本發明方法的分類正確率明顯高於BP算法。隨著協同進化方法的次數的增加,正確率也在不斷增加,可以看出本方法對於深度神經網絡的參數優化有著明顯的優勢。

以上例舉僅僅是對本發明的舉例說明,並不構成對本發明的保護範圍的限制,凡是與本發明相同或相似的設計均屬於本發明的保護範圍之內。本實施例沒有詳細敘述的部件和結構屬本行業的公知部件和常用結構或常用手段,這裡不一一敘述。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀