遙感分類卷積神經網絡的關鍵卷積層超參數確定方法與流程
2023-10-30 12:37:32

本發明涉及遙感分類領域,具體涉及一種遙感分類卷積神經網絡的關鍵卷積層超參數確定方法。
背景技術:
通過遙感影像進行地理目標識別是遙感技術運用於實際問題的一個重要環節,無論是專題信息提取、動態變化監測、專題製圖,還是遙感資料庫建設等都離不開遙感影像分類技術。面向對象遙感技術集合眾多臨近像元組成一定語義的空間影像對象,它綜合遙感數據中蘊含的空間、紋理和光譜信息,其核心為影像對象構建和影像對象分類,卷積神經網絡是深度學習算法中的一種,該算法受視覺系統的啟發,通過權值共享來降低參數複雜度以及以圖像的局部視野域作為分層結構的輸入,使圖像保持了平移、縮放和旋轉的不變性。在圖像識別領域,卷積神經網絡取得了不錯的效果。但是將卷積神經網絡應用到遙感影像分類,依然存在如何根據不同解析度輸入遙感影像確定卷積神經網絡超參數(卷積核大小和步長)的問題。
技術實現要素:
本發明要解決的技術問題是:提供一種遙感分類卷積神經網絡的關鍵卷積層超參數確定方法,能夠節約算法所需要的時間,提高其面向對象遙感分類精度。
本發明為解決上述技術問題所採取的技術方案為:一種遙感分類卷積神經網絡的關鍵卷積層超參數確定方法,其特徵在於:它包括以下步驟:
卷積神經網絡樣本集的構建:
對獲取的研究區域的遙感影像進行數據處理,得到具有若干個inputsize*inputsize大小的遙感影像對象的樣本集合,將樣本集合分為訓練集和驗證集,訓練集和樣本集中各地物類別數目比例一致;
卷積神經網絡結構的構建:設計卷積層和降採樣層的個數與排布順序;
卷積神經網絡關鍵層超參數的確定:選定其中一個卷積層為關鍵層,預設關鍵層卷積核大小kernelsize1,計算卷積尺度kernel1scale=inputsize/kernelsize1;
根據inputsize和kernel1scale,按照以下設置規則計算卷積步長stride:
規則1、如果kernel1scaleb1,則stride設為1,並考慮兼容關係;
規則2、如果a1<=kernel1scale<=a2並且inputsize<b1,則stride設為2或1,並考慮兼容關係;
規則3、如果a1<=kernel1scale<=a2並且b1<=inputsizea2並且inputsize<b2,則stride設為3,並考慮兼容關係;
所述的a1、a2、b1、b2為預設參數;所述的兼容關係為:1)對於關鍵層卷積得到輸出特徵圖大小outputsize,若後續降採樣大小分別為s1、s2、s3、……、sn,則設計關鍵層輸出特徵圖大小的方式如下:outputsize=k*s1*s2*s3*……*sn,k為最後一層特徵圖的大小;2)kernelsize1=[inputsize-(outputsize-1)*stride]+2*padsize,padsize為補零數目;
其它卷積層參數的確定:預設其它卷積層卷積核為kernelsize,其它卷積層卷積步長為1,padsize=(kernelsize-1)/2;
降採樣層參數的確定:後續降採樣大小採用均值降採樣或最大值降採樣。
按上述方案,所述的卷積神經網絡結構包括3層卷積層和3層採樣層,具體順序為第一卷積層、第一降採樣層、第二卷積層、第二降採樣層、第三卷積層、第三降採樣層;所述的關鍵層為第一卷積層。
按上述方案,所述的a1=20,a2=40,b1=100,b2=200。
按上述方案,所述的訓練集和驗證集中的樣本比例為4比1。
一種遙感分類方法,其特徵在於:它包括以下步驟:
數據獲取和預處理:獲取研究區域的遙感影像,並進行預處理,預處理包括幾何校正、大氣校正和裁剪拼接;
地類確定:根據研究目的,結合研究區域實地調察,選擇需要分類的地類;
遙感影像多尺度分割:利用面向對象遙感影像分類專業軟體對遙感影像進行多尺度分割;
最優分割尺度選擇:根據所選擇的地類,選擇其對應的最優分割尺度和最優分割參數;
影像對象提取:在對應的最優分割尺度上提取相應的矢量對象,用矢量對象裁剪整幅遙感影像,獲得遙感影像對象;
影像對象鄰域提取:計算所有遙感影像對象的最小外包矩形的長和寬,取長和寬中的最大值lmax作為輸入影像的長度,以遙感影像對象中心像元為中心,將所有遙感影像對象擴展成m*m大小,m=lmax/影像解析度,擴展像元值為以遙感影像對象中心像元為中心的m*m鄰域像元值;
卷積神經網絡樣本集的構建:將m*m的遙感影像對象重採樣成inputsize*inputsize大小的遙感影像對象,得到具有若干個inputsize*inputsize大小的遙感影像對象的樣本集合,將樣本集合分為訓練集和驗證集,訓練集和樣本集中各地物類別數目比例一致;
卷積神經網絡結構的構建:設計卷積層和降採樣層的個數與排布順序;
卷積神經網絡關鍵層超參數的確定:選定其中一個卷積層為關鍵層,預設關鍵層卷積核大小kernelsize1,計算卷積尺度kernel1scale=inputsize/kernelsize1;
根據inputsize和kernel1scale,按照以下設置規則計算卷積步長stride:
規則1、如果kernel1scaleb1,則stride設為1,並考慮兼容關係;
規則2、如果a1<=kernel1scale<=a2並且inputsize<b1,則stride設為2或1,並考慮兼容關係;
規則3、如果a1<=kernel1scale<=a2並且b1<=inputsizea2並且inputsize<b2,則stride設為3,並考慮兼容關係;
所述的a1、a2、b1、b2為預設參數;所述的兼容關係為:1)對於關鍵層卷積得到輸出特徵圖大小outputsize,若後續降採樣大小分別為s1、s2、s3、……、sn,則設計關鍵層輸出特徵圖大小的方式如下:outputsize=k*s1*s2*s3*……*sn,k為最後一層特徵圖的大小;2)kernelsize1=[inputsize-(outputsize-1)*stride]+2*pad,padsize為補零數目;
其它卷積層參數的確定:預設其它卷積層卷積核為kernelsize,其它卷積層卷積步長為1,padsize=(kernelsize-1)/2;
降採樣層參數的確定:後續降採樣大小採用均值降採樣或最大值降採樣;
基於卷積神經網絡進行面向對象遙感影像分類:基於所述的訓練集對於卷積神經網絡進行訓練,並在所述的驗證集上驗證精度。
按上述分類方法,所述的卷積神經網絡結構包括3層卷積層和3層採樣層,具體順序為第一卷積層、第一降採樣層、第二卷積層、第二降採樣層、第三卷積層、第三降採樣層;所述的關鍵層為第一卷積層。
按上述分類方法,所述的a1=20,a2=40,b1=100,b2=200。
按上述分類方法,所述的訓練集和驗證集中的樣本比例為4比1。
本發明的有益效果為:
1、提出了基於影像輸入大小和卷積核大小,提出卷積尺度的概念,這與遙感空間尺度相適應,並在此基礎之上,提供了一種基於輸入大小和卷積尺度聯合確定關鍵層超參數的方法,能夠減少算法調參所需要的時間,提高面向對象遙感分類精度。
2、提出將不同網絡的除關鍵層卷積層,其他卷積層和降採樣超參數的設置方法,通過此種方法,才能分析卷積神經網絡輸入和關鍵層超參數對於卷積神經網絡用於面向對象遙感分類精度的影響。
附圖說明
圖1為本發明一實施例的方法流程圖。
圖2為遙感影像對象提取過程示意圖。
圖3為影像對象鄰域提取前後的對比圖。
具體實施方式
下面結合具體實例和附圖對本發明做進一步說明。
本發明旨在解決如何根據不同解析度輸入遙感影像確定卷積神經網絡超參數(卷積核大小和步長)的問題,提供一種基於影像輸入進行面向對象遙感分類卷積神經網絡的關鍵層超參數確定方法,而在卷積神經網絡中,第一層超參數顯得尤為關鍵,卷積運算的目的是提取輸入的不同特徵,第一層卷積層可能只能提取一些低級的特徵如邊緣、線條和角等層級,但是它決定了更多層的網絡能否從低級特徵中迭代提取更複雜的特徵,換言之,第一層提取特徵信息含量越高和特徵間越獨立,後續卷積層越能提取複雜可靠的特徵。
本發明提供一種遙感分類卷積神經網絡的關鍵卷積層超參數確定方法,它包括以下步驟:
卷積神經網絡樣本集的構建:
對獲取的研究區域的遙感影像進行數據處理,得到具有若干個inputsize*inputsize大小的遙感影像對象的樣本集合,將樣本集合分為訓練集和驗證集,訓練集和樣本集中各地物類別數目比例一致;本實施例中將樣本集合中4/5的樣本作為訓練集,其餘1/5作為驗證集。
卷積神經網絡結構的構建:設計卷積層和降採樣層的個數與排布順序。本實施例中,所述的卷積神經網絡結構包括3層卷積層和3層採樣層,具體順序為第一卷積層、第一降採樣層、第二卷積層、第二降採樣層、第三卷積層、第三降採樣層;所述的關鍵層為第一卷積層。
卷積神經網絡關鍵層超參數的確定:選定其中一個卷積層為關鍵層,預設關鍵層卷積核大小kernelsize1,計算卷積尺度kernel1scale=inputsize/kernelsize1;
根據inputsize和kernel1scale,按照以下設置規則計算卷積步長stride:
規則1、如果kernel1scaleb1,則stride設為1,並考慮兼容關係;
規則2、如果a1<=kernel1scale<=a2並且inputsize<b1,則stride設為2或1,並考慮兼容關係;
規則3、如果a1<=kernel1scale<=a2並且b1<=inputsizea2並且inputsize<b2,則stride設為3,並考慮兼容關係;
所述的a1、a2、b1、b2為預設參數,本實施例中a1=20,a2=40,b1=100,b2=200;所述的兼容關係為:1)對於關鍵層卷積得到輸出特徵圖大小outputsize,若後續降採樣大小分別為s1、s2、s3、……、sn,則設計關鍵層輸出特徵圖大小的方式如下:outputsize=k*s1*s2*s3*……*sn,k為最後一層特徵圖的大小;2)kernelsize1=[inputsize-(outputsize-1)*stride]+2*pad,padsize為補零數目;
其它卷積層參數的確定:預設其它卷積層卷積核為kernelsize,其它卷積層卷積步長為1,padsize=(kernelsize-1)/2;
降採樣層參數的確定:後續降採樣大小採用均值降採樣或最大值降採樣。
一種遙感分類方法,如圖1所示,它包括以下步驟:
s1、數據獲取和預處理:獲取研究區域的遙感影像,並進行預處理,預處理包括幾何校正、大氣校正和裁剪拼接;本實施例獲取的是杭州市西湖區的高解析度影像為實驗數據,利用遙感影像軟體(envi、arcgis等)對實驗數據進行影像預處理。
s2、地類確定:根據研究目的,結合研究區域實地調察,選擇需要分類的地類。根據研究目的,本實例涉及地物類型有:有林地、綠地、水體、住宅、道路等。
s3、遙感影像多尺度分割:利用面向對象遙感影像分類專業軟體對遙感影像進行多尺度分割。面向對象遙感影像分類專業軟體內嵌入多種分割算法,比如棋盤算法、多閾值分割算法、分形網絡演化算法等等。本實施例使用的ecognication軟體,多尺度分割算法採用分形網絡演化算法。
s4、最優分割尺度選擇:根據所選擇的地類,選擇其對應的最優分割尺度和最優分割參數。常用的最優分割尺度的選擇方法:經驗選擇法、最大面積法、地物綜合法、方差變異法、目標函數法等。最優分割參數常採用反覆實驗法。最優分割參數為形狀因子0.9,緊緻度因子設為0.8,光滑度因子設為0.2。本實施例使用的是基於經驗選擇方法確定各地類的最優分割尺度。以下表1是各地類對應的最佳分割尺度示例表:
表1各地類對應的最佳分割尺度
s5、影像對象提取:在對應的最優分割尺度上提取相應的矢量對象,用矢量對象裁剪整幅遙感影像,獲得遙感影像對象;為保持樣本均衡,各地類提取數目應比較均衡,本實施例提取樣本2500個。如圖2所示,(a)為矢量對象,(b)為整幅遙感影像,(c)為遙感影像對象。
s6、影像對象鄰域提取:計算所有遙感影像對象的最小外包矩形的長和寬,取長和寬中的最大值lmax作為輸入影像的長度,以遙感影像對象中心像元為中心,將所有遙感影像對象擴展成m*m大小,m=lmax/影像解析度,擴展像元值為以遙感影像對象中心像元為中心的m*m鄰域像元值;本實施例中通過計算,m為192。如圖3所示,(a)為鄰域提取前,(b)為鄰域提取後。
s7、卷積神經網絡樣本集的構建:將m*m的遙感影像對象重採樣成inputsize*inputsize大小的遙感影像對象,得到具有若干個inputsize*inputsize大小的遙感影像對象的樣本集合,將樣本集合分為訓練集和驗證集,訓練集和樣本集中各地物類別數目比例一致;本實施例中將192*192的遙感影像對象重採樣成192*192,96*96,48*48。訓練集共有2000個樣本,驗證集共有500個樣本。其中訓練集每個地類有400樣本,其中訓練集每個地類有100樣本,保持樣本比例均衡。
s8、卷積神經網絡結構的構建:設計卷積層和降採樣層的個數與排布順序;本實施例中卷積神經網絡結構包括3層卷積層和3層採樣層,具體順序為第一卷積層、第一降採樣層、第二卷積層、第二降採樣層、第三卷積層、第三降採樣層。
s9、卷積神經網絡關鍵層超參數的確定:選定其中一個卷積層為關鍵層,預設關鍵層卷積核大小kernelsize1,計算卷積尺度kernel1scale=inputsize/kernelsize1;本實施例中所述的關鍵層為第一卷積層,輸入inputsize為192,kernelsize1為5,kernel1scale為38.4,當輸入inputsize為48或96時,kernelsize1為2或3時,方法同理。
根據inputsize和kernel1scale,按照以下設置規則計算卷積步長stride:
規則1、如果kernel1scaleb1,則stride設為1,並考慮兼容關係;
規則2、如果a1<=kernel1scale<=a2並且inputsize<b1,則stride設為2或1,並考慮兼容關係;
規則3、如果a1<=kernel1scale<=a2並且b1<=inputsizea2並且inputsize<b2,則stride設為3,並考慮兼容關係;
所述的a1、a2、b1、b2為預設參數,本實施例中a1=20,a2=40,b1=100,b2=200;所述的兼容關係為:1)對於關鍵層卷積得到輸出特徵圖大小outputsize,若後續降採樣大小分別為s1、s2、s3、……、sn,則設計關鍵層輸出特徵圖大小的方式如下:outputsize=k*s1*s2*s3*……*sn,k為最後一層特徵圖的大小;2)kernelsize1=[inputsize-(outputsize-1)*stride]+2*padsize,padsize為補零數目。
本實施例中,當輸入inputsize是192,kernel1scale為38.4,滿足規則4:20<=kernel1scale<=40,100<=inputsize<200,步長stride設為3。當輸入為48或96時,設計卷積核大小kernelsize為2或3時方法同理。為驗證方法的有效性,本實例增加了對比實驗,實驗如表2所示。
表2:卷積層卷積核不同大小和同步長的卷積神經網絡設計表
上表中,output表示outputsize,pad表示padsize,kernel為卷積核的大小。
s10、其它卷積層參數的確定:預設其它卷積層卷積核為kernelsize,其它卷積層卷積步長為1,padsize=(kernelsize-1)/2,padsize為補零數目;可以保持輸入大小和輸出大小保持保持一致。本實施例第二卷積層和第三卷積層採取如下參數:步長stride為1,補零padsize設置為2,卷積核大小設置5。
s11、降採樣層參數的確定:後續降採樣大小採用均值降採樣或最大值降採樣;本實施例如下參數:降採樣大小設計為2,採用均值降採樣。
s12、基於卷積神經網絡進行面向對象遙感影像分類:基於所述的訓練集對於卷積神經網絡進行訓練,並在所述的驗證集上驗證精度。表3和表4為當卷積核卷積層1大小為2、3、5、6時,不同網絡分類精度。(括號內為卷積核大小)。
表3當卷積核卷積層1大小為5或6時,不同網絡分類精度
表4當卷積核卷積層1大小為5或6時,不同網絡分類精度
從表3和表4,我們可以得知,
滿足規則1有:
當輸入為48*48,卷積核大小為3*3,計算卷積尺度為16,滿足規則1,卷積步長設為1,其分類精度為0.916;
當輸入為48*48,卷積核大小為6*6,計算卷積尺度為8,滿足規則1,卷積步長設為1其分類精度為0.946;
當輸入為96*96,卷積核大小為6*6,計算卷積尺度為16,滿足規則1,卷積步長設為1,其分類精度為0.942。
滿足規則2有:
當輸入為48*48,卷積核大小為2*2,計算卷積尺度為24,滿足規則1,考慮兼容關係,第一層卷積層輸出大小為8的倍數,卷積步長設為2,其分類精度為0.932;
當輸入為96*96,卷積核大小為3*3,計算卷積尺度為24,滿足規則1,考慮兼容關係,第一層卷積層輸出大小為8的倍數,卷積步長設為1,其分類精度為0.92。
滿足規則3有:
當輸入為192*192,卷積核大小為6*6,計算卷積尺度為32,滿足規則3,考卷積步長設為3,其分類精度為0.92。
滿足規則4有:
當輸入為96*96,卷積核大小為2*2,計算卷積尺度為48,滿足規則4,考卷積步長設為2,其分類精度為0.926;
當輸入為192*192,卷積核大小為2*2,計算卷積尺度為96,滿足規則4,考卷積步長設為2,其分類精度為0.926。
以上實施例僅用於說明本發明的設計思想和特點,其目的在於使本領域內的技術人員能夠了解本發明的內容並據以實施,本發明的保護範圍不限於上述實施例。所以,凡依據本發明所揭示的原理、設計思路所作的等同變化或修飾,均在本發明的保護範圍之內。