新四季網

基於深層門限卷積神經網絡的圖像超分辨方法與流程

2023-11-05 04:55:22 1


本發明屬於圖像處理技術領域,具體是一種圖像超分辨方法,可用於衛星遙感領域,醫學領域,交通監控領域以及視頻壓縮領域等。



背景技術:

圖像超分辨是指從一個低分辨圖片中學習恢復出高分辨圖像的一種技術。相比較於低分辨圖像來說,高分辨圖像可以表達更多詳細的信息,其細節表達能力更強,因此,圖像超分辨在很多的領域都有著極大應用,如衛星遙感領域,醫學領域,交通監控領域,以及視頻壓縮領域等。

目前為止,圖像的超分辨方法主要有三個主要分類:基於插值,基於重建和基於學習的方法。而基於學習的方法由於引入了先驗信息的樣例,增加了更有效的約束,提高了重建圖像的準確性,所以在近幾年來取得了極大的發展,逐漸成為圖像超分辨的主流方法,而且其性能也遠遠超過了另外兩種方法。在基於學習的方法中大致又分為兩大方向:基於字典學習的方法和基於神經網絡的方法。

基於字典學習的方法主要是基於稀疏編碼的超分辨算法scsr,它是由yang等人就是從壓縮感知理論出發提出的,這種方法的流程是:首先從輸入圖像中有重合的提取圖像塊,並拉成一個向量,並進行減均值和歸一化的預處理;然後經過低分辨學到的字典進行編碼,學到他們的稀疏表示;接著,將稀疏參數對應到高分辨字典中,得到高分辨的圖像塊;最後,有重合的重構原圖,對重合部分取平均,就得到了最終的高分辨圖像。該方法的缺點是在應用時學習低分辨字典的稀疏表示的時候用時非常長。

基於神經網絡的方法中最典型的就是基於卷積神經網絡的圖像超分辨方法srcnn,它是由chaodong等人在2015年提出的,方法中構建了一種基於三層卷積神經網絡的圖像超分辨模型,該模型是一個由低分辨圖像到高分辨圖像的端到端的映射。在應用過程中,由於不需要另外學習參數,所以用時短;但該方法的弊端是在網絡的層數加深時模型的學習效果會下降。



技術實現要素:

本發明的目的在於針對上述現有技術的不足,提出了一種基於深度門限卷積神經網絡的圖像超分辨方法,以加快圖像超分辨的速度,提高圖像超分辨的性能。

本發明的技術方案是對原有的srcnn方法進行改進,其一方面,是用門限卷積層取代傳統的卷積層;另一方面,將原有三層網絡的拓展到了更多層,其具體的實現步驟如下:

1)獲取成對的低分辨和高分辨圖像數據:

對自然圖像先進行下採樣處理,然後再用雙線性三次插值法,得到與之對應的低分辨圖像,最後隨機採樣,得到大小相同的成對低分辨圖像和高分辨圖像作為訓練數據;

2)對基於卷積神經網絡的圖像超分辨模型srcnn進行改進,構建一個端到端的深層門限卷積神經網絡:

2a)定義一種門限卷積層,並用它來代替srcnn中的卷積層,得到淺層的門限卷積神經網絡;

2b)將淺層的門限卷積神經網絡拓展到更多層神經網絡,且最後一層採用反卷積神經網絡重構高分辨圖像,得到多層門限卷積神經網絡和一層反卷積神經網絡級聯的深層門限卷積神經網絡;

3)用adam優化方法對深層門限卷積神經網絡進行訓練:

3a)將低分辨圖像樣本作為深層門限卷積神經網絡的輸入,計算其輸出與高分辨圖像樣本之間的重構誤差其中xhi為訓練時第i幅高分辨圖像,xli為訓練時第i幅低分辨圖像,m表示該深層門限卷積神經網絡;

3b)將重構誤差e作為目標函數,用adam優化方法優化該目標函數,得到一組最優的深層門限卷積神經網絡參數;

4)利用深層門限卷積神經網絡進行圖像超分辨:

4a)對於輸入的低分辨圖像,通過一次門限卷積後得到低分辨圖像所對應的特徵圖像;

4b)由4a)中得到的低分辨圖像的特徵圖像再經過多層的門限卷積神經網絡精確的映射到高分辨圖像的特徵圖像;

4c)由4b)中得到的高分辨圖像的特徵圖像經過一層反卷積網絡重構得到我們的高分辨圖像。

本發明具有如下優點:

1.本發明由於是用門限卷積層來構建的深層門限卷積神經網絡,有效的減少了深層神經網絡的梯度消失的問題,解決了深層神經網絡的訓練問題,可以得到一個優化良好的深層神經網絡;

2.本發明由於最終使用的深層門限卷積神經網絡是一個優化良好的深層神經網絡,特徵提取的非常充分,故能更好地描述細節的信息,使圖像超分辨效果更好;

3.本發明由於採用的深層門限卷積神經網絡是一個端到端的模型,而端到端的的模型在實際應用中具有速度快的優點,所以本發明可以快速的得到高分辨圖像。

附圖說明

圖1是本發明的實現流程圖;

圖2是本發明中的圖像超分辨子流程圖;

圖3是本發明中的門限卷積層示意圖;

圖4是本發明與其他方法的訓練重構誤差比較圖;

圖5是本發明與其他方法對自然圖像的超分辨結果比較圖。

具體實施方式

下面將結合附圖,對本發明的實施例和效果作進一步詳細說明。

參照圖1,本發明的實現步驟如下。

步驟一,獲取成對的低分辨和高分辨圖像數據。

1.1)獲取低分辨圖像:

對原始圖像先進行下採樣,再對下採樣圖像採用雙線性三次插值法將圖像恢復到原來大小,得到的圖片即為低分辨圖像;

所述雙線性三次插值,通過如下公式進行:

f(i+u,j+v)=abc

其中,u表示橫向的插值位置,v表示縱向的插值位置,i為當前像素點的橫坐標,j為當前像素點的縱坐標,f(i+u,j+v)表示圖像在(i+u,j+v)處插值後的像素值;a是橫向因子矩陣,b矩陣是包括像素值f(i,j)在內的周圍共計16個點的像素值組成的矩陣,c是縱向因子矩陣,這三個矩陣分別表示如下:

a=[s(1+u)s(u)s(1-u)s(2-u)],s是插值基函數;

c=[s(1+v)s(v)s(1-v)s(2-v)]t。

1.2)獲取同樣大小的低分辨圖像和高分辨圖像:

由於模型訓練時要求輸入的圖像要具有相同大小,故用隨機採樣的方式在低分辨圖像和高分辨圖像相對應的位置採集n個p×p的同樣大小的圖片塊作為低分辨圖像訓練樣本集xl和高分辨圖像訓練樣本集xh;

低分辨圖像訓練樣本集表示為xl={xl1,xl2...xli...xln},xli表示第i個低分辨訓練樣本圖像;高分辨圖像訓練樣本集表示為xh={xh1,xh2...xhi...xhn},xhi表示第i個高分辨訓練樣本圖像,i=1...n。

步驟二,構建深層門限卷積神經網絡。

2.1)構建淺層門限卷積神經網絡:

(2.1a)參照圖3,定義一種門限卷積層:

首先,設門限卷積層的輸入為x,對該輸入進行兩路卷積操作,得到第一路卷積結果f(ω1*x+b1)和第二路卷積的結果g(ω2*x+b2),其中「*」表示卷積操作,ω1為第一路的卷積核,ω2為第二路的卷積核,b1是第一路的偏置,b2是第二路的偏置,f是第一路激活函數,g是第二路激活函數;

然後,將這兩路卷積的結果經過一個點乘操作,得到門限卷積的輸出g_conv(x),其數學表達形式為:

g_conv(x)=f(ω1*x+b1)·g(ω2*x+b2);

f函數常用的一種是f(x)=x,另一種是具有信息傳遞的作用;g函數選用sigmoid函數,具有門限控制作用。

(2.1b)用(2.1a)中的門限卷積層代替基於卷積神經網絡的圖像超分辨模型srcnn中的卷積層conv(x)=f(ω*x+b),得到淺層門限卷積神經網絡;

2.2)將淺層門限卷積神經網絡拓展到深層門限卷積神經網絡:

(2.2a)引入門限卷積層後,減小深層神經網絡的梯度衰減:

根據分步求導準則,門限卷積層的輸出對門限卷積層的輸入的導數可表示為:

根據上式,如果有一路的出現梯度衰減問題,門限卷積層的梯度可以由另一路傳導下去,所以門限卷積層可以減小深層神經網絡的梯度衰減;

(2.2b)用多個門限卷積層級聯,構建多層門限卷積神經網絡;

(2.2c)為了更好地重構高分辨圖片,在(2.2b)的多層門限卷積神經網絡後面再加入一層反卷積網絡,最終構建一個多層門限卷積神經網絡與一層反卷積網絡級聯的深層門限卷積神經網絡。

步驟三,訓練基於圖像超分辨應用的深層門限卷積神經網絡。

3.1)將低分辨圖像樣本作為深層門限卷積神經網絡的輸入,計算其輸出與高分辨圖像樣本之間的重構誤差其中xhi為訓練時第i幅高分辨圖像,xli為訓練時第i幅低分辨圖像,m表示該深層門限卷積神經網絡;

3.2)將重構誤差e作為目標函數,用adam優化方法優化該目標函數:

3.2a)初始化深層門限卷積神經網絡參數θ,設定優化總次數t;

3.2b)計算出目標函數對每一個參數的梯度gt;

3.2c)根據求得的梯度gt求出如下幾個參數:

梯度的一階距:mt=αmt-1+(1-α)gt,其中α是第一個固定參數,取值為α=0.9;

校正後的梯度一階距:

梯度的二階距:其中β是第二個固定參數,取值為β=0.999;

校正後的梯度二階距:

3.2d)根據3.2c)求出第t次參數θ微調的大小:其中η為設定的初始步長;

(3.2e)將深層門限卷積神經網絡參數更新為:θt=θt-1+δθt;

(3.2f)將當前更新次數t與訓練總次數t比較:當t<t時,則重複3.2b)-3.2e)操作;當t=t時,訓練結束,t次優化得到的參數θt即為最終的深層門限卷積神經網絡的參數。

步驟四,利用深層門限卷積神經網絡進行圖像超分辨。

參照圖2,本步驟的過程如下:

(4a)對於輸入的低分辨圖像,通過一層門限卷積層後得到低分辨圖像的特徵圖像;

(4b)由(4a)中得到的低分辨圖像的特徵圖像再經過多層的門限卷積神經網絡精確的映射到高分辨圖像的特徵圖像;

(4c)由(4b)中得到的高分辨圖像的特徵圖像經過一層反卷積網絡重構得到高分辨圖像,完成對低分辨圖像的超分辨。

本發明的效果可通過以下測試進一步說明:

一.測試條件

採用cifar-10數據集作為訓練數據對深層門限卷積神經網絡訓練,用自然圖像作為測試數據,用峰值信噪比psnr作為測試時的度量標準。

二.測試內容

測試1,用淺層門限卷積神經網絡與srcnn網絡在進行加深時,測試其測試樣本重構誤差的變化,結果如圖4所示。從圖4可以看出srcnn在模型加深時,測試樣本的重構誤差沒有減小,反而會有一定的增大,而用本發明使用的淺層門限卷積神經網絡在網絡加深時,測試樣本的重構誤差會明顯減小。

測試2,用本發明對自然圖像進行超分辨,結果如圖5所示,其中圖5(a)原始圖片,圖5(b)為低分辨圖像,圖5(c)是srcnn的超分辨結果,峰值信噪比為22.26db,圖5(d)為本發明的超分辨結果,峰值信噪比為22.42db,可見,本發明的超分辨效果要優於srcnn模型。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀