新四季網

智能汽車交通標誌識別的四元數深度神經網絡模型方法與流程

2023-05-28 01:52:41


本發明涉及智能汽車交通標誌自動識別。



背景技術:

智能汽車是智能交通領域的一個重要發展方向,它能利用傳感器收集汽車周圍的障礙物和道路信息,通過計算機軟體計算分析進行駕駛輔助,有利於保障交通安全,減少交通事故發生。交通標誌是使用圖文信息傳達路況的交通設施,對交通標誌進行自動識別是智能汽車的關鍵技術之一。

現有交通標誌的識別方法主要分為基於顏色,基於形狀,基於手工特徵提取加分類器和基於深度學習模型的四種方法。

基於交通標誌顏色的識別方法將輸入圖像在某個顏色空間進行閾值分析進而分割識別,該方法嚴重依賴於交通標誌的彩色信息,在一些極端的光照條件下顏色變化非常大,所以此類方法的魯棒性和準確性不高。

基於交通標誌形狀的檢測識別方法對於光照變化具有良好的魯棒性,但是受旋轉變化影響較大,即當交通標誌發生傾斜時,此類方法會出現明顯的漏檢。

基於手工特徵提取加分類器的方法首先通過某種特徵算子提取特徵,再聯合分類器進行分類識別,如何選擇提取合適的特徵對結果影響較大,因此該方法並不能較好地適應不同的工作環境。

基於深度學習模型的方法通過對原始圖片進行特徵自動學習和分類識別。相比前三類方法,此類方法可靠性最高,但是交通標誌最重要的顏色,輪廓及時間域信息仍然未能在一個統一的框架中被有效的聯合挖掘學習,交通標誌識別的魯棒性仍需要提高。



技術實現要素:

針對如何提高智能汽車交通標誌識別的魯棒性問題,本發明提供了一個基於四元數深度神經網絡的模型方法。在四元數的數學框架下將傳統標量卷積神經網絡拓展為超複數卷積神經網絡,構建了對顏色及時間維度進行聯合挖掘學習的深度神經網絡,提高了交通標誌識別的準確和穩定性,從而為智能汽車的輔助駕駛研究提供了更準確的模型保障。

本發明採用的技術方案具體步驟如下:

一種智能汽車交通標誌識別的四元數深度神經網絡模型方法,具體方法包括如下步驟:

步驟1.基於四元數視覺注意模型的交通標誌感興趣區域提取;

首先對給定的視頻圖像幀進行預處理,然後採用四元數視覺注意模型構建前景目標顯著圖,最後根據顯著圖進行閾值分割提取感興趣區域。

步驟2.基於四元數卷積神經網絡的交通標誌檢測;

根據提出的四元數卷積神經網絡,從感興趣區域中檢測出交通標誌,在時間域上對檢測結果進行匹配,構建包含當前幀及其前後幀的交通標誌圖像組。

步驟3.基於顏色時間域聯合學習的深度神經網絡的交通標誌識別。

根據提出的深度神經網絡對顏色及時間維度進行聯合挖掘學習,完成對交通標誌的識別分類。

本發明基於四元數的數學表示框架,提出了一種四元數深度神經網絡模型方法以提高交通標誌識別的魯棒性,從而為智能汽車的輔助駕駛研究提供了更準確的模型保障。

附圖說明

圖1為本發明方法系統結構流程圖。

圖2四元數卷積神經網絡結構圖。

圖3四元數卷積神經網絡感受野及特徵圖生成示意圖。

圖4對顏色及時間維度進行聯合挖掘學習的深度神經網絡結構圖。

圖5對顏色維度進行特徵學習的一個示例。

圖6對時間維度進行特徵學習的一個示例。

圖7特徵圖優化篩選算法流程圖。

圖8特徵圖融合及篩選的一個示例。

具體實施方式

本發明的具體實施過程如圖1所示,包括如下3個方面:

①基於四元數視覺注意模型的感興趣區域提取

②基於四元數卷積神經網絡的交通標誌檢測

③基於顏色及時間域聯合學習深度神經網絡模型的交通標誌識別

各個步驟詳述如下。

一、基於四元數視覺注意模型的感興趣區域提取

對於給定的視頻當前幀彩色圖像,首先計算其亮度信息圖(r,g,b分別代表紅,綠,藍顏色通道),然後採用gabor濾波器計算其方向特徵圖o,通過時間維度的幀差生成時間特徵圖t,接著採用四元數視覺注意模型將此三個維度信息分別編碼到四元數的3個虛軸i,j和k,即

v=ii+oj+tk(1)

對該模型求模獲得表徵前景目標的顯著圖

對該顯著圖進行閾值分割則可獲得相應模板,據此可從原始圖像中提取對應的感興趣區域。

二、基於四元數卷積神經網絡(qcnn)的交通標誌檢測

經過提取的感興趣區域包含交通標誌的正樣本和負樣本,每個區域都是一個彩色圖像,可以由四元數表示為f=ri+gj+bk,經過訓練的四元數卷積神經網絡可用於在感興趣區域中檢測出正確的交通標誌。圖2所示為提出的四元數卷積神經網絡,包含了多個四元數卷積層,下採樣層,用於分類的全連接層和輸出標籤層。

相比較於傳統的神經元模型,四元數神經元將每個點擴展為四元數,能通過四元數乘法運算實現對編碼在不同軸上的信息進行融合學習,從而獲得更好的特徵學習性能。給定一個實部pr為0的純虛輸入四元數數據x=pii+pjj+pkk,設其對應的權值為w=qr+qii+qjj+qkk,w∈k4,k4表示四元數集合,則對應此四元數神經元的輸出y為

y=f(s)(3)

其中s表示為:

輸出信號s是神經元的輸入x通過權值w進行旋轉操作,用權值w的模實現膨脹操作,公式(4)表明輸入的三維信息x通過四元數的乘法規則,在不同的虛軸上進行了充分的融合,其中每個輸出虛軸都包含了權值w和輸入x所有實、虛軸的代數運算。平移算子的表達通過加減一個偏置b實現。輸出神經元y採用sigmoid函數:

圖3表示了四元數卷積神經網絡的感受野及輸入圖像經過多個核進行四元數卷積生成多張特徵圖的過程。下採樣過程是將四元數卷積層後得到的四元數特徵圖,分別提取三個虛軸矩陣,即得到三個標量矩陣,然後對各個標量矩陣做傳統的下採樣操作。四元數全連接層將最末下採樣層得到的特徵矩陣變換為1*kn的特徵向量,n為特徵矩陣純虛四元數像素點的個數,k為四元數特徵圖的數量。四元數卷積神經網絡的權值採用四元數bp反向傳播算法來訓練確定。

三、基於顏色及時間域聯合學習深度神經網絡模型的交通標誌識別

如圖1所示,檢測得到的交通標誌在時間域進行匹配,首先構成包含當前幀及其前後幀的交通標誌圖像組,然後通過深度神經網絡模型對顏色及時間域信息進行聯合挖掘學習從而分類識別。

圖4為提出的聯合學習深度神經網絡模型結構圖,首先分別將顏色通道及時間維度的3幀灰度交通標誌圖編碼到2個四元數的對應虛軸上,然後採用2個四元數卷積神經網絡分別進行特徵學習提取,獲得的特徵圖表徵了原始輸入的顏色、輪廓及運動特徵信息,將所有軸上的特徵圖融合在一起經過一個優化算法進行特徵圖篩選以降低參數數量,經過篩選的特徵圖再輸入到一個傳統的標量卷積神經網絡進行最終的交通標誌分類識別。圖5和圖6分別表示了通過四元數卷積神經網絡在顏色和時間維度進行特徵提取學習的結果,圖7為所提特徵圖優化篩選方法的流程圖,圖8表示了經過特徵圖篩選的結果。

對於每個輸入圖像si(表示輸入圖像集合),設其第n個特徵圖的二值化圖像為(表示特徵圖二值化後的圖像集合),採用突出分數計算在前景圖中每個特徵圖像掩碼針對輸入圖像si中交通標誌特徵的能量值,這個能量可以表示這個特徵圖的重要程度。

公式(6)中,分子是特徵圖的二值化矩陣和輸入圖像si矩陣點乘得到矩陣的1範數,分母是二值化圖像矩陣的1範數,商為突出分數。對於四元數卷積神經網絡,輸入是編碼在四元數三個虛軸上的三張圖像,因此每一張特徵圖對應三個突出分數,採用融合顏色及時間維度信息的深度神經網絡模型總共產生6個突出分數。將6個突出分數的算術平均值作為此特徵圖的最終突出分數,用表示,計算公式如下:

其中sij表示第i組輸入的第j個圖像(1≤j≤6),第i組的前三個圖像為t時刻彩色圖像的rgb三個通道分量,後面三個是t-1、t、t+1時刻的灰度圖,符號「·」定義為元素範圍的乘法。基於此可構建一個初始值為0的直方圖h,給定一個閾值τk,如果特徵圖的則相應的h(n)值加1,直方圖h(n)的計算方法如下:

將直方圖h(n)按降序排列,得到前n個最大值對應的序號,其對應的特徵圖則為篩選結果。

創新點

提出了一種四元數深度神經網絡模型方法用於智能汽車交通標誌識別,提高了交通標誌識別的魯棒性,為智能汽車輔助駕駛的相關研究提供了理論模型基礎。針對提高智能汽車交通標誌檢測識別魯棒性的問題,本發明採用四元數視覺注意模型建立前景目標顯著圖對感興趣區域進行提取,構建了四元數卷積神經網絡對交通標誌進行檢測,通過時間域匹配生成交通標誌圖像組,給出了一個深度神經網絡模型對交通標誌的顏色,輪廓及時間域特徵進行聯合挖掘學習,最終對交通標誌分類識別,本發明所提方法為提升智能汽車輔助駕駛性能提供了更準確的模型保障。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀