圖像識別方法和圖像識別裝置與流程
2023-06-02 01:22:41
本發明涉及圖像識別方法和圖像識別裝置,具體而言,涉及圖像識別中消除或減少誤檢測、降低誤檢率的方法、以及使用該方法的圖像識別裝置。
背景技術:
近年來,圖像識別技術發展迅速,其在安全、金融、信息、教育等諸多領域有著廣泛的應用前景。圖像識別一般基於已知的識別物體特徵庫,利用計算機或嵌入式設備等分析圖像,進而利用識別物體特徵庫中的特徵模式來檢測出目標物體。具體來說,例如利用各種識別物體的特徵模式,讓計算機對目標物體進行特徵模式學習,並利用分類算法將目標物體檢測出來。
技術實現要素:
然而在實際的檢測中,經常會有誤檢測的情況。例如圖7所示的情況。
圖7中,左圖為實際想要檢測的汽車的車頭,而右圖本來為一個監控系統的視頻中顯示時間部分的畫面,卻被誤檢測為車頭。該監控系統本來需要監控的目標是車頭,但卻將該顯示時間的畫面頻繁地誤檢測為是需要監控的目標。
之所以產生這樣的誤檢測,主要是因為當將圖像進行多尺度識別時,圖像中的某些局部圖像的特徵模式與對目標物體進行學習後的特徵模式非常相似。因此,該局部圖像容易被誤識別為目標物體。一旦該局部圖像反覆出現,就會反覆地被誤識別為目標物體。例如圖7的例子中顯示時間的畫面在監控視頻畫面經常出現,於是頻繁被誤認為是需要監控的目標,造成大量無用的幹擾。
本發明鑑於上述現有技術中存在的問題,目的在於提供一種能夠 在圖像識別中消除或減少誤檢測、降低誤檢率的方法、以及使用該方法的圖像識別裝置。
為了解決上述技術問題,本發明提供一種圖像識別方法,用於降低圖像識別中的誤檢率,其特徵在於,包括:圖像取得步驟,取得待識別圖像;預識別步驟,對上述待識別圖像進行預識別,取得被預識別為包含目標物體的多個圖像塊;明顯特徵過濾步驟,用上述目標物體的明顯特徵對上述被識別為包含目標物體的多個圖像塊進行過濾,提取出誤識別可能性大的多個圖像塊;圖像塊分組步驟,基於圖像塊的位置、大小和像素特徵對上述誤識別可能性大的多個圖像塊進行分組,將位置、大小和像素特徵大致相同的圖像塊歸為一組,得到多個圖像塊組;圖像塊組選擇步驟,計算各上述圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組;光流計算步驟,對上述圖像塊的個數多於規定閾值的多個圖像塊組中的每個圖像塊進行光流計算,提取出沒有光流變化的多個圖像塊;背景計算步驟,將沒有光流變化的各個圖像塊與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊;和反例學習步驟,將所得到的上述誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的識別中剔除誤識別圖像塊,得到包含上述目標物體的圖像塊作為識別結果。
本發明的圖像識別方法也可以包括:圖像取得步驟,取得待識別圖像;預識別步驟,對上述待識別圖像進行預識別,取得被預識別為包含目標物體的多個圖像塊;明顯特徵過濾步驟,用上述目標物體的明顯特徵對上述被識別為包含目標物體的多個圖像塊進行過濾,提取出誤識別可能性大的多個圖像塊;圖像塊分組步驟,基於圖像塊的位置、大小和像素特徵對上述誤識別可能性大的多個圖像塊進行分組,將位置、大小和像素特徵大致相同的圖像塊歸為一組,得到多個圖像塊組;圖像塊組選擇步驟,計算各上述圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組;光流計算步驟,從上述圖像塊的個數多於規定閾值的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表進行光流計算,提取出沒有光流變化的多個圖像塊組;背景計算步驟,從沒有光流變化的多個圖像 塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊;和反例學習步驟,將所得到的上述誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的識別中剔除誤識別圖像塊,得到包含上述目標物體的圖像塊作為識別結果。
在上述圖像識別方法中,上述圖像塊分組步驟包括:位置大小分組步驟,基於圖像塊的位置、大小對上述誤識別可能性大的多個圖像塊進行分組,將位置、大小大致相同的圖像塊歸為一組,得到多個圖像塊組;和像素分組步驟,將上述位置大小分組步驟中分類得到的多個圖像塊組基於像素特徵進行進一步分組,將像素特徵大致相同的圖像塊歸為一組,得到位置、大小和像素特徵大致相同的多個圖像塊組。
在上述圖像識別方法中,在上述背景計算步驟與反例學習步驟之間還包括用戶確認步驟,將上述背景計算步驟中得到的上述誤識別圖像塊顯示在圖形用戶界面上由用戶進行確認,得到用戶確認後的誤識別圖像塊。
在上述圖像識別方法中,上述明顯特徵過濾步驟中,用下式進行過濾:
E=ω0C+ΣωiCLi
當E<TE時提取出該圖像塊,式中,E為誤識別可能評價值,C為圖像塊的確信度,CLi為明顯特徵、局部特徵的確信度,ω為權值;TE為設定的閾值。上述像素分組步驟中,判斷像素特徵大致相同採用如下公式:
if│Gn(i,j)–Gn+1(i,j)│T0,d(i,j)=1;
Σd(i,j)/(H*W)<T1
式中,Gn(i,j)為某個圖像塊的像素(i,j)的灰度值;Gn+1(i,j)為上述位置大小分組步驟中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值;d為對每一像素是否相近進行判斷後的相近評價值;T0為灰度不同的閾值。
在上述圖像識別方法中,上述像素分組步驟中,判斷像素特徵大致相同採用如下公式:
if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;
if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;
if│Bn(i,j)–Bn+1(i,j)│TR0,dr(i,j)=1;
if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;
if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1
Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)T2
式中,Gn(i,j)為某個圖像塊的像素(i,j)的灰度值;Gn+1(i,j)為上述位置大小分組步驟中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值;T1、T2為閾值,T1的範圍在0~1之間,T2的範圍在-1~1之間。
在上述圖像識別方法中,上述光流計算步驟中,光流的計算採用如下公式:
式中I為亮度,Vx為x軸上的速度,Vy為y軸上的速度。
為了解決上述技術問題,本發明提供一種圖像識別裝置,其特徵在於,包括:圖像取得單元,其取得待識別圖像;預識別單元,其對上述待識別圖像進行預識別,取得被預識別為包含目標物體的多個圖像塊;明顯特徵過濾單元,其用明顯特徵對上述被預識別為包含目標物體的多個圖像塊進行過濾,提取出誤識別可能性大的多個圖像塊;圖像塊分組單元,其基於圖像塊的位置、大小和像素特徵對上述誤識 別可能性大的多個圖像塊進行分組,將位置、大小和像素特徵大致相同的圖像塊歸為一組,得到多個圖像塊組;圖像塊組選擇單元,其計算各上述圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組;光流計算單元,其對上述圖像塊的個數多於規定閾值的多個圖像塊組中的每個圖像塊進行光流計算,提取出沒有光流變化的多個圖像塊;背景計算單元,其將沒有光流變化的各個圖像塊與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊;和反例學習單元,其將所得到的上述誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的正式識別中剔除誤識別圖像塊,得到包含上述目標物體的圖像塊作為識別結果。
本發明的圖像識別裝置也可以包括:圖像取得單元,其取得待識別圖像;預識別單元,其對上述待識別圖像進行預識別,取得被預識別為包含目標物體的多個圖像塊;明顯特徵過濾單元,其用明顯特徵對上述被預識別為包含目標物體的多個圖像塊進行過濾,提取出誤識別可能性大的多個圖像塊;圖像塊分組單元,其基於圖像塊的位置、大小和像素特徵對上述誤識別可能性大的多個圖像塊進行分組,將位置、大小和像素特徵大致相同的圖像塊歸為一組,得到多個圖像塊組;圖像塊組選擇單元,其計算各上述圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組;光流計算單元,其從上述圖像塊的個數多於規定閾值的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表進行光流計算,提取出沒有光流變化的多個圖像塊組;背景計算單元,其從沒有光流變化的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊;和反例學習單元,其將所得到的上述誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的正式識別中剔除誤識別圖像塊,得到包含上述目標物體的圖像塊作為識別結果。
在圖像識別裝置中,上述圖像塊分組單元包括:位置大小分組單元,其基於圖像塊的位置、大小對上述誤識別可能性大的多個圖像塊進行分組,將位置、大小大致相同的圖像塊歸為一組,得到多個圖像 塊組;和像素分組單元,其將由上述位置大小分組單元分類得到的多個圖像塊組基於像素進行進一步分組,將像素特徵大致相同的圖像塊歸為一組,得到位置、大小和像素特徵大致相同的多個圖像塊組。
在圖像識別裝置中,還包括用戶確認單元,將由上述背景計算單元得到的上述誤識別圖像塊顯示在圖形用戶界面上由用戶進行確認,得到用戶確認後的誤識別圖像塊。
在圖像識別裝置中,上述明顯特徵過濾單元用下式進行過濾:
E=ω0C+ΣωiCLi
當E<TE時提取出該圖像塊,式中,E為誤識別可能評價值,C為圖像塊的確信度,CLi為明顯特徵、局部特徵的確信度,ω為權值;TE為設定的閾值。
在圖像識別裝置中,上述像素分組單元判斷像素特徵大致相同採用如下公式:
if│Gn(i,j)–Gn+1(i,j)│T0,d(i,j)=1;
Σd(i,j)/(H*W)<T1
式中,Gn(i,j)為某個圖像塊的像素(i,j)的灰度值;Gn+1(i,j)為上述位置大小分組步驟中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值;d為對每一像素是否相近進行判斷後的相近評價值;T0為灰度不同的閾值。
在圖像識別裝置中,上述像素分組單元判斷像素特徵大致相同採用如下公式:
if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;
if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;
if│Bn(i,j)–Bn+1(i,j)│TR0,dr(i,j)=1;
if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;
if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1
Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)T2
式中,Gn(i,j)為某個圖像塊的像素(i,j)的灰度值;Gn+1(i,j)為上述位置大小分組步驟中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值;T1、T2為閾值,T1的範圍在0~1之間,T2的範圍在-1~1之間。
在圖像識別裝置中,上述光流計算單元計算光流採用如下公式:
式中I為亮度,Vx為x軸上的速度,Vy為y軸上的速度。
(發明效果)
根據本發明,能夠在現有的圖像識別中提取誤檢測的圖像塊進行反例學習,從而消除或減少同類型的誤檢測,能夠提供一種能夠在圖像識別中消除或減少誤檢測、降低誤檢率的方法、以及使用該方法的圖像識別裝置。
附圖說明
圖1是本發明的實施方式1的功能框圖。
圖2是本發明的實施方式1的流程圖。
圖3是本發明的實施方式2的功能框圖。
圖4是本發明的實施方式2的流程圖。
圖5是本發明的實施方式3的功能框圖。
圖6是本發明的實施方式3的流程圖。
圖7是用於例示誤檢測的圖。
具體實施方式
下面參照附圖對本發明的實施方式和實施例進行具體說明,圖中相同的標號表示相同的元件或功能模塊。本發明不受下述具體的實施方式和實施例限制。
首先對本發明的實施方式1進行詳細說明。
圖1是本發明的實施方式1的功能框圖。
圖1中,11為圖像取得單元,用於取得待識別圖像。此處所說的圖像,包括靜態圖像和視頻等動態圖像。
12為預識別單元,將由圖像取得單元11取得的待識別圖像用多尺度滑動窗口掃描進行預識別,取得被預識別為目標物體的多個圖像塊。預識別能夠用現有的圖像識別裝置進行。
13為明顯特徵過濾單元,用圖像塊的明顯特徵對被預識別為目標物體的多個圖像塊進行過濾,排除明顯不可能為誤識別的圖像塊,提取出誤識別可能性大的多個圖像塊。
14為圖像塊分組單元,基於位置、大小和像素特徵對誤識別可能性大的多個圖像塊進行分組,將位置、大小和像素大致相同的圖像塊歸為一組,得到多個圖像塊組。圖像塊分組單元14可以包括位置大小分組單元15和像素分組單元16。
位置大小分組單元15基於圖像塊的位置、大小對誤識別可能性大的多個圖像塊進行分組,將位置、大小大致相同的圖像塊歸為一組,得到多個圖像塊組。本說明書中的大致相同定義為量化差別不超過一定閾值。
像素分組單元16將由位置大小分組單元分類得到的多個圖像塊組基於像素特徵進行進一步分組,將像素特徵大致相同的圖像塊歸為一組,得到位置、大小和像素特徵大致相同的多個圖像塊組。
20為圖像塊組選擇單元,計算各圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組。這個閾值用戶是可以修改的,默認值例如為5。
17為光流計算單元,對圖像塊的個數多於規定閾值的多個圖像塊組中的每個圖像塊進行光流計算,提取出沒有光流變化的多個圖像塊組。
18為背景計算單元,將沒有光流變化的各個圖像塊與該圖像塊所對應的局部背景作比較,搜索得到與背景大致相同的圖像塊作為誤識別圖像塊。
19為反例學習單元,將所得到的誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的正式識別中剔除誤識別圖像塊,得到包含目標物體的圖像塊作為識別結果。
下面對實施方式1的具體流程進行說明。
實施方式1的流程步驟如圖2所示。
首先,在圖像取得步驟21中,由圖像取得單元11取得待識別圖像。此處所說的圖像,包括靜態圖像和視頻等動態圖像。接著在預識別步驟22中,將由圖像取得單元11取得的待識別圖像劃分為多個圖像塊並進行預識別,取得被預識別為目標物體的多個圖像塊。圖像塊的劃分基於一定的規則,一般要使得到的各圖像塊中均包含能夠表徵所述待識別圖像中的待識別目標的特徵的像素點。圖像塊通常為矩形,該矩形為能夠框住待識別目標的最小矩形。當然矩形只是一例,不一定必須為矩形,只要能夠框住帶識別目標,可以為任意形狀。圖像取得和預識別能夠用現有的裝置和方法來進行。
接著,在明顯特徵過濾步驟23中,用明顯特徵對被預識別為目標物體的多個圖像塊進行過濾,排除明顯不可能為誤識別的圖像塊,提取出誤識別可能性大的多個圖像塊。明顯特徵為待識別物體所具有的明顯的特徵,例如包括人臉的顏色、紋理、人臉的局部特徵,車的紋理、輪廓、局部特徵等。在過濾的時候,進行誤識別判斷的閾值優選設置得比較寬泛以避免誤過濾,儘量把具有誤識別可能的圖像塊提取出來。經過明顯特徵過濾步驟23過濾後提取出的具有誤識別可能的圖像塊的集合,是誤識別可能性比較大的集合。
在明顯特徵過濾步驟23中,例如可以採用如下算法進行計算從而提取出誤識別可能性大的圖像塊。
E=ω0C+ΣωiCLi
當E<TE時提取出該圖像塊,式中,E為誤識別可能評價值,C為圖像塊的確信度,CLi為明顯特徵、局部特徵各項的確信度,ω為權值,TE為設定的閾值。在這裡確信度為PAC算法的錯誤分類概率相反值或者 為神經網絡實際算出的接近目標標籤的值等。
接著在圖像塊分組步驟24中,基於圖像塊的位置、大小和像素特徵對誤識別可能性大的多個圖像塊進行分組,將位置、大小和像素特徵大致相同的圖像塊歸為一組,得到多個圖像塊組。圖像塊分組步驟24例如可以分為位置大小分組步驟25和像素分組步驟26來進行。
在位置大小分組步驟25中,基於圖像塊的位置、大小對誤識別可能性大的多個圖像塊進行分組,將位置、大小大致相同的圖像塊歸為一組,得到多個圖像塊組。本說明書中的大致相同定義為量化差別不超過一定閾值。其中,先搜索位置、尺寸大致相同的圖像塊。此處所說的圖像塊的位置、尺寸大致相同,是指定義一定的閾值,只要圖像塊的位置、大小尺寸在閾值的範圍內,就判斷為位置、尺寸大致相同。例如(例子中的數字為舉例的數字),對從一個攝像頭採集的待識別物體記錄進行預識別之後的圖像塊的集合中,存在500個位置為(10,30,50,60)的圖像塊,本例中,圖像塊為矩形。其中10,30為圖像塊的左上角的橫坐標、縱坐標。50,60為圖像塊的右下角的橫坐標、縱坐標。這500個圖像塊的矩形的坐標可以略有差異,只要不超過規定的閾值,就認為它們是大小尺寸基本上相同的圖像塊。當然,這只是一例,對從該攝像頭採集的待識別物體記錄進行預識別之後的圖像塊的集合中還可能存在其他位置、尺寸大致相同的圖像塊。
然後,對搜索出的位置、尺寸大致相同的圖像塊進行分組。也就是說,同組的圖像塊,位置、尺寸大致相同;不同組的圖像塊,大致的位置、尺寸不同。
接著在像素分組步驟26,將位置大小分組步驟中分類得到的多個圖像塊組基於像素進行進一步分組,將像素特徵大致相同的圖像塊歸為一組,得到位置、大小和像素特徵大致相同的多個圖像塊組。其中,先在位置大小分組步驟25中劃分的組中,搜索像素特徵大致相同的圖像塊。然後,對搜索出的像素大致相同的圖像塊進行分組。也就是說,同組的圖像塊,像素特徵大致相同;不同組的圖像塊,像素特徵大致不同。
判斷像素特徵大致相同例如可以採用如下公式:
if│Gn(i,j)–Gn+1(i,j)│T0,d(i,j)=1;
Σd(i,j)/(H*W)<T1
在式中,Gn(i,j)為某個圖像塊的像素(i,j)的灰度值;Gn+1(i,j)為位置大小分組步驟25中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值;d為對每一像素是否相近進行判斷後的相近評價值;T0為灰度不同的閾值;T1為像素大致相同的閾值;H、W為圖像塊的高和寬。此處,作為相近評價值d的設置,可以讓用戶進行選擇。作為預設的默認值,可以選擇最大值的黃金分割比來作為默認值。
此外,還可以採用如下方式來搜索像素特徵大致相同的項目。
if│Rn(i,j)–Rn+1(i,j)│<TR0,dr(i,j)=0;
if│Gn(i,j)–Gn+1(i,j)│<TG0,dg(i,j)=0;
if│Bn(i,j)–Bn+1(i,j)│TR0,dr(i,j)=1;
if│Gn(i,j)–Gn+1(i,j)│>TG0,dg(i,j)=1;
if│Bn(i,j)–Bn+1(i,j)│>TB0,db(i,j)=1
Σdr(i,j)+Σdg(i,j)+Σdb(i,j)/3*(H*W)T2
式中Gn(i,j)為某個圖像塊的像素(i,j)的灰度值,Gn+1(i,j)為位置大小分組步驟25中分出的位置大小大致相同的組中的下一個圖像塊的像素(i,j)的灰度值。T1、T2為閾值。T1的範圍在0~1之間,T2的範圍在-1~1之間。
經過位置大小分組步驟25和像素分組步驟26,圖像塊被分為位置、大小和像素大致相同的各個組。由此,具有重複性的圖像塊被合併。
接著在圖像塊組選擇步驟30中,計算各圖像塊組中的圖像塊的個數,選擇出圖像塊的個數多於規定閾值的多個圖像塊組。這個閾值用戶是可以修改的,默認值例如為5。這是因為圖像塊的個數低於閾值的圖像塊組基本上不可能存在誤檢測的可能性,不是我們需要進行處理的對象。
接著在光流計算步驟27中,對圖像塊組選擇步驟30中得到的多個圖像塊組中的每個圖像塊進行光流計算,從中搜索得到沒有光流變化的多個圖像塊。搜索沒有光流的圖像塊,也就是說搜索沒有動作的各項。光流的計算採用如下方程式進行運算。
式中I為亮度,Vx為x軸上的速度,Vy為y軸上的速度。利用光的變化,計算出待識別物體的速度。
接著,在背景計算步驟28中,將沒有光流變化的各個圖像塊與該圖像塊所對應的局部背景作比較,搜索得到與背景大致相同的圖像塊作為誤識別圖像塊。在這裡大致相同為上面的像素相似性公式來進行計算判斷,當像素的相似性在某閾值範圍內時就認為大致相同。在背景運算是可以採取差分法進行背景的運算,也可以採用混合高斯模型來進行背景的運算。例如對於檢測目標為汽車的誤識別檢測系統,進行背景計算的幀圖像選擇最長時間,這樣是為了剔除把停滯車輛也作為誤檢測的情況。同樣也可以在明顯特徵過濾步驟23中通過局部特徵的模式識別、顏色紋理模式識別等的方式,剔除把停滯車輛也作為誤檢測的情況。
經過以上運算,得到了誤識別圖像塊。
接著在反例學習步驟29中,將所得到的誤識別圖像塊的特徵作為圖像識別的反例進行反例學習,在之後進行的識別中剔除誤識別圖像塊,得到包含目標物體的圖像塊作為識別結果。學習的方法可以採用SVM、深度學習的方式,學習出作為反例的誤識別模型。在學習中將採用誤識別的輪廓、紋理、顏色等作為特徵進行模型學習。然後用學習出的模型,作為反例進行模式識別,防止出現再次誤識別。
接著對本發明的實施方式2進行詳細說明。對實施方式2與實施方式1相同的部件標註相同標號並省略說明。
圖3是本發明的實施方式2的功能框圖。如圖3所示,本實施方式2與實施方式1相比,不同點在於,用光流計算單元17』替代光流計算單元17,用背景計算單元18』替代背景計算單元18。
其中,光流計算單元17』從圖像塊的個數多於規定閾值的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表進行光流計算,提取出沒有光流變化的多個圖像塊組。
背景計算單元18』從沒有光流變化的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊。
實施方式2的流程步驟如圖4所示。
如圖4所示,本實施方式2的流程與實施方式1大致相同,不同點在於,用光流計算步驟27』替代光流計算步驟27,用背景計算步驟28』替代背景計算步驟28。
其中,光流計算步驟27』中,從圖像塊的個數多於規定閾值的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表進行光流計算,提取出沒有光流變化的多個圖像塊組。
背景計算步驟28』中,從沒有光流變化的多個圖像塊組的每個圖像塊組中任選一個圖像塊作為該圖像塊組的代表與該圖像塊所對應的局部背景作比較,提取出與背景大致相同的圖像塊作為誤識別圖像塊。
在本實施方式2中,光流計算步驟和背景計算步驟中不對圖像塊組中的所有圖像塊進行計算,而是選取一個作為代表來進行計算。這是因為,經過圖像塊分組步驟24得到的圖像塊組中的每個圖像塊,其位置、大小和像素特徵是大致相同的,所以可以任取一個作為代表來進行計算,由此能夠大幅減少計算量。
但是需要注意的是,如果只選一個進行計算,在某些情況下、例如圖像塊分組步驟24中的閾值設置過寬的情況下有可能發生漏檢。即如果圖像塊分組步驟24中的閾值設置過寬,則圖像塊分組步驟24中得到的圖像塊組中的各個圖像塊有可能並不滿足實際要求的大致相同的標準。在這種情況下,也可以選擇多個圖像塊作為代表,在最極端 的情況下選擇所有圖像塊進行計算,則實際上與實施方式1相同。
接著對本發明的實施方式3進行詳細說明。對實施方式3與實施方式1相同的部件標註相同標號並省略說明。
圖5是本發明的實施方式3的功能框圖。如圖5所示,本實施方式3與實施方式1相比,追加了用戶確認單元50,將由背景計算單元18得到的誤識別圖像塊顯示在圖形用戶界面(GUI)上由用戶進行確認,得到用戶確認後的誤識別圖像塊。
實施方式3的流程步驟如圖6所示。
如圖6所示,本實施方式3的流程與實施方式1大致相同,不同點在於,在背景計算步驟28與反例學習步驟29之間追加了用戶確認步驟60,將背景計算步驟28中得到的誤識別圖像塊顯示在圖形用戶界面(GUI)上由用戶進行確認,得到用戶確認後的誤識別圖像塊。眾所周知,人眼在圖像識別上有著先天的優勢,經過人工確認的誤識別圖像塊能夠取得更好的準確性。本實施方式3是在實施方式1的基礎上追加了用戶確認步驟,當然也可以在實施方式2的基礎上追加用戶確認步驟,能夠獲得與本實施方式3相同的技術效果。
以上所述僅是本發明的優選的實施方式,應當指出,對於本領域的技術人員來說,在不脫離本發明原理和基礎的前提下,還可以做出若干改進、潤飾、更換步驟組合等,這些改進、潤飾、更換步驟組合等也應該是本發明的保護範圍。
本領域技術人員應明白,本發明能夠提供為方法、系統、或電腦程式產品。本發明能夠完全由硬體實現、完全由軟體實現、或結合軟體和硬體來實現。而且,本發明能夠採用在一個或多個包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限於磁碟存儲器、CD-ROM、光學存儲器等)上實施的電腦程式產品的形式。
本發明是根據本發明具體實施方式的方法、系統、或電腦程式產品的流程圖和/或方框圖來描述的。應理解能夠由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。能夠將這些電腦程式指令提供給通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理 器以實現一個通過計算機或其他可編程數據處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也能夠存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也能夠裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
工業上的可利用性
本發明的圖像識別方法和圖像識別裝置,將取得的待識別圖像劃分為多個圖像塊並進行預識別後,基於位置、大小和像素特徵對誤識別可能性大的多個圖像塊進行分組並進一步進行光流計算和背景計算,由此得到誤識別圖像塊用於反例學習,從而消除或減少同類型的誤檢測,在圖像識別領域是極為有用的。