新四季網

用於從圖像中提取目標文檔部分的方法、設備和介質與流程

2024-04-12 13:34:05



1.本公開的實施例總體涉及圖像處理領域,並且更具體地涉及一種用於從圖像中提取目標文檔部分的方法、設備和介質。


背景技術:

2.在用諸如相機之類的圖像捕捉設備來捕捉文檔的圖像時,所捕捉到的圖像中通常會包括關於該文檔的文檔部分以及關於放置該文檔的周圍環境(例如桌面)的背景部分,並且這些圖像通常還可包括陰影(例如,周圍環境的影子等)、扭曲、邊緣模糊或光線陰暗等各種失真,從而對於從該圖像中準確地提取出文檔部分造成了很大幹擾。目前,通常需要用戶手動地從這樣的圖像中提取所需的文檔部分,但是這樣效率過低,而且由於前面提到的各種失真,使得用戶很難準確地找出目標文檔在這樣的圖像中的精確邊框,因此很難準確地提取出完全沒有背景部分的目標文檔。並且,用戶通常在提取出相應的目標文檔之後,才能對其進行失真處理,從而導致處理效率的進一步降低。
3.因此,有必要提供一種自動從圖像中提取目標文檔部分的技術,以能夠準確並高效地從圖像中提取出清晰可用的文檔部分。


技術實現要素:

4.針對上述問題,本公開提供了一種用於從圖像中提取目標文檔部分的方法、設備和介質,使得能夠準確並高效地從圖像中提取出清晰可用的文檔部分。
5.根據本公開的第一方面,提供了一種用於從圖像中提取目標文檔部分的方法,包括:獲取待處理圖像,所述待處理圖像具有目標文檔部分和背景部分;對所述待處理圖像進行二值化處理,以便對經二值化處理的待處理圖像分別進行第一濾波處理以及第二濾波處理,以分別得到第一圖像和第二圖像,其中第一圖像比第二圖像具有更少的噪聲,第二圖像比第一圖像具有更高的銳度;基於第一圖像,確定目標文檔部分的四個角點的坐標;以及基於所確定的四個角點的坐標,從第二圖像中提取目標文檔部分。
6.根據本公開的第二方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本公開的第一方面的方法。
7.在本公開的第三方面中,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其特徵在於,所述計算機指令用於使所述計算機本公開的第一方面的方法。
8.應當理解,本部分所描述的內容並非旨在標識本公開的實施例的關鍵或重要特徵,也不用於限制本公開的範圍。本公開的其它特徵將通過以下的說明書而變得容易理解。
附圖說明
9.結合附圖並參考以下詳細說明,本公開各實施例的上述和其他特徵、優點及方面
將變得更加明顯。在附圖中,相同或相似的附圖標註表示相同或相似的元素。
10.圖1示出了用於實現根據本公開的實施例的用於從圖像中提取目標文檔部分的方法的示例性系統100的示意圖。
11.圖2示出了根據本公開的實施例的用於從圖像中提取目標文檔部分的方法200的流程圖。
12.圖3示出了根據本公開的實施例的用於基於經第一濾波處理得到的第一圖像確定目標文檔部分的四個角點的坐標的方法300的流程圖。
13.圖4示出了根據本公開的實施例的用於從經第二濾波處理得到的第二圖像中提取目標文檔部分的方法400的流程圖。
14.圖5示出了根據本公開的實施例的用於確定經傾斜校正的目標文檔部分的四個角點的坐標的方法500的流程圖。
15.圖6a示出了根據本公開的實施例的經二值化處理的示例性待處理圖像的示意圖;
16.圖6b示出了根據本公開的實施例的示例性第三圖像的示意圖。
17.圖6c示出了根據本公開的實施例的示例性第四圖像的示意圖。
18.圖6d示出了根據本公共的實施例的最終提取出的目標文檔部分的示意圖。
19.圖7示出了根據本公開的實施例的電子設備700的框圖。
具體實施方式
20.下面將參照附圖更詳細地描述本發明的優選實施方式。雖然附圖中顯示了本發明的優選實施方式,然而應該理解,可以以各種形式實現本發明而不應被這裡闡述的實施方式所限制。相反,提供這些實施方式是為了使本發明更加透徹和完整,並且能夠將本發明的範圍完整的傳達給本領域的技術人員。
21.在下文的描述中,出於說明各種發明的實施例的目的闡述了某些具體細節以提供對各種發明實施例的透徹理解。但是,相關領域技術人員將認識到可在無這些具體細節中的一個或多個細節的情況來實踐實施例。在其它情形下,與本技術相關聯的熟知的裝置、結構和技術可能並未詳細地示出或描述從而避免不必要地混淆實施例的描述。
22.除非語境有其它需要,在整個說明書和權利要求中,詞語「包括」和其變型,諸如「包含」和「具有」應被理解為開放的、包含的含義,即應解釋為「包括,但不限於」。
23.在整個說明書中對「一個實施例」或「一些實施例」的提及表示結合實施例所描述的特定特點、結構或特徵包括於至少一個實施例中。因此,在整個說明書的各個位置「在一個實施例中」或「在一些實施例」中的出現不一定全都指相同實施例。另外,特定特點、結構或特徵可在一個或多個實施例中以任何方式組合。
24.此外,說明書和權利要求中所用的第一、第二、第三、第四等術語,僅僅出於描述清楚起見來區分各個對象,而並不限定其所描述的對象的大小或其他順序等。
25.如上所述,在通過諸如相機之類的圖像捕捉設備來捕捉文檔的圖像時,所捕捉到的圖像中通常會包括關於該文檔的文檔部分以及關於放置該文檔的周圍環境(例如桌面)的背景部分,並且這些圖像通常還可包括陰影(例如,周圍環境的影子等)、扭曲、邊緣模糊或光線陰暗等各種失真,從而對於從該圖像中準確地提取出文檔部分造成了很大幹擾。目前一般由用戶手動從這樣的圖像中提取所需的文檔部分,但是這樣效率過低,而且由於前
面提到的各種失真,使得用戶很難準確地找出目標文檔在這樣的圖像中的精確邊框,因此很難準確地提取出完全沒有背景部分的目標文檔。並且,用戶通常會在提取出相應的目標文檔之後,才對其進行失真處理,從而導致處理效率的進一步降低。
26.為了至少部分地解決上述問題以及其他潛在問題中的一個或者多個,本公開的示例實施例提出了一種用於從圖像中提取目標文檔部分的方法,包括:獲取待處理圖像,所述待處理圖像具有目標文檔部分和背景部分;對所述待處理圖像進行二值化處理,以便對經二值化處理的待處理圖像分別進行第一濾波處理以及第二濾波處理,以分別得到第一圖像和第二圖像,其中第一圖像比第二圖像具有更少的噪聲,第二圖像比第一圖像具有更高的銳度;基於第一圖像,確定目標文檔部分的四個角點的坐標;以及基於所確定的四個角點的坐標,從第二圖像中提取目標文檔部分。以此方式,能夠準確並高效地從圖像中提取出清晰可用的目標文檔部分。
27.在下文中,將結合附圖更詳細地描述本方案的具體示例。
28.圖1示出了用於實現根據本公開的實施例的用於從圖像中提取目標文檔部分的方法的示例性系統100的示意圖。如圖1中所示,系統100包括計算設備110、網絡120和伺服器130。計算設備110和伺服器130可以通過網絡120(例如,網際網路)進行數據交互。在本公開中,伺服器130可提供用於向計算設備110提供待處理圖像的服務。計算設備110可經由網絡120與伺服器130進行通信,以實現從所獲取的待處理圖像中提取目標文檔部分。計算設備110可以包括至少一個處理器112以及與該至少一個處理器112耦合的至少一個存儲器114,該存儲器114中存儲有可由該至少一個處理器112執行的指令116,該指令116在被該至少一個處理器112執行時執行如下所述的方法200。注意,在本文中,計算設備110可以是伺服器130的一部分或者可以獨立於伺服器130。當然,在一些實施例中,也可不包括伺服器130和網絡120,而可由用戶直接將待處理圖像加載或轉存到計算設備110中,以由計算設備110從該待處理圖像中提取目標文檔部分。計算設備110或伺服器130的具體結構例如可以如下結合圖7所述。
29.圖2示出了根據本公開的實施例的用於從圖像中提取目標文檔部分的方法200的流程圖。方法200可由如圖1所示的計算設備110執行,也可以在圖7所示的電子設備700處執行。應當理解的是,方法200還可以包括未示出的附加框和/或可以省略所示出的框,本公開的範圍在此方面不受限制。
30.在步驟202,獲取待處理圖像,該待處理圖像具有目標文檔部分和背景部分。
31.在本公開中,待處理圖像可以是用諸如相機之類的圖像捕捉設備對文檔進行捕捉所獲得的圖像。
32.待處理圖像中包括所捕捉到的關於該文檔的目標文檔部分以及所捕捉到的關於該文檔所處的周圍環境(例如桌面)的背景部分。
33.本公開的目的是要從這樣的待處理圖像中提取出其中的信息可識別的目標文檔部分。
34.在一些實施例中,在對待處理圖像進行其他處理之前,可先判斷該待處理圖像是否可用,主要是判斷該待處理圖像是否由於存在過大的陰影而不可用。如果待處理圖像中存在過大的陰影(即陰影密集),那麼在從該待處理圖像中提取出了目標文檔部分之後,將由於這樣的陰影而導致無法有效地從該目標文檔部分中識別出文字之類的內容信息。在一
些實現中,為了判斷待處理圖像是否由於存在過大的陰影而不可用,可先生成該待處理圖像的灰度直方圖。然後,基於該灰度直方圖,確定該待處理圖像中灰度值小於或等於預定值(例如49)的像素佔該待處理圖像的所有像素的比例是否大於或等於預定閾值(例如24%)。響應於確定該比例大於該預定閾值,則確定該待處理圖像由於存在過大的陰影而不可用,否則確定該待處理圖像可用,從而可進行後續的處理。
35.在步驟204,對該待處理圖像進行二值化處理,以便對經二值化處理的待處理圖像(例如,如圖6a所示)分別進行第一濾波處理以及第二濾波處理,以分別得到第一圖像和第二圖像。在本公開中,經第一濾波處理得到的第一圖像比經第二濾波處理得到的第二圖像具有更少的噪聲,但是第二圖像比第二圖像具有更高的銳度。
36.在本公開中,通過對待處理圖像進行二值化處理可有助於提高後續的處理速度。
37.在一些實施例中,對待處理圖像進行二值化處理可包括以下步驟。
38.首先,將待處理圖像轉換為灰度圖。在本公開中,將待處理圖像轉換為灰度圖將有利於提高後續處理的速度。
39.然後,對該灰度圖進行模糊判斷,以確定該灰度圖是否足夠清晰。在一些實現中,對灰度圖進行模糊判斷可包括:對該灰度圖與預先設置的拉普拉斯卷積核進行乘法運算,以得到相應的響應圖。在本公開中,預先設置的拉普拉斯卷積核可例如為3*3的卷積核,其例如為在得到了響應圖後,可計算該響應圖的方差。如果該方差小於預定閾值,則確定待處理文檔圖像模糊,否則確定待處理文檔圖像足夠清晰。該預定閾值可以是例如該待處理圖像中所有像素的灰度值的中值。
40.如果經過模糊判斷確定該灰度圖足夠清晰,則可基於該灰度圖對該待處理圖像進行二值化,例如可使用自適應閾值算法來實現該二值化。例如,可先使用二值化閾值算法來確定該灰度圖的閾值,然後將該灰度圖中灰度值大於所確定的閾值的像素的灰度值設為1,並將該灰度圖中灰度值小於所確定的閾值的像素的灰度值設為0,從而實現了對該灰度圖的二值化處理。
41.目前還沒有一種濾波處理可以同時兼顧圖像的噪聲和銳度兩者,因此在本公開中,通過在確定目標文檔部分的四個角點的坐標時以及在提取目標文檔部分時分別使用對同一待處理圖像進行不同的濾波處理得到的兩個不同的圖像,可以有效地保證所確定的坐標的準確性,又可以保證提取到的目標文檔部分的清晰性。如上所述,在步驟204中,第一圖像是對經二值化處理的待處理圖像進行第一濾波處理得到的,而第二圖像是對經二值化處理的待處理圖像進行第二濾波處理得到的,並且第一圖像比第二圖像具有更少的噪聲,但是第二圖像比第二圖像具有更高的銳度。一方面,由於第一圖像比第二圖像具有更少的噪聲,因此在後續處理中通過記錄第一圖像來確定目標文檔部分的四個角點的坐標有助於提高識別到的四個角點的準確性。另一方面,由於第二圖像比第一圖像具有更高的銳度,因此第二圖像中所包含的內容信息(例如文字)更銳化,而沒有陰影,從而從第二圖像中提取目標文檔部分,將有助於得到質量更好的文檔部分,使得有利於後續更好地從所得到的文檔圖像中識別出諸如文字之類的有用內容信息。
42.在一些實施例中,第一濾波處理可以為例如中值濾波,並且第二濾波處理可以為例如雙邊濾波。中值濾波主要是將圖像(例如,前面提到的灰度圖)分割成多個圖像塊(例
如,分割成的每一圖像塊的大小為5*5個像素),然後將各個圖像塊中的每一個像素的像素值均替換為該圖像塊的中值像素值,即該中值像素值為該5*5的圖像塊中的所有像素的像素值之中的中值。通過中值濾波,可以有效地去除待處理圖像中的大部分噪聲,因此使用經中值濾波得到的第一圖像來確定目標文檔部分的四個角點的坐標可有效地確保所確定的四個角點的坐標的準確性。但是,中值濾波在去除噪聲的同時,也會使得圖像中包括的有用內容(例如,文檔部分中的文字)變得模糊,因此如果從該第一圖像中提取目標文檔部分,將導致所得到的目標文檔部分中的有用信息不夠清晰。
43.雙邊濾波可消除圖像中陰影,使得圖像中的內容信息(例如,文字)銳化,但是仍有一些其他噪聲無法去除,因此使用經雙邊濾波得到的第二圖像來提取目標文檔部分,將有助於提高所得到的目標文檔部分中的有用信息的清晰度。
44.在步驟206,基於第一圖像,確定目標文檔部分的四個角點的坐標。
45.如前所述,由於第一圖像中所包括的噪聲更少,因此基於第一圖像確定目標文檔目標的四個角點的坐標可確保所確定的坐標的準確性。
46.下面將結合圖3對步驟206作進一步更詳細的描述。
47.在步驟208,基於所確定的四個角點的坐標,從第二圖像中提取目標文檔部分。
48.由於第二圖像與第一圖像一樣,均是通過對同一待處理圖像進行處理來得到的,因此基於第一圖像所確定的目標文檔部分的四個角點的坐標實際上也就是目標文檔部分在第二圖像中的四個角點的坐標,因此基於在步驟206確定的坐標,可以準確地從第二圖像中提取出所需的目標文檔部分。
49.而且,如前所述,由於第二圖像的銳度相對更高,因此從第二圖像中提取出的目標文檔部分相對於第一圖像而言可以更清晰。
50.下面將基於圖4對步驟208作進一步更詳細的描述。
51.圖3示出了根據本公開的實施例的用於基於經第一濾波處理得到的第一圖像確定目標文檔部分的四個角點的坐標的方法300的流程圖。方法300可由如圖1所示的計算設備110執行,也可以在圖7所示的電子設備700處執行。應當理解的是,方法300還可以包括未示出的附加框和/或可以省略所示出的框,本公開的範圍在此方面不受限制。
52.在步驟302,基於第一圖像,確定目標文檔部分的傾斜度。
53.該第一圖像就是前面在步驟204得到的第一圖像。
54.在一些實施例中,基於第一圖像,確定目標文檔部分的傾斜度可包括在第一圖像中檢測直線,以便通過確定檢測出的直線中的橫向直線相對於第一圖像的水平邊框的傾斜角來確定目標文檔部分的傾斜度。在另一些實施例中,確定目標文檔部分的傾斜度可包括在第一圖像中檢測直線,以便通過確定檢測出的直線中的縱向直線相對於第一圖像的垂直邊框的傾斜角來確定目標文檔部分的傾斜度。
55.在以上實施例中,在第一圖像中檢查直線可例如使用霍夫變換算法來實現。
56.在步驟304,基於在步驟302中確定的傾斜度對第一圖像進行旋轉,以得到具有經傾斜校正的目標文檔部分的第三圖像。
57.在確定了目標文檔部分的傾斜度之後,通過對第一圖像旋轉相應的角度就可使得目標文檔部分的傾斜得到校正,由此得到的第三圖像具有經傾斜校正的目標文檔部分。例如,圖6b中示出了第三圖像的一個示例。根據圖6b所述,該第三圖像中的目標文檔部分已經
得到的傾斜校正,並且其中的噪聲較小,但是文字部分並不是特別清晰。
58.在步驟306,對第三圖像進行邊緣檢測,以初步確定經傾斜校正的目標文檔部分的四條邊框線。
59.在一些實施例中,可例如使用canny邊緣檢測算法來對第三圖像進行邊緣檢測。
60.在本公開中,為了進一步消除噪聲,以便提高後續處理中所確定的目標文檔部分的角點坐標的準確性,在步驟306之後還可對第三圖像再進行一次濾波(例如,均值濾波,該均值濾波的濾波核可以為例如5*5),然後進行兩次膨脹和腐蝕操作。
61.在步驟308,對第三圖像進行連通區域分析,以便基於從第三圖像中確定的多個連通區域以及初步確定的四條邊框線,確定經傾斜校正的目標文檔部分的四個角點的坐標。
62.在本公開中,通過對第三圖像進行連通區域分析,可從第三圖像中確定多個連通區域。在本公開中,至少基於這些連通區域,就可確定經傾斜校正的目標文檔部分的四個角點的坐標。
63.下面將結合圖5對步驟308作進一步更詳細的描述。
64.通過採用上述手段,本公開能夠準確並高效地確定目標文檔部分的位置。
65.圖4示出了根據本公開的實施例的用於從經第二濾波處理得到的第二圖像中提取目標文檔部分的方法400的流程圖。方法400可由如圖1所示的計算設備110執行,也可以在圖7所示的電子設備700處執行。應當理解的是,方法400還可以包括未示出的附加框和/或可以省略所示出的框,本公開的範圍在此方面不受限制。
66.在步驟402,基於在步驟302確定的傾斜度對第二圖像進行旋轉,以得到具有經傾斜校正的目標文檔部分的第四圖像。
67.該第二圖像為前面在步驟204得到的第二圖像。
68.圖6c中示出了第四圖像的一個示例。根據圖6c所述,該第四圖像中的目標文檔部分已經得到的傾斜校正,並且其中的文字相對於第三圖像而言更為清晰,但是該第四圖像中的噪聲相對於第三圖像而言更大。
69.由於在步驟402中對第二圖像進行了與在步驟304中對第一圖像進行的相同的處理,因此經傾斜校正的目標文檔部分在由此得到的第三圖像和第四圖像中的位置實際上是相同的。因此,利用在步驟308相對於第三圖像確定的經傾斜校正的目標文檔部分的坐標,就可知道經傾斜校正的目標文檔部分在第四圖像中的坐標,由此基於這些坐標就可有助於實現從第四圖像中對經傾斜校正的目標文檔部分的提取。
70.在步驟404,基於所確定的四個角點的坐標,確定經傾斜校正的目標文檔部分在第四圖像中的邊框。
71.具體地,通過用直線將第四圖像中的相應坐標點按順序連接,就可得到經傾斜校正的目標文檔部分在第四圖像中的邊框。
72.在步驟406,利用透視變換,基於所確定的邊框以及所述第四圖像本身的邊框,對第四圖像進行仿射變換,以從第四圖像中提取出僅包括經傾斜校正的目標文檔部分的圖像,並將所提取的圖像放大為水平寬度等於第四圖像的最小外接矩形的水平寬度。
73.在本公開中,通過仿射變換從第四圖像中提取出的圖像是已經去除了背景部分的圖像,也就是說該圖像中僅包括經傾斜校正的目標文檔部分。另外,在本公開中,通過該仿射變換,所提取的圖像的四個邊會被等比例拉伸,從而使得該圖像的水平寬度等於第四圖
像的最小外接矩形的水平寬度。
74.例如圖6d示出了最終提取的目標文檔部分的圖像。
75.通過採用上述手段,本公開能夠得到所需的清晰的目標文檔部分的圖像。
76.圖5示出了根據本公開的實施例的用於確定經傾斜校正的目標文檔部分的四個角點的坐標的方法500的流程圖。方法500可由如圖1所示的計算設備110執行,也可以在圖7所示的電子設備700處執行。應當理解的是,方法500還可以包括未示出的附加框和/或可以省略所示出的框,本公開的範圍在此方面不受限制。
77.在步驟502,確定多個連通區域中的最大連通區域的面積與第三圖像(即,在步驟304得到的第三圖像)的面積之比是否大於預定的第一比例。
78.步驟502中提到的多個連通區域就是如以上在步驟308中提到的對第三圖像進行連通區域分析所確定的多個連通區域。這些連通區域可按面積的大小進行排序,從而可確定這些連通區域的面積最大的連通區域,即最大連通區域。
79.在本公開中,該預定的第一比例可例如通過進行多次識別統計來確定,其可例如為1/2或2/3等。
80.一方面,在步驟504,如果最大連通區域的面積與第三圖像的面積之比大於該預定的第一比例,則確定該最大連通區域的最小外接矩形的四個角點的坐標。
81.在步驟506,如果該最大連通區域的最小外接矩形的四個角點中的至少一個角點位於該最大連通區域之外,則使用該最大連通區域內與該角點距離最近的點來替換該角點。
82.應了解,如果該最大連通區域的最小外接矩形的四個角點中有兩個或兩個以上的角點都位於該最大連通區域之外,則對於這些角點中的每一角點均可進行步驟506中提到的操作。
83.在步驟508,將最終得到的四個點的坐標作為經傾斜校正的目標文檔部分的四個角點的坐標。
84.相反,如果最大連通區域的最小外接矩形的四個角點均位於最大連通區域之內,則不執行步驟506和508,而直接將該最大連通區域的最小外接矩形的四個角點的坐標作為經傾斜校正的目標文檔部分的四個角點的坐標。
85.另一方面,在步驟510,如果多個連通區域(即通過對第三圖像進行連通區域分析所得到的多個連通區域)中的最大連通區域的面積與第三圖像的面積之比小於預定的第一比例,對該多個連通區域進行拼接,以得到經拼接的連通區域。
86.在本公開中,在對以上多個連通區域進行拼接之前,還可先對第三圖像進行兩次膨脹和腐蝕操作,以便進一步去除第三圖像中的噪聲,使得後續的處理更準確。
87.在一些實施例中,對多個連通區域進行拼接包括以下步驟。首先,確定多個連通區域(即通過對第三圖像進行連通區域分析所得到的多個連通區域)中最小外接矩形的水平寬度小於該最大連通區域的最小外接矩形的水平寬度的預定第二比例的一個或多個連通區域。在本公開中,該預定的第二比例可例如為1/2等。由於面積過小的連通區域(即前面提到的最小外接矩形的水平寬度小於該最大連通區域的最小外接矩形的水平寬度的預定第二比例的連通區域)可能是圖像中的某些噪音所引起的連通區域,其通常會對目標文檔部分的坐標的確定的準確度會有影響,因此在本公開中需要先找出這樣的小連通區域並將其
剔除。但是,有一種特殊情況是,這些小連通區域中可能包括涉及標題的連通區域,如果將涉及標題的連通區域也一併剔除,則將使得相應標題被排除在外,因此使得最後提取的文檔部分也不準確。應了解,標題通常位於文章頂部(例如文檔標題)或者文章內部(例如章節標題)。經分析發現,章節標題之類的位於文章內部的標題通常將與其他文字一起被合併成一個較大的連通區域,因此在本公開並不會造成對位於文章內部的標題的連通區域的誤剔除。但是,對於文檔標題之類的位於文章頂部的標題,由於針對這種位於文章頂部的標題所得到相應連通區域通常較小,因此很容易在剔除小連通區域時,很容易將其一起剔除,因此在剔除之前需要對這樣的連通區域進行相應的判斷。由於與位於文章頂部的標題相關聯的連通區域通常在相應圖像的上半部,因此這種判斷是可以實現的。具體地,如果所確定的一個或多個連通區域(即最小外接矩形的水平寬度小於該最大連通區域的最小外接矩形的水平寬度的預定第二比例的一個或多個連通區域)中的一個連通區域位於該第三圖像的上半部分,則對該連通區域進行光學字符識別(即ocr識別),以確定該連通區域中是否包含標題。
88.一方面,響應於確定該連通區域中包含標題,則確定該連通區域的左上角點和右下角點的坐標。同時,還需確定多個連通區域(即通過對第三圖像進行連通區域分析所得到的多個連通區域)中除所確定的一個或多個連通區域(即前面確定的最小外接矩形的水平寬度小於該最大連通區域的最小外接矩形的水平寬度的預定第二比例的一個或多個連通區域)之外的每一個其他連通區域的四個角點的坐標。隨後,可基於所確定的每一個其他連通區域的四個角點的坐標、包含標題的連通區域的左上角點和右下角點的坐標、以及初步確定的四條邊框線(即前面在步驟306中確定的四條邊框線),確定經拼接的連通區域的四個角點的坐標。具體地,可將所確定的每一個其他連通區域的四個角點的坐標以及包含標題的連通區域的左上角點和右下角點的坐標之中最靠近初步確定的四條邊框線的四個點的坐標確定為經拼接的連通區域的四個角點的坐標。例如,可將以上提到的各個坐標中相對而言最靠近初步確定的四條邊框線中上邊框線和左邊框線的坐標作為經拼接的連通區域的左上角點,將以上提到的各個坐標中相對而言最靠近初步確定的四條邊框線中上邊框線和右邊框線的坐標作為經拼接的連通區域的右上角點,並以此類推,最終確定經拼接的連通區域的四個角點的坐標。
89.另一方面,響應於確定該連通區域中不包含標題,則去除所確定的一個或多個連通區域(即前面確定的最小外接矩形的水平寬度小於該最大連通區域的最小外接矩形的水平寬度的預定第二比例的一個或多個連通區域)。同時還需確定多個連通區域中剩下的每一個連通區域的最小外接矩形的四個角點的坐標。隨後,可基於剩下的每一個連通區域的最小外接矩形的四個角點的坐標以及初步確定的四條邊框線(即前面在步驟306中確定的四條邊框線),確定經拼接的連通區域的四個角點的坐標。具體地,可將剩下的每一個連通區域的最小外接矩形的四個角點的坐標之中最靠近初步確定的四條邊框線的四個點的坐標確定為經拼接的連通區域的四個角點的坐標。例如,可將以上提到的各個坐標中相對而言最靠近初步確定的四條邊框線中上邊框線和左邊框線的坐標作為經拼接的連通區域的左上角點,將以上提到的各個坐標中相對而言最靠近初步確定的四條邊框線中上邊框線和右邊框線的坐標作為經拼接的連通區域的右上角點,並以此類推,最終確定經拼接的連通區域的四個角點的坐標。
90.在步驟512,基於經拼接的連通區域,確定所述經傾斜校正的目標文檔部分的四個角點的坐標。
91.經拼接的連通區域的四個角點在按順序相連後所得到的形狀通常為梯形,因此為了防止該梯形頂部區域過小,需要對其頂部兩個角點的坐標進行判斷,如果這兩個坐標距離小於聯通區域最大寬度時,則將頂部坐標替換為最大聯通區域頂部坐標。具體地,如果經拼接的連通區域的四個角點中的左上角點和右上角點之間的距離小於最大連通區域的最小外接矩形的水平寬度,則分別用最大連通區域的最小外接矩形的左上角點和右上角點的坐標替換該經拼接的連通區域的四個角點中的左上角點和右上角點的坐標作為最終確定的目標文檔部分的左上角點和右上角點的坐標。
92.圖7示出了可以用來實施本公開內容的實施例的示例電子設備700的示意性框圖。例如,如圖1所示的計算設備110可以由電子設備700來實施。如圖所示,電子設備700包括中央處理單元(cpu)701,其可以根據存儲在只讀存儲器(rom)702中的電腦程式指令或者從存儲單元708加載到隨機存取存儲器(ram)703中的電腦程式指令,來執行各種適當的動作和處理。在隨機存取存儲器703中,還可存儲電子設備700操作所需的各種程序和數據。中央處理單元701、只讀存儲器702以及隨機存取存儲器703通過總線704彼此相連。輸入/輸出(i/o)接口705也連接至總線704。
93.電子設備700中的多個部件連接至輸入/輸出接口705,包括:輸入單元706,例如鍵盤、滑鼠、麥克風等;輸出單元707,例如各種類型的顯示器、揚聲器等;存儲單元708,例如磁碟、光碟等;以及通信單元709,例如網卡、數據機、無線通信收發機等。通信單元709允許設備700通過諸如網際網路的計算機網絡和/或各種電信網絡與其他設備交換信息/數據。
94.上文所描述的各個過程和處理,例如方法200-500,可由中央處理單元701執行。例如,在一些實施例中,方法200-500可被實現為計算機軟體程序,其被有形地包含於機器可讀介質,例如存儲單元708。在一些實施例中,電腦程式的部分或者全部可以經由只讀存儲器702和/或通信單元709而被載入和/或安裝到設備700上。當電腦程式被加載到隨機存取存儲器703並由中央處理單元701執行時,可以執行上文描述的方法200-500的一個或多個動作。
95.本公開涉及方法、裝置、系統、電子設備、計算機可讀存儲介質和/或電腦程式產品。電腦程式產品可以包括用於執行本公開的各個方面的計算機可讀程序指令。
96.計算機可讀存儲介質可以是可以保持和存儲由指令執行設備使用的指令的有形設備。計算機可讀存儲介質例如可以是――但不限於――電存儲設備、磁存儲設備、光存儲設備、電磁存儲設備、半導體存儲設備或者上述的任意合適的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:可攜式計算機盤、硬碟、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或快閃記憶體)、靜態隨機存取存儲器(sram)、可攜式壓縮盤只讀存儲器(cd-rom)、數字多功能盤(dvd)、記憶棒、軟盤、機械編碼設備、例如其上存儲有指令的打孔卡或凹槽內凸起結構、以及上述的任意合適的組合。這裡所使用的計算機可讀存儲介質不被解釋為瞬時信號本身,諸如無線電波或者其他自由傳播的電磁波、通過波導或其他傳輸媒介傳播的電磁波(例如,通過光纖電纜的光脈衝)、或者通過電線傳輸的電信號。
97.這裡所描述的計算機可讀程序指令可以從計算機可讀存儲介質下載到各個計算/
處理設備,或者通過網絡、例如網際網路、區域網、廣域網和/或無線網下載到外部計算機或外部存儲設備。網絡可以包括銅傳輸電纜、光纖傳輸、無線傳輸、路由器、防火牆、交換機、網關計算機和/或邊緣計算設備。每個計算/處理設備中的網絡適配卡或者網絡接口從網絡接收計算機可讀程序指令,並轉發該計算機可讀程序指令,以供存儲在各個計算/處理設備中的計算機可讀存儲介質中。
98.用於執行本公開操作的電腦程式指令可以是彙編指令、指令集架構(isa)指令、機器指令、機器相關指令、微代碼、固件指令、狀態設置數據、或者以一種或多種程式語言的任意組合編寫的原始碼或目標代碼,所述程式語言包括面向對象的程式語言—諸如smalltalk、c++等,以及常規的過程式程式語言—諸如「c」語言或類似的程式語言。計算機可讀程序指令可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟體包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或伺服器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡—包括區域網(lan)或廣域網(wan)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用網際網路服務提供商來通過網際網路連接)。在一些實施例中,通過利用計算機可讀程序指令的狀態信息來個性化定製電子電路,例如可編程邏輯電路、現場可編程門陣列(fpga)或可編程邏輯陣列(pla),該電子電路可以執行計算機可讀程序指令,從而實現本公開的各個方面。
99.這裡參照根據本公開實施例的方法、裝置(系統)和電腦程式產品的流程圖和/或框圖描述了本公開的各個方面。應當理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機可讀程序指令實現。
100.這些計算機可讀程序指令可以提供給通用計算機、專用計算機或其它可編程數據處理裝置的處理單元,從而生產出一種機器,使得這些指令在通過計算機或其它可編程數據處理裝置的處理單元執行時,產生了實現流程圖和/或框圖中的一個或多個方框中規定的功能/動作的裝置。也可以把這些計算機可讀程序指令存儲在計算機可讀存儲介質中,這些指令使得計算機、可編程數據處理裝置和/或其他設備以特定方式工作,從而,存儲有指令的計算機可讀介質則包括一個製造品,其包括實現流程圖和/或框圖中的一個或多個方框中規定的功能/動作的各個方面的指令。
101.也可以把計算機可讀程序指令加載到計算機、其它可編程數據處理裝置、或其它設備上,使得在計算機、其它可編程數據處理裝置或其它設備上執行一系列操作步驟,以產生計算機實現的過程,從而使得在計算機、其它可編程數據處理裝置、或其它設備上執行的指令實現流程圖和/或框圖中的一個或多個方框中規定的功能/動作。
102.附圖中的流程圖和框圖顯示了根據本公開的多個實施例的系統、方法和電腦程式產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或指令的一部分,所述模塊、程序段或指令的一部分包含一個或多個用於實現規定的邏輯功能的可執行指令。在有些作為替換的實現中,方框中所標註的功能也可以以不同於附圖中所標註的順序發生。例如,兩個連續的方框實際上可以基本並行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或動作的專用的基於硬體的系統來實現,或者可以用專用硬體與計算機指令的組合來實現。
103.以上已經描述了本公開的各實施例,上述說明是示例性的,並非窮盡性的,並且也不限於所披露的各實施例。在不偏離所說明的各實施例的範圍和精神的情況下,對於本技術領域的普通技術人員來說許多修改和變更都是顯而易見的。本文中所用術語的選擇,旨在最好地解釋各實施例的原理、實際應用或對市場中的技術改進,或者使本技術領域的其它普通技術人員能理解本文披露的各實施例。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀