一種自動切分電子化筆記本中手寫條目的方法
2023-09-22 11:16:00
專利名稱:一種自動切分電子化筆記本中手寫條目的方法
技術領域:
本發明屬於電子計算機技術領域,涉及一種自動切分電子化筆記本中手寫條目的方法。
背景技術:
在日常生活中,人們經常需要拍攝紙質文檔,保存成JPEG格式的照片,或者生成PDF格式的文檔,從而實現紙質文檔的電子化,方便管理。智慧型手機就是常用的將紙質文檔電子化的工具之一。因為智慧型手機上一般都帶有攝像頭,利用手機上的攝像頭可以拍攝紙質文檔,並將拍攝得到的電子文檔進行一定的圖像處理後再轉換成JPEG格式的照片,或者生成PDF格式的文檔。具備上述功能的應用軟體也已經比較普及了,如蘋果應用商店和google應用商店中的應用CamScanner。這些應用軟體可以從拍攝的圖像中自動監測出所拍攝文檔的四條邊,以此為基準切除圖像中文檔區域外面的背景,並對文檔區域進行校正和圖像增強等處理,獲得一個類似於用掃描儀掃描得到的整潔乾淨的電子化文檔的效果,以用戶指定的格式進行保存和管理。常見的需要進行電子化的紙質文檔是紙件筆記本頁面,長期以來人們經常用紙件筆記本來做各種記錄,如會議記錄,備忘事項記錄等等,一本紙件筆記本中會有幾十甚至上百頁紙,而且同一類型的筆記本,其所有用來記錄的紙頁的樣式一般是統一的。在實際使用中,用戶經常需要在筆記本上用手寫方式記錄下一個個的條目,比如說一個用戶在筆記本頁面上分成3行寫下周末可能的活動選項1、逛街,2、看電影,3、去公園;拍攝了這個筆記本頁面的圖像進行電子化以後,用戶在這3個選項中做出了決定,選擇2、看電影,他需要把這個決定保存到待辦事項中去就需要在電子設備中再輸入一次文字,這就很不方便。理想的做法是用戶只要在電子設備上顯示出來的這個筆記本頁面的電子化文檔中點擊一下「2、看電影」,筆跡所在的區域就自動把包含「2、看電影」筆跡的圖像區域切分出來,加入到待辦事項裡面去。很多的筆記本都會印上分行線,用戶手寫的時候手寫筆跡經常會與預先印製的分行線重疊,有些筆記本甚至會在頁面上印上背景圖案,這些都會給獲得用戶點擊的位置以後自動從圖像中切分出「2、看電影」這個手寫筆跡所在的圖像區域帶來幹擾,造成切分不準。
發明內容
鑑於以上所述現有技術的缺點,本發明的目的在於提供一種自動切分電子化筆記本中手寫條目的方法,用於解決現有技術中無法自動提取電子文檔中特定位置的內容的問題。為實現上述目的及其他相關目的,本發明提供一種自動切分電子化筆記本中手寫條目的方法。一種自動切分電子化筆記本中手寫條目的方法,所述自動切分電子化筆記本中手寫條目的方法包括
拍攝需要電子化的筆記本的紙質頁面圖像;通過圖像中的直線檢測方法確定所述紙質頁面圖像的四條邊緣線,並將四條邊緣線所限定的頁面區域校正為方形區域;根據所述紙質頁面圖像確定所述紙質頁面的類型,獲得預先保存的所述類型筆記本的紙質頁面空白切分模板,所述空白切分模板由若干文字塊組成;確定所述方形區域中用戶手寫筆跡所在的文字塊,以文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。優選地,所述紙質頁面的類型由該紙質頁面的大小和格式決定;所述紙質頁面的格式包括紙質頁面包括的文字塊的數目、大小、間隔。優選地,所述文字塊能夠與相鄰的文字塊合併,以合併後的文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。優選地,在所述紙質頁面的類型為預先已知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為人工指定所述紙質頁面的類型。優選地,在所述紙質頁面的類型為預先已知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為在所述紙質頁面上的固定位置處印刷有一類型標記;檢測所述紙質頁面圖像上的類型標記,將該檢測到的類型標記與預先已知的類型標記進行一一比較,找出所述紙質頁面所屬的類型。優選地,在所述紙質頁面的類型為預先不知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為創建新的紙質頁面的類型,輸入該未知的紙質頁面的大小和格式。如上所述,本發明所述的自動切分電子化筆記本中手寫條目的方法,具有以下有益效果本發明通過在對筆記本的紙質頁面進行電子化的時候,用預先保存的空白切分模板輔助來獲取並分割紙質頁面上的用戶手寫的文字,因為所述空白切分模板由若干個文字塊組成,所以每個文字塊均可以作為切分頁面上字跡的單位,從而獲得包含了內容完整的手寫條目,實現了電子化文檔內容的自動切分和提取。
圖1顯示為本發明所述的自動切分電子化筆記本中手寫條目的方法的流程示意圖。
具體實施例方式以下通過特定的具體實例說明本發明的實施方式,本領域技術人員可由本說明書所揭露的內容輕易地了解本發明的其他優點與功效。本發明還可以通過另外不同的具體實施方式
加以實施或應用,本說明書中的各項細節也可以基於不同觀點與應用,在沒有背離本發明的精神下進行各種修飾或改變。請參閱附圖。需要說明的是,本實施例中所提供的圖示僅以示意方式說明本發明的基本構想,遂圖式中僅顯示與本發明中有關的組件而非按照實際實施時的組件數目、形狀及尺寸繪製,其實際實施時各組件的型態、數量及比例可為一種隨意的改變,且其組件布局型態也可能更為複雜。 下面結合實施例和附圖對本發明進行詳細說明。實施例一本實施例提供一種自動切分電子化筆記本中手寫條目的方法,如圖1所示,所述自動切分電子化筆記本中手寫條目的方法包括拍攝需要電子化的筆記本的紙質頁面圖像。本實施例中,所述需要電子化的筆記本的紙質頁面可以為任意類型,如該紙質頁面上印刷有分類標識區域、頁碼區域、標題區域、分行線、或/和分列線等等,也可以是上述各項的任意方式組合。通過圖像中的直線檢測方法確定所述紙質頁面圖像的四條邊緣線,並將四條邊緣線所限定的頁面區域校正為方形區域。具體地,通過圖像中的直線檢測方法獲取代表紙質頁面圖像中的四條頁面外邊緣的直線,切除掉圖像中這四條頁面外邊緣直線限定的範圍以外的背景區域,並以這四條頁面外邊緣直線為基準對拍攝的紙質頁面圖像進行校正,把這四條頁面外邊緣直線所限定的頁面區域校正成長方形區域。根據所述紙質頁面圖像確定所述紙質頁面的類型,獲得預先保存的所述類型筆記本的紙質頁面空白切分模板,所述空白切分模板由若干文字塊組成。本實施例中,所述紙質頁面的類型由該紙質頁面的大小和格式決定;所述紙質頁面的格式包括紙質頁面包括的文字塊的數目、文字塊的大小、以及相鄰文字塊之間的間隔。也就是說,所述紙質頁面可以由任意形狀的塊區域組成,每個塊區域即為一個文字塊。該文字塊正好可以完整地分割紙質頁面上的用戶手寫筆跡。本發明中所拍攝的筆記本的紙質頁面圖像屬於現有CamScanner等應用軟體事先已經保存的頁面類型,因此能夠參照預先保存的該類型的紙質頁面的空白切分模板來獲取用戶手寫筆跡所在的圖像區域(即一個文字塊或合併後的多個文字塊所在的區域),顯然準確性會大大提高。確定所述方形區域中用戶手寫筆跡所在的文字塊,以文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。其中,所述文字塊也能夠與相鄰的文字塊合併,即可以以合併後的文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。在校正後的筆記本紙質頁面圖像中,參照所述預先保存的該筆記本紙質頁面的空白切分模板,確定筆記本頁面中的用戶手寫筆跡在空白切分模板中的位置,並把用戶的手寫筆跡切分成代表了不同的文字行的文字塊。通過本發明所述的方法,用戶可以通過簡單的操作人工把臨近的代表了構成完整含義的多個文字塊的區域合併成一個。這些切分出來的代表了構成完整含義的文字塊中的內容可以用來加入到電子設備中的代辦事項的列表中,也可以利用現有的手寫識別技術來識別出其中的文字來,省去用戶在電子設備上手工輸入文字的麻煩。本發明通過在對筆記本頁面進行電子化的時候,用預先保存的空白切分模板中文字塊輔助來獲取並分割用戶手寫的文字區域,得到包含了內容完整的手寫條目的圖像塊(也稱文字塊),從而方便紙質頁面的分區電子化,及電子化後的文檔的使用和管理。也就是說,本發明通過在對筆記本的紙質頁面進行電子化的時候,用預先保存的空白切分模板輔助來獲取並分割紙質頁面上的用戶手寫的文字,因為所述空白切分模板由若干個文字塊組成,所以每個文字塊均可以作為切分頁面上字跡的單位,從而獲得包含了內容完整的手寫條目,實現了電子化文檔內容的自動切分和提取。實施例二本實施例提供一種自動切分電子化筆記本中手寫條目的方法,其與實施例一所述的自動切分電子化筆記本中手寫條目的方法的區別在於預先已知所述紙質頁面的類型,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為人工指定所述紙質頁面的類型;即用戶在拍攝圖像之前,或者拍攝圖像之後處理圖像之前,人工指定筆記本的紙質頁面所屬的類型,比如從預先保存在camScanner等應用軟體中的一系列筆記本頁面類型中選擇一個。實施例三本實施例提供一種自動切分電子化筆記本中手寫條目的方法,其與實施例一和二所述的自動切分電子化筆記本中手寫條目的方法的區別在於預先已知所述紙質頁面的類型,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為在所述紙質頁面上的固定位置處印刷有一類型標記;所述類型標記可以為文字、符號、圖形或者任意兩項或三項的結合。檢測所述紙質頁面圖像上的類型標記,將該檢測到的類型標記與預先已知的類型標記進行一一比較,找出所述紙質頁面所屬的類型。在所述紙質頁面上的固定位置處印刷有一類型標記;即預先在筆記本的每一張紙質頁面的指定位置印刷上一個預先設計好的標記(即類型標記),在拍攝獲取了筆記本的紙質頁面的圖像以後,先在圖像中檢測出筆記本的紙質頁面的四條外邊緣,以該四條外邊緣為參照在紙質頁面的圖像中確定所述標記的大致位置,從而實現所述標記在圖像中的檢測,然後把檢測到的標記跟預先保存的代表多個不同類型的筆記本的紙質頁面的標記進行一一比較,找出所拍攝的筆記本的紙質頁面所屬的類型。將檢測到的標記跟預先保存的代表多個不同類型的筆記本紙質頁面的標記進行一一比較,找出所拍攝的筆記本的紙質頁面所屬的類型,這一步驟涉及手寫識別,文字識另IJ,圖像匹配等本領域中的成熟技術,在此不作贅述。實施例四本實施例提供一種自動切分電子化筆記本中手寫條目的方法,其與實施例一所述的自動切分電子化筆記本中手寫條目的方法的區別在於預先不知所述紙質頁面的類型,在此種情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為創建新的紙質頁面的類型,輸入該未知的紙質頁面的大小和格式。即如果所拍攝的筆記本的紙質頁面不屬於CamScanner等應用軟體事先已知的印刷了加粗或/和加長的分行線、或/和分列線、或/和標題區域的紙質頁面的類型,則在後續的步驟中先將該未知的紙質頁面的類型添加到新創建的紙質頁面的類型中後,再進行後續的處理。本發明通過在對筆記本的紙質頁面進行電子化的時候,用預先保存的空白切分模板輔助來獲取並分割紙質頁面上的用戶手寫的文字,因為所述空白切分模板由若干個文字塊組成,所以每個文字塊均可以作為切分頁面上字跡的單位,從而獲得包含了內容完整的手寫條目,實現了電子化文檔內容的自動切分和提取。綜上所述,本發明有效克服了現有技術中的種種缺點而具高度產業利用價值。上述實施例僅例示性說明本發明的原理及其功效,而非用於限制本發明。任何熟悉此技術的人士皆可在不違背本發明的精神及範疇下,對上述實施例進行修飾或改變。因此,舉凡所屬技術領域中具有通常知識者在未脫離本發明所揭示的精神與技術思想下所完成的一切等效修飾或改變,仍應由本發明的權利要求所涵蓋。
權利要求
1.一種自動切分電子化筆記本中手寫條目的方法,其特徵在於,所述自動切分電子化筆記本中手寫條目的方法包括 拍攝需要電子化的筆記本的紙質頁面圖像; 通過圖像中的直線檢測方法確定所述紙質頁面圖像的四條邊緣線,並將四條邊緣線所限定的頁面區域校正為方形區域; 根據所述紙質頁面圖像確定所述紙質頁面的類型,獲得預先保存的所述類型筆記本的紙質頁面空白切分模板,所述空白切分模板由若干文字塊組成; 確定所述方形區域中用戶手寫筆跡所在的文字塊,以文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。
2.根據權利要求1所述的自動切分電子化筆記本中手寫條目的方法,其特徵在於所述紙質頁面的類型由該紙質頁面的大小和格式決定;所述紙質頁面的格式包括紙質頁面包括的文字塊的數目、大小、間隔。
3.根據權利要求1所述的自動切分電子化筆記本中手寫條目的方法,其特徵在於所述文字塊能夠與相鄰的文字塊合併,以合併後的文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。
4.根據權利要求1所述的自動切分電子化筆記本中手寫條目的方法,其特徵在於在所述紙質頁面的類型為預先已知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為人工指定所述紙質頁面的類型。
5.根據權利要求1所述的自動切分電子化筆記本中手寫條目的方法,其特徵在於在所述紙質頁面的類型為預先已知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為 在所述紙質頁面上的固定位置處印刷有一類型標記; 檢測所述紙質頁面圖像上的類型標記,將該檢測到的類型標記與預先已知的類型標記進行一一比較,找出所述紙質頁面所屬的類型。
6.根據權利要求1所述的自動切分電子化筆記本中手寫條目的方法,其特徵在於在所述紙質頁面的類型為預先不知的情況下,根據所述紙質頁面圖像確定所述紙質頁面的類型的具體實現方式為 創建新的紙質頁面的類型,輸入該未知的紙質頁面的大小和格式。
全文摘要
本發明提供一種自動切分電子化筆記本中手寫條目的方法,該方法包括拍攝需要電子化的筆記本的紙質頁面圖像;通過圖像中的直線檢測方法確定紙質頁面圖像的四條邊緣線,並將四條邊緣線所限定的頁面區域校正為方形區域;根據紙質頁面圖像確定紙質頁面的類型,獲得預先保存的類型筆記本的紙質頁面空白切分模板,空白切分模板由若干文字塊組成;確定方形區域中用戶手寫筆跡所在的文字塊,以文字塊為單位自動切分提取處於任意一個文字塊中的用戶手寫筆跡。本發明用預先保存的空白切分模板輔助來獲取並分割電子化後的紙質頁面上的用戶字跡,而空白切分模板由若干個文字塊組成,所以每個文字塊均可作為切分單位,實現了電子化文檔內容的自動切分和提取。
文檔編號G06K9/32GK103020619SQ20121051716
公開日2013年4月3日 申請日期2012年12月5日 優先權日2012年12月5日
發明者陳青山, 羅希平 申請人:上海合合信息科技發展有限公司