新四季網

一種文字識別輸出方法及系統的製作方法

2023-04-25 00:01:36

一種文字識別輸出方法及系統的製作方法
【專利摘要】本發明公開了一種文字識別輸出方法系統,本發明中由手寫板終端完成對手寫文字的分段掃描,而由雲伺服器並行完成對掃描後分段掃描圖像的文字識別及合併,實現了在手寫板終端手寫輸入的同時進行文字識別,縮短了文字識別的處理時間,實時地完成了對手寫文稿的識別輸出;而且,由於雲伺服器相對於手寫板終端來講,功能更為強大,比如通過保存多個手寫板終端的歷史識別樣本庫,結合多種語言樣本庫,以及多段落語義識別,保證了文字識別正確率。
【專利說明】一種文字識別輸出方法及系統
【技術領域】
[0001]本發明涉及手寫體技術,尤指一種文字識別輸出方法及系統。
【背景技術】
[0002]目前,手寫體文字識別輸出包括聯機文字識別輸出和脫機文字識別輸出兩種。其中,聯機文字識別輸出是通過辨別文字書寫軌跡並結合用戶的選擇確認完成的文字識別輸出,脫機文字識別輸出則是通過光學掃描等形成圖像後,再通過計算機的文字識別完成的文字識別輸出。
[0003]對於聯機文字識別輸出,往往需要用戶逐字或者幾個字一起選擇確認,對於手寫文字來說,聯機書寫速度較慢。而脫機文字識別輸出則由於對樣本資料庫和處理能力的要求較高,因此,其對處理計算機的要求較高,而且通常處理時間較長,因此通常僅適用於非實時處理的大批量文稿。
[0004]如果用戶希望能夠在手寫板上流暢書寫中等大小篇幅的文字,比如一篇博客日記、一篇新聞稿等,同時,又希望能夠在書寫結束後實時得到標準印刷體文字輸出。這顯然需要文字識別輸出的處理時間短且識別正確率高,而現有聯機文字識別輸出或脫機文字識別輸出均無法同時滿足處理時間短且識別正確率高的要求。

【發明內容】

[0005]為了解決上述技術問題,本發明提供了一種文字識別輸出方法及系統,能夠縮短文字識別的處理時間,而且保證識別正確率。
[0006]為了達到本發明目的,本發明提供了一種文字識別輸出方法,包括:手寫板終端將輸入的文字信息進行分段並生成分段掃描圖像後發送給雲伺服器;
[0007]雲伺服器根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的文字並發送給手寫板終端顯示。
[0008]所述分段的大小根據手寫所用時長、掃描圖像傳輸時長和文字識別處理時長來決定。
[0009]在所述分段掃描圖像發送給雲伺服器之前,該方法還包括:
[0010]對每個所述分段順序進行編號,並為最後一個分段的分段掃描圖像的編號設置結束標識。
[0011]所述合併從各分段掃描圖像識別出的文字包括:
[0012]所述雲伺服器按照分段的編號,將識別出的印刷體文字順序排列,直到最後一個分段文字。
[0013]該方法還包括:
[0014]所述手寫板終端存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字;
[0015]所述雲伺服器存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
[0016]本發明還提供一種文字識別輸出系統,至少包括手寫板終端,雲伺服器,其中,
[0017]手寫板終端,用於接收手寫輸入,並將輸入的文字信息進行分段並分段掃描成圖像後發送給雲伺服器;顯示來自雲伺服器的文字信息;
[0018]雲伺服器,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的文字並發送給手寫板終端。
[0019]所述手寫板終端至少包括第一輸入模塊、第一處理模塊、第一輸出模塊,以及顯示模塊;其中,
[0020]第一輸入模塊,用於接收來自外部的手寫輸入;接收來自雲伺服器的印刷體文字;
[0021]第一處理模塊,用於將輸入的文字信息進行分段並分段掃描成圖像;
[0022]第一輸出模塊,用於將分段掃描成圖像輸出給雲伺服器;
[0023]顯示模塊,用於顯示雲伺服器返回的印刷體文字信息。
[0024]所述手寫板終端還包括第一存儲模塊,用於存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字。
[0025]所述雲伺服器至少包括第二輸入模塊、第二處理模塊,第二輸出模塊;其中,
[0026]第二輸入模塊,用於接收來自手寫板終端的分段掃描圖像;
[0027]第二處理模塊,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的印刷體文字;
[0028]第二輸出模塊,用於將識別出的印刷體文字輸出給手寫板終端。
[0029]所述雲伺服器還包括第二存儲模塊,用於存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
[0030]與現有技術相比,本發明文字識別方法中,由手寫板終端完成對手寫文字的分段掃描,而由雲伺服器並行完成對掃描後分段掃描圖像的文字識別及合併,實現了在手寫板終端手寫輸入的同時進行文字識別,縮短了文字識別的處理時間,實時地完成了對手寫文稿的識別輸出;而且,由於雲伺服器相對於手寫板終端來講,功能更為強大,比如通過保存多個手寫板終端的歷史識別樣本庫,結合多種語言樣本庫,以及多段落語義識別,進一步保證了文字識別正確率。
[0031]本發明的其它特徵和優點將在隨後的說明書中闡述,並且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點可通過在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。
【專利附圖】

【附圖說明】
[0032]附圖用來提供對本發明技術方案的進一步理解,並且構成說明書的一部分,與本申請的實施例一起用於解釋本發明的技術方案,並不構成對本發明技術方案的限制。
[0033]圖1為本發明文字識別輸出方法的流程圖;
[0034]圖2為本發明文字識別輸出系統的組成結構示意圖。
【具體實施方式】[0035]為使本發明的目的、技術方案和優點更加清楚明白,下文中將結合附圖對本發明的實施例進行詳細說明。需要說明的是,在不衝突的情況下,本申請中的實施例及實施例中的特徵可以相互任意組合。
[0036]在附圖的流程圖示出的步驟可以在諸如一組計算機可執行指令的計算機系統中執行。並且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同於此處的順序執行所示出或描述的步驟。
[0037]圖1為本發明文字識別輸出方法的流程圖,如圖1所示,包括:
[0038]步驟100:手寫板終端將輸入的文字信息進行分段並生成分段掃描圖像後發送給雲伺服器。
[0039]本步驟中,用戶在手寫板終端上輸入的手寫字,可包括多語言文字、數字、符號等。
[0040]本步驟中,分段的大小可以根據手寫所用時長、掃描圖像傳輸時長和文字識別處理時長來決定。特別地,對於某個分段,在手寫所用時長約等於分段的掃描圖像傳輸時長和文字識別處理時長之和時,系統處理時間最短。生成分段掃描圖像的具體實現屬於本領域技術人員的常用技術手段,這裡不再贅述。
[0041]進一步地,還包括對每個分段順序進行編號,並且在手寫文字完成全部輸入後,最後一個分段的掃描圖像的編號設置有結束(end)標識。
[0042]步驟101:雲伺服器根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別。
[0043]本步驟中,統計識別和結構識別方法是現有技術,本領域技術人員都知道,統計識別和結構識別是針對單個字的識別,因此本發明在此基礎上,加入語義識別,並結合多個樣本庫,比如多語言樣本庫、符號庫、數字庫、多手寫板終端的歷史樣本庫,對分段掃描圖像的文字識別,以實現結合句子的上下文語境、語義進行文字的進一步識別。語義識別的具體實現屬於本領域技術人員的慣用技術手段,這裡不再贅述。
[0044]步驟102:雲伺服器合併從各分段掃描圖像識別出的文字並發送給手寫板終端顯
/Jn ο
[0045]本步驟中,雲伺服器按照分段的編號,將識別出的印刷體文字順序排列,直到最後一個分段文字。
[0046]從本發明方法可見,本發明文字識別方法中,由手寫板終端完成對手寫文字的分段掃描,而由雲伺服器並行完成對掃描後分段掃描圖像的文字識別及合併,實現了在手寫板終端手寫輸入的同時進行文字識別,縮短了文字識別的處理時間,實時地完成了對手寫文稿的識別輸出;而且,由於雲伺服器相對於手寫板終端來講,功能更為強大,比如通過保存多個手寫板終端的歷史識別樣本庫,結合多種語言樣本庫,以及多段落語義識別,進一步保證了文字識別正確率。
[0047]本發明還包括:
[0048]手寫板終端存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字。
[0049]雲伺服器存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
[0050]需要說明的是,本申請提供的方法還可以與對印刷體文字的識別一同使用,對於如何區分手寫體及印刷體文字屬於現有技術。
[0051]圖2為本發明文字識別輸出系統的組成結構示意圖,如圖2所示,至少包括手寫板終端,雲伺服器,其中,
[0052]手寫板終端,用於接收手寫輸入,並將輸入的文字信息進行分段並分段掃描成圖像後發送給雲伺服器;顯示來自雲伺服器的文字信息;
[0053]雲伺服器,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的文字並發送給手寫板終端。
[0054]手寫板終端,還用於存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字。
[0055]雲伺服器,還用於存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
[0056]其中,手寫板終端至少包括第一輸入模塊、第一處理模塊、第一輸出模塊,以及顯示模塊;其中,
[0057]第一輸入模塊,用於接收來自外部的手寫輸入;接收來自雲伺服器的印刷體文字;
[0058]第一處理模塊,用於將輸入的文字信息進行分段並分段掃描成圖像;
[0059]第一輸出模塊,用於將分段掃描成圖像輸出給雲伺服器;
[0060]顯示模塊,用於顯示雲伺服器返回的印刷體文字信息;
[0061]手寫板終端還包括第一存儲模塊,用於存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字。
[0062]雲伺服器至少包括第二輸入模塊、第二處理模塊,第二輸出模塊;其中,
[0063]第二輸入模塊,用於接收來自手寫板終端的分段掃描圖像;
[0064]第二處理模塊,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的印刷體文字;
[0065]第二輸出模塊,用於將識別出的印刷體文字輸出給手寫板終端;
[0066]雲伺服器還包括第二存儲模塊,用於存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
[0067]雖然本發明所揭露的實施方式如上,但所述的內容僅為便於理解本發明而採用的實施方式,並非用以限定本發明。任何本發明所屬領域內的技術人員,在不脫離本發明所揭露的精神和範圍的前提下,可以在實施的形式及細節上進行任何的修改與變化,但本發明的專利保護範圍,仍須以所附的權利要求書所界定的範圍為準。
【權利要求】
1.一種文字識別輸出方法,其特徵在於,包括:手寫板終端將輸入的文字信息進行分段並生成分段掃描圖像後發送給雲伺服器; 雲伺服器根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的文字並發送給手寫板終端顯示。
2.根據權利要求1所述的文字識別輸出方法,其特徵在於,所述分段的大小根據手寫所用時長、掃描圖像傳輸時長和文字識別處理時長來決定。
3.根據權利要求1所述的文字識別輸出方法,其特徵在於,在所述分段掃描圖像發送給雲伺服器之前,該方法還包括: 對每個所述分段順序進行編號,並為最後一個分段的分段掃描圖像的編號設置結束標識。
4.根據權利要求3所述的文字識別輸出方法,其特徵在於,所述合併從各分段掃描圖像識別出的文字包括: 所述雲伺服器按照分 段的編號,將識別出的印刷體文字順序排列,直到最後一個分段文字。
5.根據權利要求1~4任一項所述的文字識別輸出方法,其特徵在於,該方法還包括: 所述手寫板終端存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字; 所述雲伺服器存儲來自手寫板終端的分段掃描圖像,和分段文字識別後的印刷體文字。
6.一種文字識別輸出系統,其特徵在於,至少包括手寫板終端,雲伺服器,其中, 手寫板終端,用於接收手寫輸入,並將輸入的文字信息進行分段並分段掃描成圖像後發送給雲伺服器;顯示來自雲伺服器的文字信息; 雲伺服器,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的文字並發送給手寫板終端。
7.根據權利要求6所述的文字識別輸出系統,其特徵在於,所述手寫板終端至少包括第一輸入模塊、第一處理模塊、第一輸出模塊,以及顯不模塊;其中, 第一輸入模塊,用於接收來自外部的手寫輸入;接收來自雲伺服器的印刷體文字; 第一處理模塊,用於將輸入的文字信息進行分段並分段掃描成圖像; 第一輸出模塊,用於將分段掃描成圖像輸出給雲伺服器; 顯示模塊,用於顯示雲伺服器返回的印刷體文字信息。
8.根據權利要求7所述的文字識別輸出系統,其特徵在於,所述手寫板終端還包括第一存儲模塊,用於存儲手寫輸入的文字,各分段掃描圖像和雲伺服器返回的印刷體文字。
9.根據權利要求6所述的文字識別輸出系統,其特徵在於,所述雲伺服器至少包括第二輸入模塊、第二處理模塊,第二輸出模塊;其中, 第二輸入模塊,用於接收來自手寫板終端的分段掃描圖像; 第二處理模塊,用於根據統計識別和結構識別方法,完成對分段掃描圖像的文字識別,合併從各分段掃描圖像識別出的印刷體文字; 第二輸出模塊,用於將識別出的印刷體文字輸出給手寫板終端。
10.根據權利要求9所述的文字識別輸出系統,其特徵在於,所述雲伺服器還包括第二存儲模塊,用於 存儲來自手 寫板終 端的分段掃描圖像,和分段文字識別後的印刷體文字。
【文檔編號】H04L29/06GK103559512SQ201310534918
【公開日】2014年2月5日 申請日期:2013年11月1日 優先權日:2013年11月1日
【發明者】馬書惠, 張雲勇, 房秉毅 申請人:中國聯合網絡通信集團有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀