新四季網

用於輸入漢字的方法和系統的製作方法

2023-08-07 22:48:31

專利名稱:用於輸入漢字的方法和系統的製作方法
技術領域:
本發明總體上涉及計算機數據輸入,具體而言,涉及用於向計算機輸入漢字的方法和系統。術語漢字習慣於包含主要用於臺灣的繁體漢字以及主要用於中國大陸的簡體漢字。
背景技術:
從引入計算機那時到現在,由於用來構造字符的唯一形狀數量相當大,故而向計算機中輸入漢字始終並且將繼續成為難題。近幾年來,已經開發出很多方法來解決此問題,但是沒有方法設法同時解決要求容易使用和效率高之間的矛盾。本發明是在現有技術的基礎上、在容易使用和效率方面同時做出改進的方法。
現有技術中的漢字輸入法通常落入兩大類之一拼音或者合成,以及一些混合。本發明屬於基於合成方法的類別。此分類中的方法指定鍵盤按鍵來表示用於構造漢字的字符部首。例如英文字的按鍵序列因此表示一系列漢字部首。可以將這種序列與序列庫相比,匹配的序列將對應於特定的漢字。
合成法的優勢在於它類似於漢字書寫的方式,並且因此使用自然。然而,主要缺陷在於在語言中存在200個以上經常出現的部首,當標準計算機鍵盤僅僅具有26個按鍵時,使其無法為每個部首指定唯一按鍵。另一個主要缺陷在於各種各樣的漢字構造使其無法定義用於描述如何構造任意漢字的標準規則。本發明創建了能克服這兩個主要缺陷的技術。

發明內容
本發明提供了一種用於向計算機中輸入漢字的方法和系統。本發明在現有技術的基礎上提高了輸入漢字的使用容易程度和效率。在漢字輸入系統中,容易使用和效率高是固有的矛盾目標。
依照本發明的第一方面,將用於構造漢字的一些200+部首(在文獻中也稱為偏旁)通過英文字母表中的其中一個字母表示。所選擇的部首集合足以構造感興趣的任意漢字。本發明涉及的每個漢字被指定一「編碼」,其可以是英語語言中的文本串,並且依照本發明定義的那樣,所述字符串的每個字母對應於漢字部首。這在現有技術中是標準作法。在現有技術中,輸入系統對照編碼字母集合(庫)為字母匹配特定文本串。與庫中的字符串相匹配的輸入字符串選擇與該編碼相關聯的漢字。此技術需要用戶精確地熟記分配給每個漢字的準確編碼,巨大的工作傾向於錯誤、模糊和忘記,以至於無法使用。本發明使用新穎的技術以求減少需要用戶記憶的數量。除預定編碼集(庫)之外,本發明還定義了兩個「等價」表「向前」等價表和「向後」等價表。這些表為英文字母的每個字母定義了一組字符串,在比較運算期間,認為所述字符串與該字母「等價」。當將輸入的文本串和來自於所述庫中的一個字符串進行比較時,兩個字符串不是簡單地比較字母與字母。而是將輸入字符串中的每個字母進一步擴大為由向前等價表給定的預定字符串集。因此,如果在向前等價表中將字母『a』定義為包括字符串集{『bc』,『def』,『hijk』},那麼輸入字符串「a」將匹配庫字符串「a」、「bc」、「def」和「hijk」。將此技術應用於輸入字符串中的每個字母。同樣地,將向後等價表應用於庫中定義的字符串中的所有字母。因此,如果在向後等價表中將字母『a』定義為等價於集合{『zy』,『xwv』,『utsr』},那麼庫字符串「a」將匹配輸入字符串「zy」、「xwv」、和「utsr」。向前向後等價表在每個比較過程中都應用。最後結果是大幅度削減了強加於用戶的記憶量。示例將更加明顯地闡明此技術。
例如,漢字「昨」可以利用部首「日」和「乍」構造,或者利用部首「日」、「丿」和 構造,或者利用部首「日」、「」和 構造,或者利用部首「口」、「一」和「乍」構造。對於哪種合成是「正式的」合成沒有標準定義。在現有技術中,用戶必須根據設計者定義的準確序列來提供部首的準確集合,以便獲得匹配。(一些方法定義了映射同一字符的多種序列,但是這隻針對一些字符進行,仍然需要任意預定等價序列的準確匹配)。這實際上需要用戶熟記每個漢字的準確編碼。在本發明中,在描述輸入法的字符構造中允許無限制的變化量。在上述例子中,任何可能的描述都將可以識別字符。隨後是對如何進行匹配的更加詳細的說明。
「日」本身是完整的漢字,並且也是用於構造其他字符經常出現的部首。作為字符,它包括部首「口」和「一」,而作為部首,將它映射到英文字母表的26個字母之一,即『a』。同樣地,「乍」本身也是漢字,但不是經常用於構造其他字的部首,根據分配由指定的英文字母表示。作為字符,它包括部首「丿」、「一」、「丨」、「一」和「一」。假定將部首「口」、「丿」、「丨」和「一」分別映射到字母表字母『o』『j』『i』和『h』。由此,字符昨可以通過編碼「ajhihh」來描述,不過這不是僅有的可能的編碼,而是設計者選擇的一種。然而,與現有技術相比,用戶不需要提供此準確編碼來識別字符昨。相反,如隨後的表所示出的,用戶可以根據其理解為字符昨的部首的內容來提供多種不同輸入字符串的任意一個,其可能或者未必與設計者定義的輸入法相同,所述表為

依照本方法的第二方面,使用「局部匹配」算法來進一步增強編碼比較運算的智能性。除允許一個或多個「通配符」字符依照給定序列來匹配編碼中字母的一個或多個未指定子串之外,每當給定的輸入序列沒有產生任何匹配時,本發明自動地創建「暗示」通配符。由此,假定『*』是通配符,輸入序列「*jhihh」將匹配「昨」的編碼,那麼「aihh」也將匹配它。當為匹配運行而繼續執行比較時,本發明的此方面自動地跳過輸入字符串內非匹配文本運行,由此導致接受局部匹配輸入序列的比較過程。
依照本方法的第三方面,設計了一種新穎的方法,該方法解決了具有相同編碼的字符之間的衝突。有時候,一個以上的漢字包括相同準確部首,僅僅在這些部首的相對位置上結構有所不同。為解決此模糊編碼,將具有位置描述的指定語義的附加字母添加到每個衝突編碼。圖2包含闡明此新穎技術的例子。
依照本方法的第四方面,設計了一種新穎的方法,該方法可以選擇輸入法匹配的字符。每當一個以上候選字符匹配一用戶給定的字母序列時,將候選呈現給用戶以便手動選擇。在現有技術中,有時將數字用作指定用戶選擇的手段。由於提供了候選的線性列表以供選擇,雖然數字依照其意思是顯而易見的,但是本發明選擇使用按字母順序的字母。由此,字母『a』表示選擇第一候選,『b』表示選擇第二,諸如此類。由於將按字母順序的字母用於編碼漢字不都適用任意給定的輸入法,並且如果還將其用作候選選擇按鍵的話,可能會干擾系統,所以使用按字母順序的字母而不是數字是非顯而易見的,並且在現有技術中從未這樣做過。本發明的此方面意義重大,這是由於它允許用戶將其手指保持在基本觸摸鍵入位置(與必須移動他們以便鍵入數字相比),由此使打字速度更快。
依照本方法的第五方面,設計了一種新穎的方法,所述方法將輔助信息附加到輸入字符串上。由於本發明僅僅採用了26個小寫按字母順序的字母來構造輸入序列,所以使用集合之外的字母可以用作有關輸入序列的輔助信息的載體。例如,輸入序列「abc6-9」被解釋為這樣的意思匹配由編碼「abc」定義的並且具有筆畫數是6到9的所有字符。另一個例子是將以大寫字母開始的輸入序列定義為表示「通過」,其指的是輸出給定的輸入序列而不進行翻譯,由此創建在漢字當中輸入英語句子的有效方法。


當結合附圖參照以下詳細說明使本發明的上述方面和許多附帶的優勢變得更透徹時,也使它們變得更加易於理解,其中圖1是用於實現本發明的由通用英語鍵盤上的每個按鍵表示的筆畫、筆畫序列或者偏旁的列表;圖2是某些確定字符的多個編碼例子,如何得出所述編碼的說明,以及識別同一字符的各種編碼;圖3是示出了作為在個人計算機上運行的電腦程式實現的本發明的一個實施例的系統圖;圖4是圖解如何將本發明用於實際產品的本發明一個實施例的實現方式的屏幕快照。
具體實施例方式
本發明提供了一種用於向設備有效地輸入漢字的方法和系統,所述設備具有存儲表示用於語言的字符的編碼的能力,並且使用基於標準英語語言的鍵盤,諸如個人計算機、手持式計算機或者任何其他這種電子設備。提供以下描述,以便使本領域普通技術人員可以做出並且使用本發明,並且在示例性優選實施例的上下文中給出具體描述。對於本領域技術人員來說,對所述優選實施例的各種修改是顯而易見的,並且在此定義的通用原理可以應用於其他實施例。由此,本發明不意指局限於在此示出的實施例,而是與此處所述的原理和特性的範圍一致。
貫穿此說明書提及的「一個實施例」或者「一實施例」指的是與所述實施例相關聯描述的特定特性、結構或者特性包括在本發明的至少一個實施例中。由此,貫穿此說明書不同地方中出現的短語「在一個實施例中」或者「在一實施例中」未必都涉及同一實施例。此外,在一個或多個實施例中,可以依照適當的方式合併特定的特徵、結構或者特性。
用於實現本發明的示例性計算機系統依照本發明,希望向計算機中輸入漢字的人員(用戶)啟動電腦程式,所述電腦程式是本發明的一個實施例,並且將所述電腦程式併入對應於漢字的預定編碼的資料庫。此電腦程式通常駐留在個人計算機上,該個人計算機具有安裝在其上的鍵盤,鍵盤上描述有字母a到z。圖3示出了供這種程序使用的典型計算機設置,這是可以實現本發明的適當的計算環境。
雖然不需要,但是將依照計算機可執行指令的通用上下文來描述本發明,所述計算機可執行指令諸如由個人計算機執行的程序模塊。通常,程序模塊包括例行程序、程序、對象、組件、數據結構等等,用於執行特定任務或者實現特定的抽象數據類型。此外,本領域技術人員將理解的是,本發明可以採用其他計算機系統結構來實施,包括手持設備、多處理機系統、基於微處理器或者可編程消費電子設備、專用硬體設備、網絡處理設備、小型計算機、主計算機等等。本發明還可以依照分布式計算環境來實施,其中通過經由通信網絡連結的遠程處理設備來執行所述任務。在分布式計算環境中,程序模塊可以位於本地和遠程存儲器存儲設備中。
參照圖3,用於實現本發明的示例性系統300包括依照常規個人計算機301形式的通用計算裝置,其包括用於處理程序和/或模塊指令的處理單元304,其中存儲有程序和/或模塊指令的存儲器305,系統總線306及其他系統部件,諸如存儲設備,雖然沒有示出這些設備,但是本領域技術人員應熟知。系統總線用於將各種部件連接到處理單元304,以便處理單元可以作用於來自於這些部件的數據,並且向這些部件發送數據。例如,系統300可以包括鍵盤308,用於收集由用戶輸入的文本。在以下討論的上下文中,將鍵盤308作為獨立的部件來描述。將理解的是,由這種鍵盤提供的功能可以通過獨立的硬體設備或者模擬這種硬體設備功能的虛擬設備來實現。
系統體系結構在一個實施例中,本發明可以實現為在個人計算機上運行的電腦程式。當用戶希望向計算機的輸入流中輸入漢字時,用戶首先激活實現本發明的程序。當激活時,此程序監視來自於鍵盤的輸入按鍵壓力。用戶按壓的每個按鍵依照接收順序被讀取並且存儲在緩衝器中,直到按下某個指定按鍵、諸如空格鍵,信號表示一個字符識別序列結束。然後,所述程序利用現有技術中公開的多種檢索算法的任意一種以及本發明中描述的特定匹配技術、將完成的輸入序列與表示漢字的預定序列的資料庫進行比較,所述檢索算法諸如串行檢索、快速搜索、索引檢索、散列搜索等。如果找到一個並且僅僅一個準確匹配,那麼將由此定義的漢字發送到計算機的輸入流。如果發現一個以上的匹配,那麼將多個字符呈現給用戶以供手動選擇。如果沒有找到匹配,那麼不發送字符。在所有情況中,輸入指定的『end sequence(結束序列)』字符終止一個序列,並且同時啟動下一個,重新重複上述過程。此過程繼續,直到用戶按下按鍵來解除程序,或者立即終止它。
雖然已經結合實施本發明的優選形式及其修改形式描述了本發明,但是本領域普通技術人員將理解的是,對本發明做出的任何其他修改都包括在隨後的權利要求書的範圍內。據此,本發明的範圍不意指由上述描述來限定,而是由隨後的權利要求書來全部確定。
權利要求
1.一種漢字輸入方法,其中將漢字定義為按鍵序列,並且通過對照預定序列集合匹配給定的序列來加以選擇,其特徵在於,包括序列比較方法,其中依照按鍵和按鍵運行的預定映射、考慮將來自於一個序列的按鍵或按鍵的連續運行與另一個序列中的按鍵或按鍵連續運行相匹配。
2.如權利要求1所述的方法,還包括將給定的序列與預定序列進行比較的方法,其中,在不使用指定的『通配符』符號的情況下,當給定的序列僅僅匹配預定序列的一部分時,就實現匹配。
3.如權利要求1所述的方法,還包括將漢字編碼為另一種語言的文本串的方法,其中定義編碼中使用的確定字母來傳達涉及由所述編碼表示的漢字部首的確定位置信息。
4.如權利要求1所述的方法,還包括將漢字編碼指定為另一種語言的文本串的方法,其中定義存在於指定字符串中的確定字母來承擔用於權利要求1所述方法的專用指令。
5.如權利要求1所述的方法,還包括將英文字母表的每個字母定義為一個或多個中文筆畫、筆畫組合或者偏旁的表示,如圖1所示。
6.如權利要求1所述的方法,還包括選擇技術,從而顯示一組候選字符以供用戶選擇,其中用戶通過輸入用作為所希望的候選的標識符的符號來進行選擇,其中標識符符號集合與在定義漢字本身中使用的符號集合重疊,包括用作定義終止的字符。
7.一種漢字輸入方法,其中將漢字定義為按鍵序列,並且根據一給定序列與預定序列集合的匹配來加以選擇,其特徵在於包括字符識別方法,其中分別將中文書面語言的確定筆畫與部首映射到確定的按鍵,並且依照預定的映射,可以通過多個按鍵序列來識別漢字,其中序列中的變化是將字符中包含的部首表示為單個按鍵或者表示部首中包含筆畫和/或子部首的按鍵序列的唯一結果。
8.如權利要求2所述的方法,還包括將英文字母表的每個字母定義為一個或多個中文筆畫、筆畫組合或者偏旁的表示,如圖1所示。
全文摘要
一種用於從某種類型鍵盤向計算設備中輸入漢字的方法和系統。本發明經由在計算設備上運行的軟體來實現。所述軟體應用程式具有均對應於漢字的按鍵序列資料庫。所述軟體應用程式分析用戶操作鍵盤生成的按鍵序列,並且利用多個新技術來為相應的漢字搜索其資料庫。
文檔編號G06F3/01GK1648829SQ20041007983
公開日2005年8月3日 申請日期2004年9月23日 優先權日2003年9月23日
發明者保羅·鵬 申請人:保羅·鵬

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀