碉堡了門外漢破解生僻字電腦輸入難題
2023-12-10 04:15:32 4
泡泡網主板頻道2月12日 上邊「未」「成」、下邊「人」組成的(音:載)字,左邊「亻」、右邊「西」「域」「哲」摞起來組成的(音:佛)字,「口」中一個「兔」組成的(音:月)字……這些生僻字,普通人見都沒見過,更別說在電腦上敲出來了。
正是因為難以輸入,這些字所承載的豐富文化內涵,正在加速流失。眼下,西城區的一家文化創意企業,發明了「漢字結構對稱輸入法」「數碼鍵對稱結構漢字輸入法」並申請專利。不論多麻煩的字,僅靠鍵盤上的數字鍵,三下五除二就能敲出來。
門外漢抄字典發明輸入法
智能ABC、五筆字型、鄭碼輸入法……對於常用漢字,國內外的輸入法已達數千種;然而,當這些輸入法面對生僻漢字時就捉襟見肘了。
如何讓生僻字從不見天日的故紙堆裡,走進計算機?王子善依靠著不足20人的團隊潛心研究,開發出了70195個超大字符集對稱碼輸入法軟體,破解了這個難題。
開發出對稱碼輸入法軟體的王子善,原先成天跟英文打交道,對於漢字輸入這門學問是門外漢。24年前,他第一次接觸到計算機,開始記憶大量的漢字字根,學習在計算機上輸入漢字。也就是從那時起,他開始琢磨不記字根能否輸入漢字?
為了尋找漢字的規律,他將厚厚的第四版《現代漢語詞典》手抄了三遍,終於總結出漢字字形的特點,並首先在國內提出漢字字形的對稱性和非對稱性的理論,同時經過申報獲得兩項國家發明專利,並首次提出《數字鍵漢字結構編碼規範》技術標準,於2011年11月獲得了國家新聞出版總署的正式批准。
王子善介紹,對稱碼輸入法其實是優化了的拼音和筆畫輸入法,由一個分類鍵加拼音或筆畫組成。分類的方法,即根據漢字的對稱或不對稱的結構特點將漢字分為以下幾類:獨體、包圍、上對稱、下對稱、上下非對稱、左對稱、右對稱、左右對稱、左右非對稱。
敲擊一個分類鍵,就意味著撇開了字庫中90%的字,而只從10%的字庫中挑字,其速度自然要比起從整個字庫中挑一個字快得多。
比如左邊「亻」、右邊「西」「域」「哲」摞起來組成的(音:佛)字,意思是古人眼裡,「佛」就是西域來的哲人。其對稱類型為「右對稱」,輸入「右對稱」對應的數字鍵,然後再根據筆畫順序,分別敲擊撇、豎、橫等對應的數字鍵,29筆畫的生僻字,僅敲5個鍵,這個生僻字就出來了。
6000萬人將不再為「名」所累
資料顯示,目前全國13億人口中,名字中有生僻字的超過6000萬人。這些人在辦理證照、銀行開戶、醫院就醫、民航購票、購買保險及辦理其他業務時,經常會因為字庫系統打不出生僻字而辦不了業務,甚至被迫改名。
王子善告訴記者,生冷僻字在計算機中無法輸入主要有兩個原因:一是由於計算機內置漢字字庫執行的是GB18030-2000字符集標準(字庫含漢字20902個或是27484個),很多生冷僻字沒有被納入字庫;二是即使一些計算機執行了GB18030-2005字符集標準(含漢字70195個),雖然字庫中納入了生冷僻字,但由於沒有相匹配的漢字輸入法,同樣不能直接輸入。
迄今為止,在與漢字信息有關的出版、公安、外交、衛生、金融等系統中,都無法方便、快速、簡明地對生冷僻漢字輸入與檢索,嚴重影響和制約了這些系統的中文信息數位化的實施與發展。「對稱碼漢字輸入法」軟體的問世,將很好地解決這些領域的難題。
讓「睡」在古籍裡的字活起來
把生僻字搬進電腦,還有一個重要的作用,那就是讓古籍文獻上網,讓更多的人了解傳統文化。
中國是世界上唯一有持續不間斷文獻記載的文明古國,因而古籍存儲數量也是最多最大。然而,古籍「上網」的過程中,依然遇到了同樣的問題,古籍漢字無法在計算機中輸入……
王子善說:「目前全國各大圖書館收藏的古籍圖書數千萬冊。這些古籍圖書在收藏中,極易受到氣候變化、氧化、腐蝕、蟲蝕等帶來的破壞,如不及時將這些保存了上千年的文化寶藏,通過計算機存儲起來,那將是人類的一大損失。因此,我想通過對稱碼輸入法的推廣,讓古籍漢字能夠暢行網絡,讓中國文化能夠更好地傳播和傳承。」■