表意文字資料庫系統及其處理方法
2023-10-11 08:53:29 3
專利名稱::表意文字資料庫系統及其處理方法
技術領域:
:漢字,一種典型的表意文字,現在所知的有13萬字或更多,確切數目不得而知。此外,在使用漢字的大韓民國、中國、臺灣和日本,他們獨立地使用自己的漢字。因此,漢字的標準化和處理存在問題。此外,即使存在這樣一種系統,例如電腦或行動電話,能夠將所有漢字資料庫化和輸入,但是在13萬漢字中查找和輸入想要的漢字不是一件容易的任務。迄今為止大多數已公開的漢字輸入方法中,漢字都是根據部首、總筆畫和發音進行輸入。與每一個筆數/總筆畫/發音對應的漢字也是不計其數的。由於只有當知道了筆數/總筆畫/發音才能輸入漢字,所以有這樣的問題,與筆數/總筆畫/發音對應的是漢字列表,輸入的漢字必須通過選擇才能輸入。作為另外一種輸入漢字的方法,有一種區分漢字部首並且根據漢字的筆畫順序輸入漢字的方法。但是,根據每個漢字中部首的順序檢索相應的漢字時,在列表窗中進行顯示和選擇,與根據筆數/總筆畫/發音的輸入方法是一樣的,顯示在列表窗中的漢字也是根據筆數或總筆畫的順序排列的。所以,有這樣的問題,查找要輸入的漢字是很困難的。在列表窗中,將所述表意文字資料庫中表意文字以預定數字分開以便分組,並且如果由每個分組的第一個表意文字組成的列表窗生成,而且選擇了一個分組的第一個表意文字,就在列表窗中顯示由屬於該選中分組的表意文字組成的列表窗。所述表意文字資料庫處理方法還包括第三步,提供用戶資料庫,所述用戶資料庫具有欄位,欄位由具有數值的、包含在所述表意文字資料庫中的表意文字組成;第四步根據所述表意文字資料庫中表意文字的排列順序對用戶資料庫進行排列或者搜索。此外,本發明能嚢括部分或者全部在韓國、中國、日本等使用的漢字。[34有益效果圖5表示喃字的實例;圖7表示西夏字的實例。(4)~1(C):以此漢字部首開始的漢字包括,例如"巳,弓,民"等等。[55(5)L(D):第五筆畫用此部首的"役"和第四筆畫用此部首的"冗"。[56(6),(E):以此漢字部首開始的漢字包括,例如司、衛、力、習等等,和第五筆畫用此部首的"危"。(14)"(L):以此漢字筆畫部首的漢字包括,例如"爿,戕,胖"。[65(15)L(M):第二筆畫用此部首的"兒"和第五筆畫用此部首的"兄"。[66(16)^(N):第二筆畫用此部首的"馬"和第四筆畫用此部首的"鳥"。[67](17)J(0):以此漢字部首開始的漢字包括,例如"水,小"等等。[68(18p(P):第三筆用此部首的"豕"和第二筆畫用此部首的"狂,狹"等等。以此漢字部首開始的漢字包括,例如"收",和第四筆畫用此部首的衣"。(20):以此漢字部首開始的漢字包括,例如"手,香,斤,愛"等等。(21)/:以此漢字部首開始的漢字包括,例如"牛,竹,色,父"等等。(22)丄:以此漢字部首開始的漢字包括,例如"發",和第二筆畫用此部首的互",和第六筆畫用此部首的"私"。(23)〈:以此漢字部首開始的漢字包括,例如"女,巡,災"等等。(24)J:以此漢字部首開始的漢字包括,例如"月,凡,川"等等。(25)、:第二筆畫用此部首的人和第二筆畫用此部首的"公"。(26)、:第四筆畫用此部首的代和第五筆畫用此部首的"民"。(27)、:以此漢字部首開始的漢字包括,例如"齊,鬥,洗,羊"等等。(28),:以此漢字部首開始的漢字包括,例如"心,自,血"等等。按照上述每個漢字部首描述,不能作為簡化漢字第一筆畫的筆畫數目是八個上述編號為(3),(5),(7),(15),(17),(18),(25)和(26)的筆畫。當七千漢字(現代漢語通用字表,收字7000個,中國政府制定)按照上述區分後漢字部首的順序依次排列時,它們被排列成以下順序"一二三豐彗慧匡砉貳契挈,,.…"(跳過).….."煌熄熄燠炎郯剡眾燊,,。表意文字資料庫也能有助於用於輸入表意文字。在表意文字資料庫中,表意文字被以預先指定的數字被分開並且形成組。將各分組的第一個表意文字顯示到列表窗。圖2表示了7000個簡體漢字按每100個分成一組,並且處理每個分組的第一個表意文字。也就是說,數字0分配給"一",數字100分配給"環",......,數字6900分配給"憫"。卯"表"的筆畫順序是一(A),一(A),l(K),一(A),/(S),……,並且在筆畫順序為」(A),」(A),l(K),z(Bl),......的"環"之前,數字100分配給了"環"。因此,可以看出"表"存在於數字O到數字99之間。換句話說,這是因為根據字母表順序對它們進行了排列,AAKAS...在AAKB1...之前。表格l表意文字資料庫結構實例tableseeoriginaldocumentpage19網如果表意文字資料庫具有上述結構,習慣於根據筆數/總筆畫/發音等輸入漢字的用戶,也能使用表意文字資料庫結構。一個或更多的筆數/總筆畫/發音也能選擇性的包括於表意文字資料庫結構中。此外,在發音方面,圖表l中列出了簡化漢字的拼音。但是,因為在每個國家中與發音對應的漢字是不同的,資料庫可根據每個國家的發音構建。當然,韓國、中國和日本的所有發音也能都包括。[100工業適用性[101如果採用本發明的表意文字資料庫系統及其處理方法,漢字可以筒單地輸入,並且其它包含表意文字的資料庫也能被簡單有效地處理。102儘管已示出和描述了本發明的優選實施例,可以設想,本領域的技術人員可在所附權利要求的精神和範圍內設計對本發明的各種修改。權利要求1.一種表意文字資料庫系統,其包括表意文字資料庫,所述表意文字資料庫具有欄位,在欄位中構成表意文字的字形被分成由點和劃組成的部首,上述部首由一個筆畫組成,每個部首分配一個順序,並且每種表意文字根據上述部首的順序和每個表意文字的筆畫順序進行排列;和列表窗,用於根據表意文字的排列順序在上述表意文字資料庫中搜索表意文字。2.如權利要求1所述的表意文字資料庫系統,還包括用戶資料庫,所述用戶資料庫具有欄位,欄位由具有數值的、包含在所述表意文字資料庫中的表意文字所組成,其中,用戶資料庫根據所述表意文字資料庫中表意文字的排列順序進行排列或者搜索。3.如權利要求l所述的資料庫系統,其特徵在於,在列表窗中,將所述表意文字資料庫中表意文字以預定數字分開從而分組,並且如果由每個分組的第一個表意文字所組成的列表窗生成,而且選擇了一個分組的第一個表意文字,就在列表窗中顯示由屬於該選中分組的表意文字組成的列表窗。4.如權利要求l所述的資料庫系統,其特徵在於,在表意文字資料庫中,一個或更多的信息,包括表意文字的筆數、發音和總筆畫,可被指定為欄位。5.如權利要求l所述的資料庫系統,其特徵在於,在表意文字資料庫中,單獨分配給每個表意文字的字符編碼或者序列號可被指定為欄位。6.如權利要求l所述的資料庫系統,其特徵在於,所述部首具有下列形狀和排列順序formulaseeoriginaldocumentpage3formulaseeoriginaldocumentpage47.如權利要求l所迷的資料庫系統,其特徵在於,所述表意資料庫中的表意文字,"口、日、目、山"和"白"位於漢字的左邊的漢字,如"味、時、目艮、峰"和"的",和"卄"位於漢字的上邊的漢字,如"葜,,,分開排列。8.—種表意文字資料庫處理方法,其特徵在於包括第一步,提供表意文字資料庫,所述表意文字資料庫具有欄位,在欄位中構成表意文字的字形被分成由點和劃組成的部首,上述部首由一個筆畫組成;每個部首分配一個順序,並且每種表意文字才艮據上述部首的順序和每個表意文字的筆畫順序進行排列;和第二步,提供列表窗,用於根據表意文字的排列順序在上述表意文字資料庫中搜索表意文字。9.如權利要求8所述的方法,其特徵在於還包括第三步,提供用戶資料庫,所述用戶資料庫具有欄位,欄位由具有數值的、包含在所述表意文字資料庫中的表意文字組成,第四步,根據所述表意文字資料庫中表意文字的排列順序對用戶資料庫進行排列或者搜索。全文摘要本發明涉及一種表意文字資料庫系統及其處理方法。表意文字資料庫系統包括表意文字資料庫和列表窗;所述表意文字資料庫具有欄位,在欄位中構成表意文字的字形被分成由點和劃組成的部首,上述部首由一個筆畫組成,每個部首分配一個順序,並且每種表意文字根據上述部首的順序和每個表意文字的筆畫順序進行排列;所述列表窗,用於根據表意文字的排列順序在上述表意文字資料庫中搜索表意文字。表意文字資料庫處理方法包括第一步,提供表意文字資料庫,所述表意文字資料庫具有欄位,在欄位中構成表意文字的字形被分成由點和劃組成的部首,上述部首由一個筆畫組成,每個部首分配一個順序,並且每種表意文字根據上述部首的順序和每個表意文字的筆畫順序進行排列;第二步,提供列表窗,用於根據表意文字的排列順序在上述表意文字資料庫中搜索表意文字。文檔編號G06F17/30GK101517573SQ200780035438公開日2009年8月26日申請日期2007年9月27日優先權日2006年9月29日發明者樸仁基申請人:樸仁基