帶有跨語言閱讀嚮導的計算機輔助閱讀系統和方法
2023-05-03 00:22:26 2
專利名稱:帶有跨語言閱讀嚮導的計算機輔助閱讀系統和方法
技術領域:
本發明涉及機器輔助閱讀系統和方法,更具體地說,本發明涉及有助於用戶閱讀非母語的一種用戶界面和基礎體系結構。
背景技術:
隨著網際網路的快速發展,遍布全世界的計算機用戶正在越來越多地面對非母語寫成的文字材料。許多用戶對非母語完全不懂。即使用戶進行了一些非母語培訓,該用戶也往往難以閱讀和理解非母語。
考慮某個中國用戶訪問以英語寫成的網頁或其它電子文檔的情況。這個中國用戶在校期間可能接受過某些正規的英語培訓,但是這種培訓往往不足以使他完全地閱讀和理解以英語寫成的、特定的單詞、短語或者語句。這種漢語-英語的情況僅僅是用於說明這一點的一個例子而已。這個問題在跨越其它語言邊界時也是存在的。
所以,本發明起源於提供機器輔助閱讀系統和方法有關的問題,這些系統和方法幫助計算機用戶閱讀和理解非母語表達的文字材料。
發明內容
某個用戶正在以非母語進行閱讀,當他需要幫助時,計算機輔助閱讀系統為他提供幫助,而無需該用戶從文本上轉移注意力。
在一個實施例中,閱讀系統的實現形式為瀏覽程序的閱讀嚮導。這種閱讀嚮導通過某個圖形用戶界面(UI)而顯現,該用戶界面允許用戶在非母語的文本中選擇某個單詞、短語、語句或者單詞的其它組合,並查看選定文本在該用戶自己母語中的譯文。該譯文在選定文本附近的窗口或彈出框中出現,以便使分心最小。
一方面,閱讀嚮導的核心包括淺層分析器、統計單詞譯文選擇器和譯文生成器。淺層分析器把用戶選定的非母語文本中的短語或語句分解成單獨的翻譯單位(例如短語、單詞)。在一個實施例中,淺層分析器將選定文本中的單詞劃分成片段,並從詞態學的角度對其進行分析,以獲得每個單詞的詞態學詞根。為了進一步選擇譯文,淺層分析器採用語句部分(POS)標籤和基本名詞短語(baseNP)標識,按照特徵劃分單詞和短語。例如,POS標籤和baseNP標識可以由某個統計模型來實現。淺層分析器對這些單詞應用基於規則的短語擴展和模式匹配,以產生樹列表。
對於從非母語文本剖析中得出的翻譯單位,統計單詞譯文選擇器選擇最優的候選單詞譯文。單詞譯文選擇器產生所有可能的譯文模式,並使用統計翻譯和語言模型對該翻譯單位進行翻譯。輸出的是最優的候選譯文。
譯文生成器將候選單詞譯文轉換成母語中對應的短語。譯文生成器部分地使用母語模型,以幫助確定適當的譯文。然後,母語單詞和短語就通過鄰近選定文本的UI顯示出來。
附圖簡要說明
圖1是一個計算機系統的框圖,它實現了帶有跨語言閱讀嚮導的閱讀系統。
圖2是一個實施例中示範淺層分析器的框圖。
圖3是一張示意圖,用於理解一個實施例中進行的處理。
圖4是一張示意圖,用於理解圖3中的示意圖。
圖5是一張流程圖,介紹一個實施例中方法的步驟。
圖6是一張示意圖,用於理解一個實施例中進行的處理。
圖7是一張流程圖,介紹一個實施例中方法的步驟。
圖8是一個實施例中示範譯文生成器的框圖。
圖9至圖13顯示了一個實施例中多種示範用戶界面。
具體實施例方式
概述計算機輔助閱讀系統幫助用戶閱讀非母語。為了進行討論,在一般的瀏覽程序範圍內介紹計算機輔助閱讀系統,該程序在通用計算機上運行。不過,計算機輔助閱讀系統也可以在許多不同的非瀏覽環境中實現(例如電子郵件系統、字處理等),並且可以在許多各式各樣類型的設備上實行。
下面介紹的實施例,允許更樂於使用母語交流的用戶快捷方便地廣泛閱讀非母語的電子文檔,而且其方式促進了集中精力和快速消化有關內容。在要翻譯文本的近旁提供帶有譯文窗口的用戶界面,可以增加用戶的便利。譯文窗口中包含著文本翻譯後的譯文。將譯文窗口放在要翻譯文本的近旁,用戶的雙眼不必移動很遠即可確定要翻譯的文本。這又減少了用戶可察覺的分心,舉例來說,假若為了查看要翻譯的文本,用戶的目光需要掃視一段距離,這種分心就很難避免。
在某些實施例中,光標翻譯處理的優點使得用戶交互進一步增強。利用滑鼠移動來選擇文本的位置,用戶能夠進行快速選擇,系統據此自動執行翻譯並將翻譯後的文本向用戶顯示。
示範系統體系結構圖1顯示了示範計算機系統100,它具有中央處理器(CPU)102、存儲器104和輸入/輸出(I/O)接口106。CPU102與存儲器104和I/O接口106通信。存儲器104既代表易失性存儲器(例如RAM),又代表非易失性存儲器(例如ROM、硬碟等)。程序和數據文件可以存放在存儲器104中,並在CUP102上執行。
計算機系統100通過I/O接口106連接著一臺或多臺外圍設備。示範外圍設備包括滑鼠110、鍵盤112(例如字母數字QWERTY鍵盤、電話鍵盤等)、顯示監視器114、印表機116、外部存儲設備118和話筒120。例如,該計算機系統可以作為通用計算機。所以,計算機系統100執行一種計算機作業系統(未顯示),該作業系統在存儲器104中存放,在CUP102上執行。該作業系統最好是一種支持窗口環境的多任務作業系統。適宜的作業系統的一個實例是微軟公司的Windows品牌作業系統。
應當注意,也可以使用其它計算機系統配置,比如手持設備、多處理器系統、基於微處理器的或者可編程的消費電子產品、網絡PC、小型計算機、大型計算機等等。此外,儘管圖1中展示的是一種獨立的計算機,語言輸入系統也可以在分布式計算環境中實現,通過通信網絡(例如LAN、網際網路等)連接的遠程處理設備完成其中的任務。在分布式計算環境中,程序模塊既可以位於本機的存儲設備中,也可以位於遠程存儲設備中。
示範閱讀系統計算機系統100實現了閱讀系統130,它幫助用戶閱讀非母語。該閱讀系統可以在單詞、短語或者語句的級別提供幫助。在圖1中實現的閱讀系統是作為瀏覽程序132,它在存儲器104中存放,在CUP102上執行。應當重視和理解,下面介紹的閱讀系統也可以在瀏覽器範圍以外的氛圍中實現。
閱讀系統130具有用戶界面134和跨語言閱讀嚮導136。UI134展現跨語言閱讀嚮導136。除了閱讀系統之外,瀏覽器程序132還可以包括其它組件,但是這類組件對於瀏覽器程序被視為標準的,因此將不進行詳細顯示和介紹。
閱讀嚮導136包括淺層分析器140、統計單詞譯文選擇器142和譯文生成器144。
示範淺層分析器淺層分析器140把選定的非母語文本中的短語或語句分解成單獨的翻譯單位(例如短語、單詞)。
圖2稍微詳細地顯示了一個實施例中的淺層分析器。在任何適當的硬體、軟體、固件或者它們的組合中,都可以實現該淺層分析器。在這個展示和介紹的實施例中,淺層分析器是在軟體中實現的。
如圖所示,淺層分析器140包括單詞片段模塊200、詞態學分析器202、語句部分(POS)標籤/基本名詞短語標識模塊204、短語擴展模塊206和模式或模板匹配模塊208。雖然這些組件顯示為獨立的組件,但是應當重視和理解,這些組件也可以互相結合或者與其它組件結合。
依據所介紹的實施例,淺層分析器140把用戶已經選定的文本中的單詞劃分為片段。它使用單詞片段模塊來做到這一點。然後淺層分析器使用詞態學分析器202從詞態學的觀點處理單詞,以獲得每個單詞的詞態學詞根。為了發現每個單詞的詞態學詞根,詞態學分析器能夠對單詞應用多種詞態學規則。詞態學分析器202使用的規則可以由熟練於被分析的具體語言的人制定。例如,英語中的一個規則為,以「ed」結尾的單詞,或者通過去除「d」或者通過去除「ed」來形成其詞態學詞根。
為了進一步選擇譯文,淺層分析器140採用語句部分(POS)標籤/基本名詞短語(baseNP)標識模塊204,按照特徵劃分單詞和短語。例如,POS標籤和baseNP標識可以由某個統計模型來實現,下面緊接著的標題為「POS標籤和baseNP標識」的一節介紹了它的一個實例。淺層分析器140使用短語擴展模塊206,對POS標籤/基本名詞短語標識模塊204按照特徵劃分的這些單詞,應用基於規則的短語擴展。短語擴展模塊的一個目標,是把一個基本名詞短語擴展到一個更複雜的名詞短語。例如,「baseNP的baseNP」是「baseNP」短語的更複雜的名詞短語。淺層分析器140也使用模式或模板匹配模塊208來產生樹列表。模式或模板匹配模塊用於翻譯,並認識某些短語翻譯是取決於模式的,而不是直接與短語中的單詞有關。例如,短語「對baseNP感興趣」包含一種模式(即「baseNP」),它用於形成一個更複雜的翻譯單位,用於翻譯。單詞「感興趣」並不直接涉及用於形成更複雜翻譯單位的這種模式。
POS標籤和baseNP標識以下的討論介紹了用於自動識別英語的baseNP(名詞短語)的一種統計模型,並構成了處理選定的文本以產生樹列表的方式之一。所介紹的方法使用兩個步驟N個最佳語句部分(POS)標籤和給予N個最佳POS序列的baseNP標識。所介紹的模型也集成了詞法的信息。最後,應用Viterbi算法在整個序列中進行全局搜索,它使得在整個過程中能夠獲得線性的複雜度。
發現簡單的和非遞歸的基本名詞短語(baseNP),是許多自然語言處理應用程式(比如部分剖析、信息檢索和機器翻譯)的一個重要的子任務。baseNP是簡單的名詞短語,並不遞歸地包含其它的名詞短語。例如,在以下實例中[…]之內的元素是baseNP,其中NNS、IN、VBG等為語句部分(POS)標籤。Marcus et al.,Building a LargeAnnotated Corpus of Englishthe Penn Treebamk,ComputationalLinguistics,19(2)313-330,1993中介紹了POS標籤,使其為世人所知。[Measures/NNS] of/IN[manufacturing/VBG activity/NN]fell/VBD more/RBR than/IN[the/DT overall/JJ measures/NNS]./.
統計方法在本節中介紹兩步法統計模型、參數訓練和Viterbi算法,用於搜索POS標籤和baseNP標識最佳序列。在介紹該算法之前,引入貫穿討論的某些記號。
讓我們把輸入語句E分別表示為下列單詞序列和POS序列E=w1w2…wn-1wnT=t1t2…tn-1tn其中n為語句中的單詞數目,ti為單詞wi的POS標籤。
給定E後,假設baseNP標識的結果是一個序列,其中某些單詞組合成baseNP如下…wi-1[wiwi+1…wj]wj+1…對應的標籤序列如下(a)B=…ti-1[titi+1…tj]tj+1…=…ti-1bi,jtj+1…=n1n2…nm其中bi,j對應於某個baseNP的標籤序列[titi+1…tj]。bi,j也可以被認為是一種baseNP規則。所以,序列B既包含POS標籤,又包含baseNP規則。因此1≤m≤n,ni∈(POS標籤集∪baseNP規則集)。這是某個語句帶有baseNP記號的第一表達式。有時我們也使用以下等效形式(b)Q=…(ti-1,bmi-1)(ti,bmi)(ti+1,bmi+1)…(tj,bmj)(tj+1,bmj+1)…=q1q2…qn其中每個POS標籤ti與其相對於baseNP的位置信息bmi相關聯。位置信息為{F,I,E,O,S}之一。F、E和I分別表示該單詞在某個baseNP的左邊界、右邊界,或者某個baseNP內部的另一個位置。O表示該單詞在某個baseNP之外。S標註某個單一單詞的baseNP。
例如,上面給定實例的兩種表達式如下(a)B=[NNS]IN[VBG NN]VBD RBR IN[DT JJ NNS](b)Q=(NNS S)(IN O)(VBG F)(NN E)(VBD O)(RBR O)(IN O)(JJ I)(NNS E)(.O)
集成的』兩步法過程所介紹方法的原理如下。最可能的baseNP序列B*可以一般地表示如下B*=argmaxB(p(B|E))]]>我們把整個過程分成兩步,也就是B*argmaxB(P(T|E)P(B|T,E))--(1)]]>為了減少搜索空間和計算複雜度,我們僅僅考慮N個最佳POS標籤,也就是T(N-best)=argmaxT=T1,...,TN(P(T|E))--(2)]]>所以,我們有B*argmaxB,T=T1,...,TN(P(T|E)P(B|T,E))--(3)]]>相應地,算法也由兩步組成使用(2)式確定N個最佳POS標籤,然後使用(3)式從這些POS序列確定最佳baseNP序列。這兩步集成在一起,而不是像在其它方法中那樣分開。現在讓我們更密切地查看這兩步。
確定N個最佳POS序列在第一步中算法的目標是在搜索空間(POS網格)之內搜索N個最佳POS序列。根據貝葉斯法則,我們有P(T|E)=P(E|T)P(T)P(E)]]>由於P(E)不影響P(T|E)的最小化過程,(2)式變為T(N-best)=argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(P(E|T))P(T))--(4)]]>我們現在假設,E中的單詞是獨立的。因此P(E|T)i=1nP(wi|ti)--(5)]]>然後我們使用三字模型作為P(T)的一種近似,也就是P(T)i=1nP(ti|ti-2,ti-1)--(6)]]>最後我們有(N-bset)argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(i=1nP(wi|ti)P(ti|ti-2,ti-1))--(7)]]>在搜索N個最佳的Viterbi算法中,P(wi|ti)被稱為詞法生成(或輸出)概率,P(ti|ti-2,ti-1)被稱為隱藏馬爾可夫模型中的躍進概率。Viterbi,Error Bounds for Convolution Codes and Asymptotically OptimumDecoding Algorithm,IEEE Transactions on Information TheoryIT-13(2)pp.260-269,April,1967中介紹了Viterbi算法。
確定baseNP如上所述,給定N個最佳POS序列後,第二步的目標是搜索最佳baseNP序列。
把E、T和B視為隨機變量,根據貝葉斯法則,我們有P(B|T,E)=P(B|T)P(E|B,T)P(E|T)]]>由於P(B|T)=P(T|B)P(B)P(T)]]>,我們有,P(B|T,E)=P(E|B,T)P(T|B)P(B)P(E|T)P(T)--(8)]]>因為我們對給定語句E中每個可能的POS序列搜索最佳baseNP序列,P(E|T)×P(T)=P(E∩T)=常數。不僅如此,從B的定義,在每個搜索過程期間,我們有P(T|B)=i=1nP(ti,...,tj|bi,j)=1.]]>所以,(3)式變為B*=argmaxB,T=T1,...,TN(P(T|E)P(B|T,E))]]>=argmaxB,T=T1,...,TN(P(T|E)P(E|B,T)P(B))---(9)]]>使用獨立假設,我們有P(E|B,T)i=1nP(wi|ti,bmi).--(10)]]>
利用P(B)的三字近似,我們有P(B)i=1mP(ni|ni-2,ni-1)--(11)]]>最後,我們得到B*=argmaxB,T=T1,...,TN(P(T|E)i=1nP(wi|bmi,ti)i=1,mP(ni|ni-2,ni-1))--(12)]]>總而言之,在第一步中,在POS標籤過程中應用搜索N個最佳的Viterbi算法,對於計算的每個POS序列確定路徑概率ft如下ft=i=1,np(wi|ti)p(ti|ti-2,ti-1).]]>在第二步中,對於每個可能的POS標籤結果,再一次應用Viterbi算法搜索最佳baseNP序列。在這一步所找到的每個baseNP序列還與路徑概率fb=i=1np(wi|ti,bmi)i=1,mp(ni|ni-2,ni-1)]]>相關。某個baseNP序列的總概率由fta×fb確定,其中α為均衡係數(在我們的實驗中α=2.4)。對於給定的語句E,當我們確定最佳baseNP序列時,我們也確定了E的最佳POS序列,它對應於E的最佳baseNP。
作為這個過程如何起作用的一個實例,考慮以下文本「stockwas down 9.1 points yesterday morning.」在第一步中,該句的N個最佳POS標籤結果之一是T=NN VBD RB CD NNS NN NN。
對於這個POS序列,第二步將試圖確定baseNP,如圖3所示。虛線中路徑的細節在圖4中給出。在第二步中計算出它的概率如下(Φ為虛變量)P(B|T,E)=p(stock|NN,S)×p(was|VBD,O)×p(down|RB,O)×p(NU-MBER|CD,B)×p(points|NNS,E)×p(yesterday|NN,B)×p(morning|NN,E)×p(.|.,O)×p([NN]|Φ,Φ)×p(VBD|Φ,[NN])×p(RB|[NN],VBD)×p([CD NNS]|VBD,RB)×p([NN NN]|RB,[CD NNS])×P(.|[CD NNS],[NN NN])
統計參數訓練在這項工作中,訓練和試驗的數據是取自Penn Treebank的25個部分。我們把整個Penn Treebank數據分成兩部分,一部分用於訓練,另一部分用於試驗。
在我們的統計模型中,我們計算以下四種概率(1)P(ti|ti-2,ti-1),(2)P(wi|ti),(3)P(ni|ni-2ni-1)和(4)P(wi|ti,bmi)。第一種和第三種參數分別是T和B的三字概率。第二種和第四種是詞法生成概率。利用下列公式可以從有POS標籤的數據計算概率(1)和(2)(ti|ti-2,ti-1)count(ti-2ti-2ti)jcount(ti-2ti-1tj)(13)]]>p(wi|ti)=count(wiwith tag ti)count(ti)--(14)]]>由於訓練集中的每個語句既有POS標籤,又有baseNP邊界標籤,它可以轉換為兩個序列,如上節中介紹的B(a)和Q(b)。使用這些序列,利用分別類似於(13)和(14)式的計算公式,可以計算出參數(3)和(4)。
在訓練三字模型(3)之前,應當從訓練全集提取所有可能的baseNP規則。例如,提取的baseNP規則包括以下三個序列。
(1)DT CD CD CD NNPS(2)RB JJ NNS NNS(3)NN NN POS NN……在Penn Treebank中有超過6000種baseNP規則。訓練三字模型(3)時,我們以兩種方式對待這些baseNP規則。首先,給每個baseNP規則分配一個唯一標識(UID)。這表明,該算法考慮了每個baseNP規則對應的結構。其次,給所有這些規則分配相同標識(SID)。在這種情況下,這些規則組合成同一類。然而,baseNP規則的標識仍然與分配給POS標籤的標識不同。
為了使參數平滑,使用了Katz,Estimation of Probabilities fromsparse Data for Languguage Model Component of Speech Recognize,IEEE Transaction on Acoustics,Speech,and Signal Processing,Volume ASSP-35,pp.400-401,March 1987中介紹的一種方法。為了預測參數(1)和(3)的概率,建立了一個三字模型。在識別baseNP期間遇到未知單詞的情況下,以下列方式計算參數(2)和(4)p(wi|bmi,ti)=count(bmi,ti)maxj(count(bmj,ti))2--(15)]]>p(wi|ti)=count(ti)maxj(count(tj))2--(16)]]>這裡,bmi表示附著在ti上所有可能的baseNP標號,tj是為未知單詞wi猜測的一個POS標籤。
圖5是一張流程圖,介紹一個實施例中方法的步驟。這些步驟可以在任何適當的硬體、軟體、固件或者它們的組合中實現。在展示的實例中,這些步驟是在軟體中實現的。在上述跨語言的閱讀嚮導136——它形成了瀏覽器程序132的一部分(見圖1)——中,可以發現這種軟體的一個具體實施例。更確切地說,將要介紹的方法可以由某個淺層分析器來實現,比如圖2中顯示和介紹的分析器。
步驟500接收選定的文本。實現這個步驟與某個用戶選擇文本中要翻譯的一個部分有關。通常,用戶通過使用一種輸入設備比如滑鼠等來選擇文本。步驟502把選定文本中的單詞劃分成片段。將會受到本領域的技術人員重視的任何適當的劃分處理都可以使用。步驟504獲得每個單詞的詞態學詞根。在展示和介紹的實施例中,這一步是由詞態學分析器實現的,比如圖2中顯示的詞態學分析器。在展示的實例中,詞態學分析器配置為處理以英語寫成的單詞。不過應當重視和理解,任何適當的語言都可以提供一個基礎,在其上可以建立一個詞態學分析器。
步驟506使用語句部分(POS)標籤和基本名詞短語標識來劃分單詞的特徵。任何適當的技術都可以使用。在上面的「POS標籤和baseNP標識」一節中,詳細介紹了一種示範技術。步驟508對按照特徵劃分的單詞應用基於規則的短語擴展和模式匹配,以產生樹列表。在上面的實例中,這一步是使用短語擴展模塊206和模式或模板匹配模塊208來實現的。步驟510輸出樹列表,以便進一步處理。
作為樹列表的一個實例,考慮圖6。其中已經以上面介紹的方法,處理了語句「The Natural Language Computing Group at MicrosoftResearch China is exploring research in advanced natural languagetechnologies」。確切地說,樹列表展示了語句中已經使用上面介紹的POS標籤和baseNP技術,經過分段、詞態學處理和特徵劃分的各個單詞。例如,考慮元素600。其中,單詞「Natural」已經從語句中和從父元素「natural language」中劃分出來。元素600也已經按特徵劃分為帶有POS標籤「JJ」。樹上的其它元素也經過類似的處理。
示範單詞譯文選擇器單詞譯文選擇器142接收樹列表並產生所有可能的譯文模式。選擇器142使用統計翻譯和語言模型對剖析後的翻譯單位進行翻譯,得出母語文本中最優的候選單詞譯文。輸出的是最優的候選譯文。
圖7是一張流程圖,介紹一個實施例中方法的步驟。該方法可以在任何適當的硬體、軟體、固件或者它們的組合中實現。在展示和介紹的實施例中,該方法是在軟體中實現的。這種軟體的一個實施例可以包括單詞譯文選擇器142(見圖1)。
按照上面介紹的處理產生的樹列表在步驟700接收。步驟702從樹列表產生譯文模式。在一個實施例中,產生所有可能的譯文模式。例如,對於英語到漢語的翻譯,英語名詞短語「NP1 of NP2」可能有兩種可能的譯文(1)T(NP1)+T(NP2)和(2)T(NP2)+T(NP1)。在短語譯文中,翻譯的短語是一棵句法樹,在一個實施例中,所有可能的譯文順序都受到考慮。步驟704使用翻譯模型和語言模型來翻譯剖析後的翻譯單位。翻譯單位可以包括單詞和短語。然後步驟706輸出最優的N個候選單詞譯文。可以使用統計模型來選擇最優的N個候選單詞譯文。
示範譯文生成器譯文生成器144把最優的N個候選單詞譯文轉換為母語中對應的短語。然後母語的單詞和短語通過UI出現在選定的文本附近。
圖8稍微詳細地顯示了一個實施例中的譯文生成器144。為了翻譯最優的候選單詞,譯文生成器可以利用許多不同的資源。例如,譯文生成器可以包括它在翻譯過程中使用的詞典模塊800。詞典模塊800可以包括單詞詞典、短語詞典、不規則詞形詞典或者通常在自然語言翻譯處理中使用的任何其它詞典,這對本領域的技術人員是顯而易見的。本領域的技術人員將會理解這類詞典的操作和功能,為簡便起見此處不再更詳細地介紹。
譯文生成器144可以包括模板模塊802,它包含用於翻譯處理中的多個模板。任何適當的模板都可以使用。例如,可以使用所謂的大短語模板來協助翻譯過程。在自然語言翻譯中使用的模板,其操作已知,此處不再更詳細地介紹。
譯文生成器144可以包括規則模塊804,它包含用於使翻譯過程便利的多個規則。規則可以是手工制定的規則,制定它們的人員熟悉被翻譯的特定語言。可以制定規則來涉及屬於翻譯、剖析、翻譯模式中的統計錯誤。本領域的技術人員將會理解基於規則翻譯的原理。
譯文生成器144可以包括用於翻譯過程中的一個或多個統計模型806。這些可以使用的統計模型可以變化範圍很廣,尤其是對與所需翻譯有關的、給定數目的可能的非母語和母語。這些統計模型可以基於上面介紹的POS和baseNP統計參數。在需要從英語翻譯成漢語的一個特定實施例中,可以使用以下模型漢語三字語言模型和漢語交互信息模型。當然,也可以使用其它模型。
上面介紹的模塊和模型可以分別使用,也可以按多種相互組合使用。
在處理過程中,至此用戶已經選擇了非母語文本的一部分,要翻譯成母語。選定的文本已經按照上面的介紹進行了處理。在下面緊接著的討論中,要介紹的方法和系統以對用戶方便和高效的方式把翻譯後的文本呈現給用戶。
閱讀嚮導的用戶界面剩餘的討論是針對閱讀嚮導中用戶界面134的特性。具體地說,閱讀嚮導的用戶界面134允許用戶選擇不能確定如何閱讀和解釋的、以非母語寫成的文本。選定的內容可以是各個單詞、短語或者語句。
圖9至圖13顯示了閱讀嚮導的若干示範用戶界面,以圖形UI(GUI)實現,作為瀏覽器程序或者其它計算機輔助閱讀系統的一部分呈現給用戶。展示的實例顯示了設計為幫助中國用戶閱讀英語文本的閱讀系統。英語文本顯示在窗口中。用戶可以選擇英語文本的某些部分。為了響應用戶的選擇,閱讀嚮導把選定的內容翻譯成漢語文本,並把漢語文本呈現在彈出式譯文窗口或滾動框中。
圖9顯示了用戶界面900,它包括「非母語」文本中已經突出顯示的一部分。突出顯示的文本顯示在用戶界面的第一區域中。用戶界面的第二區域的形式為譯文窗口902,配置為以母語顯示至少某些文本內容翻譯後的部分。在這個實例中,突出顯示的文本包括短語「research in advanced natural language technologies」。在這個實例中,用戶已經突出顯示了單詞「advanced」,閱讀系統已經自動確定該單詞組成被突出顯示短語的一部分。然後閱讀系統在譯文窗口902中自動顯示被突出顯示短語的最佳譯文。通過自動確定包含用戶選定單詞的短語然後提供該短語的至少一種譯文,不僅向讀者提供了該單詞的譯文,而且提供了該單詞在其中使用的、翻譯後的上下文。這樣做的優點在於,它給予讀者更多翻譯後的信息,這又有助於他們理解正在閱讀的材料。
注意,譯文窗口902位於突出顯示文本的至少一個部分的附近。以這種方式定位譯文窗口,為了看見翻譯後的文本,用戶就不必使其注意力從突出顯示的文本轉移很遠。這樣做的優點在於,它不會令用戶的閱讀過程減慢到不期望的程度。也要注意,譯文窗口包含一個下拉箭頭904,它可以用於顯示選定文本的其它翻譯結果。作為一個實例,考慮圖10。其中譯文窗口902已經下拉,以顯示突出顯示短語的所有譯文。
圖11顯示了用戶界面1100,它帶有譯文窗口1102。注意,閱讀系統自動探測出單詞「generated」不在某個短語中,並且只翻譯單詞「generated」。閱讀系統也能夠在譯文窗口1102中提供多種最可能的譯文。例如,顯示了三種可能的示範譯文。在展示的實例中,顯示的譯文是與上下文有關的,並按照上下文來排序。所以,在這個實例中,閱讀系統僅僅可以顯示該單詞最佳的n個譯文,而不是該單詞所有可能的譯文。圖12顯示了用戶界面1100,其中單詞「generated」的所有可能的譯文都在譯文窗口1102中呈現給用戶。
圖13顯示了用戶界面1300,它帶有譯文窗口1302,展示了所介紹實施例的一種特性。具體地說,可以給用戶一種選擇,他們是需要翻譯包含選定單詞的整個短語,還是只需要翻譯選定的單詞。在這個實例中,用戶已經使其滑鼠放置在選擇單詞「advanced」進行翻譯的位置。由於單詞「advanced」組成某個較長短語的一部分,閱讀系統會自動翻譯包含著選定單詞的短語,然後向用戶呈現各種選擇,如上所述。不過在這種情況下,用戶已經指示閱讀系統,他們僅僅需要翻譯選定的單詞。他們能夠以任何適當的方式做到這一點,比如舉例來說,當選定單詞時按下「Ctrl」鍵。
結論上面介紹的若干實施例幫助用戶閱讀非母語,並能夠允許更樂於使用母語交流的用戶快捷方便地廣泛閱讀非母語的電子文檔,而且其方式促進了集中精力和快速消化有關內容。提供的用戶界面在要翻譯文本的近旁具有譯文窗口,包含著文本翻譯後的譯文,可以增加用戶的便利。將譯文窗口放在要翻譯文本的近旁,用戶的雙眼不必移動很遠即可確定要翻譯的文本。這又減少了用戶可察覺的分心,舉例來說,假若為了查看要翻譯的文本,用戶的目光需要掃視一段距離,這種分心就很難避免。在某些實施例中,光標翻譯處理的優點使得用戶交互進一步增強。利用滑鼠移動來選擇文本的位置,用戶能夠進行快速選擇,系統據此自動執行翻譯並將翻譯後的文本向用戶顯示。
儘管是以結構特性和/或詞態學步驟的特定語言來介紹了本發明,還是應當理解,在附帶的權利要求書中規定的本發明不必局限於所介紹的特定特性或步驟。相反,公開這些特定的特性和步驟,是作為實現要求權利的本發明的優選形式。
權利要求
1.一種閱讀系統,包括一種用戶界面,配置為允許用戶選擇非母語的文本並查看選定文本在母語中的譯文;以及一種跨語言的閱讀嚮導,包括一種分析器,把選定的文本分解為各個翻譯單位,一種單詞譯文選擇器,對若干翻譯單位選擇候選單詞譯文,以及一種譯文生成器,把候選單詞譯文轉換為母語中對應的單詞和短語,它們可以通過用戶界面呈現給用戶。
2.根據權利要求1的閱讀系統,其特徵在於,該分析器包括一種詞態學分析器,從詞態學的角度處理各個單詞,以獲得每個單詞的詞態學詞根。
3.根據權利要求1的閱讀系統,其特徵在於,該分析器包括一種語句部分/基本名詞短語標識模塊,用於給各個單詞加上標籤標識。
4.根據權利要求3的閱讀系統,其特徵在於,該語句部分/基本名詞短語標識模塊包括一種統計模型。
5.根據權利要求1的閱讀系統,其特徵在於,該分析器包括一種短語擴展模塊,對各個單詞應用短語擴展規則。
6.根據權利要求1的閱讀系統,其特徵在於,該譯文生成器包括一種詞典模塊,把候選單詞譯文轉換為對應的單詞和短語。
7.根據權利要求6的閱讀系統,其特徵在於,該詞典模塊包括一種單詞詞典。
8.根據權利要求6的閱讀系統,其特徵在於,該詞典模塊包括一種短語詞典。
9.根據權利要求6的閱讀系統,其特徵在於,該詞典模塊包括一種不規則詞形詞典。
10.根據權利要求1的閱讀系統,其特徵在於,該譯文生成器包括一種模板模塊,它包括一個或多個模板,用於把候選單詞譯文轉換為對應的單詞和短語。
11.根據權利要求1的閱讀系統,其特徵在於,該譯文生成器包括一種規則模塊,它包含多個規則,用於把非母語單詞翻譯為母語單詞。
12.根據權利要求1的閱讀系統,其特徵在於,該譯文生成器包括一個或多個統計模型。
13.根據權利要求1的閱讀系統,實施為一個瀏覽器。
14.一種閱讀系統,包括一種用戶界面,配置為允許用戶選擇英語的文本並查看選定文本的漢語譯文;以及一種跨語言的閱讀嚮導,包括一種分析器,把選定的文本分解為各個翻譯單位,一種單詞譯文選擇器,對若干翻譯單位選擇候選單詞譯文,以及一種譯文生成器,把候選單詞譯文轉換為漢語中對應的短語,它們可以通過用戶界面呈現給用戶。
15.根據權利要求14的閱讀系統,實施為一個瀏覽器。
16.一種閱讀系統,包括一種用戶界面,配置為允許用戶選擇非母語的文本並查看選定文本的母語譯文,該用戶界面包括彈出式窗口,用戶可在其中查看母語文本;以及一種跨語言的閱讀嚮導,配置為接收用戶已經選定的非母語文本,以及自動地把非母語文本翻譯成母語文本。
17.根據權利要求16的閱讀系統,其特徵在於,該彈出式窗口顯示在用戶已經選定的文本附近。
18.根據權利要求16的閱讀系統,其特徵在於,該彈出式窗口是可滾動的,以顯示多種譯文,並顯示在用戶已經選定的文本附近。
19.根據權利要求16的閱讀系統,實現為一個瀏覽器。
20.一種計算機輔助閱讀方法,包括通過用戶界面向用戶呈現非母語文本;接收用戶選定的文本;處理用戶選定的文本,以提供已經從非母語翻譯成母語的文本;以及通過用戶界面向用戶呈現翻譯後的文本。
21.根據權利要求20的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;以及對於一個或多個翻譯單位,獲得詞態學詞根。
22.根據權利要求20的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;以及使用語句部分標籤和基本名詞短語標識,按特徵劃分翻譯單位。
23.根據權利要求20的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;使用語句部分標籤和基本名詞短語標識,按特徵劃分翻譯單位;以及對按特徵劃分的翻譯單位應用基於規則的短語擴展和模式匹配,以提供樹列表。
24.根據權利要求23的計算機輔助閱讀方法,其特徵在於,所述處理進一步包括根據樹列表產生母語的候選單詞譯文。
25.根據權利要求24的計算機輔助閱讀方法,其特徵在於,所述處理進一步包括把候選單詞譯文轉換為母語中對應的單詞和/或短語。
26.一種或多種計算機可讀的介質,其中具有計算機可讀的指令,當某個處理器執行這些指令時,它們指示計算機實現權利要求20的方法。
27.根據權利要求20的計算機輔助閱讀方法,其特徵在於,所列舉的動作由某個瀏覽器來實現。
28.一種閱讀系統,包括一種或多種計算機可讀的介質;以及記錄在該介質上的代碼,配置為實現某個瀏覽器,該瀏覽器配置為通過用戶界面向用戶呈現英語文本;接收用戶選定的文本;處理用戶選定的文本,以提供已經從英語翻譯成漢語的文本;以及通過用戶界面向用戶呈現翻譯後的文本。
29.根據權利要求28的閱讀系統,其特徵在於,該瀏覽器配置為向用戶呈現同一英語文本的多種譯文。
30.根據權利要求28的閱讀系統,其特徵在於,該瀏覽器配置為在用戶選定的英語文本附近的譯文窗口中呈現翻譯後的文本。
31.根據權利要求28的閱讀系統,其特徵在於,該瀏覽器配置為在用戶選定的英語文本附近的譯文窗口中呈現同一英語文本的多種譯文,該譯文窗口具有下拉的特性,以顯示多種譯文的至少某一些。
32.一種計算機輔助閱讀方法,包括通過用戶界面向用戶呈現英語文本;接收用戶選定的文本;處理用戶選定的文本,以提供已經從英語翻譯成漢語的文本;以及通過用戶界面向用戶呈現翻譯後的文本。
33.根據權利要求32的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;以及對於一個或多個翻譯單位,獲得詞態學詞根。
34.根據權利要求32的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;以及使用語句部分標籤和基本名詞短語標識,按特徵劃分翻譯單位。
35.根據權利要求32的計算機輔助閱讀方法,其特徵在於,所述處理包括把文本分解為翻譯單位;使用語句部分標籤和基本名詞短語標識,按特徵劃分翻譯單位;以及對按特徵劃分的翻譯單位應用基於規則的短語擴展和模式匹配,以提供樹列表。
36.根據權利要求35的計算機輔助閱讀方法,其特徵在於,所述處理進一步包括根據樹列表產生漢語的候選單詞譯文。
37.根據權利要求36的計算機輔助閱讀方法,其特徵在於,所述處理進一步包括把候選單詞譯文轉換為漢語中對應的單詞和/或短語。
38.一種或多種計算機可讀的介質,其中具有計算機可讀的指令,當某個處理器執行這些指令時,它們指示計算機實現權利要求32的方法。
39.一種計算機輔助閱讀方法,包括通過用戶界面向用戶呈現非母語文本,使得用戶能夠選取至少一個單詞;自動確定是否有對應的短語與選定的一個單詞相關聯;以及以母語呈現至少選定單詞的一種或多種譯文,或者如果有對應的短語與選定的單詞相關聯,以母語呈現對應短語的至少一種譯文。
40.根據權利要求39的計算機輔助閱讀方法,其特徵在於,所述呈現包括在譯文窗口中呈現譯文,該窗口鄰近對應的、選定的至少一個單詞。
41.根據權利要求40的計算機輔助閱讀方法,其特徵在於,所述譯文窗口是可滾動的,以便呈現多種不同的譯文。
42.根據權利要求39的計算機輔助閱讀方法,其特徵在於,所述呈現包括呈現多種最可能的譯文。
43.根據權利要求42的計算機輔助閱讀方法,其特徵在於,所述呈現進一步包括根據上下文分選最可能的譯文。
44.根據權利要求39的計算機輔助閱讀方法,進一步包括接收用戶輸入,該輸入表示用戶僅僅需要翻譯組成短語一部分的、某個選定的單詞;以及僅僅呈現選定單詞的一種或多種譯文。
45.一種或多種計算機可讀的介質,其中具有計算機可讀的指令,當某個處理器執行這些指令時,它們指示計算機實現權利要求39的方法。
46.一種閱讀系統,包括一種或多種計算機可讀的介質;以及記錄在該介質上的代碼,配置為實現某個瀏覽器,該瀏覽器配置為使得用戶能夠選取通過用戶界面呈現的至少一個英語單詞;自動確定是否有對應的短語與選定的至少一個英語單詞相關聯;以及以漢語呈現選定的至少一個英語單詞的一種或多種譯文,或者如果有對應的短語與選定的至少一個英語單詞相關聯,以漢語呈現對應短語的至少一種譯文。
47.一種跨語言的用戶界面,包括第一區域,配置為顯示非母語文本;以及第二區域,配置為以母語顯示文本中至少一部分的譯文。
48.根據權利要求47的跨語言用戶界面,其特徵在於,第二區域安排在用戶選定來翻譯的至少某些文本附近。
49.根據權利要求47的跨語言用戶界面,其特徵在於,非母語包括英語,母語包括漢語。
50.根據權利要求47的跨語言用戶界面,其特徵在於,第二區域包括彈出式窗口。
51.根據權利要求50的跨語言用戶界面,其特徵在於,彈出式窗口包括下拉特性,以顯示另外的譯文。
52.根據權利要求47的跨語言用戶界面,其特徵在於,第二區域顯示同一文本的多種不同的譯文。
53.一種跨語言的用戶界面,包括第一區域,其中可以顯示文本以便用戶選擇,該文本以第一語言顯示;以及第二區域,鄰近用戶選定的文本,該第二區域配置為顯示已經翻譯成第二語言的文本,翻譯後的文本對應於用戶已經選定的文本。
54.根據權利要求53的跨語言用戶界面,其特徵在於,第一語言包括英語,第二語言包括漢語。
55.根據權利要求53的跨語言用戶界面,其特徵在於,第二區域包括彈出式窗口。
56.根據權利要求53的跨語言用戶界面,其特徵在於,第二區域包括彈出式窗口,它具有下拉特性,以顯示多種譯文。
57.根據權利要求53的跨語言用戶界面,其特徵在於,第二區域顯示同一文本的多種不同的譯文。
58.一種閱讀系統,包括一種跨語言的閱讀嚮導,包括一種分析器,把選定的文本分解為各個翻譯單位,該分析器包括包括一種語句部分/基本名詞短語標識模塊,用於給各個舉詞加上標籤標識,一種單詞譯文選擇器,對若干翻譯單位選擇候選單詞譯文,以及一種譯文生成器,把候選單詞譯文轉換為母語中對應的單詞或短語,它們可以通過用戶界面呈現給用戶。
59.根據權利要求58的閱讀系統,其特徵在於,該分析器包括一種詞態學分析器,從詞態學的角度處理各個單詞,以獲得每個單詞的詞態學詞根。
60.根據權利要求58的閱讀系統,其特徵在於,該分析器包括一種短語擴展模塊,對各個單詞應用短語擴展規則。
61.一種或多種計算機可讀的介質,其中具有計算機可讀的指令,當一個或多個處理器執行這些指令時,使這一個或多個處理器實現一種跨語言的閱讀嚮導,包括一種分析器,把選定的文本分解為各個翻譯單位,該分析器包括包括一種語句部分/基本名詞短語標識模塊,用於給各個單詞加上標籤標識,一種單詞譯文選擇器,對若干翻譯單位選擇候選單詞譯文,以及一種譯文生成器,把候選單詞譯文轉換為母語中對應的單詞或短語,它們可以通過用戶界面呈現給用戶。
62.一種或多種計算機可讀的介質,其中具有計算機可讀的指令,當一個或多個處理器執行這些指令時,使這一個或多個處理器通過用戶界面向用戶呈現非母語文本;接收用戶選定的文本;處理選定的文本,步驟包括把選定的文本分解為翻譯單位,使用語句部分標籤和基本名詞短語標識,按照特徵劃分翻譯單位,對按特徵劃分的翻譯單位應用基於規則的短語擴展和模式匹配,以提供樹列表,根據樹列表產生母語的候選單詞譯文,把候選單詞譯文轉換為母語中對應的單詞和/或短語,以提供已經從非母語翻譯成母語的文本;以及通過用戶界面向用戶呈現翻譯後的文本。
全文摘要
某個用戶正在以非母語進行閱讀,當他需要幫助時,計算機輔助閱讀系統為他提供幫助,而無需該用戶從文本上轉移注意力。在一個實施例中,閱讀系統的實現形式為瀏覽程序的閱讀嚮導。這種閱讀嚮導通過某個圖形用戶界面(UI)而顯現,該用戶界面允許用戶在非母語的文本中選擇某個單詞、短語、語句或者單詞的其它組合,並查看選定文本在該用戶自己母語中的譯文。該譯文在選定文本附近的窗口或彈出框中出現,以便使分心最小。
文檔編號G06F17/27GK1426561SQ01808510
公開日2003年6月25日 申請日期2001年4月23日 優先權日2000年4月24日
發明者徐恩東 申請人:微軟公司