用於生成亞洲語字符的識別體系結構的製作方法

2023-12-08 16:23:11 4

>勺允如果發音被不正確地識別，則嚮導允許用戶糾正發音。在選擇了要糾正的音素後，嚮導示出與誤識別的音素相近的音素列表，並且該列表可以根據兩音素之間的距離來排序，該距離取決於例如吐字的位置、吐字的方式、聲帶振動、上下文、和其它本地方言的影響。在臺灣許多人講國語和閩南語。來自閩南語方言的聲音結構以若干方式極大地影響國語語調。大多數人不能區分"生《屍日(巻舌音)"和"卩虧厶(齒齦音)"，而一些人不能區分"匸(唇齒摩擦音)"與"廠(軟顎摩擦音)"。對於中國大陸南方某些方言，/n/和/l/是不可區分的，並且還影響其它所學習的語言的成果。對最小可區分音素集合之間的距離給出更短的距離。上下文指的是兩個音素是否出現在同一上下文中。例如，""(/b/)"和"夕(/ph/)"在上下文方面比"27(/b/)"和"匸(/f/)"更近，因為這些音素後面可跟隨同樣的核元音和尾輔音。tableseeoriginaldocumentpage18基於CHT中所使用的輔音的這些特徵的示例性混淆矩陣表在以下給出。下表是通過基於吐字的位置、吐字的方式、聲帶振動、上下文、以及其它本地方言的影響來計算距離獲得的。這一類型的混淆矩陣還可以通過自動地比較具有不同音子的將覆蓋吐字的位置、吐字的方式、聲帶振動的AM來生成。混淆矩陣還可以通過具有不同音子的AM並基於上下文和其它方言的影響來調整以得到最終形式來獲得。可以使用同樣的方法來生成CHT的元音和聲調的矩陣，以及所有其它亞洲語言的輔音和元音。tableseeoriginaldocumentpage184143675455436545432門672378956767874632564344324421力1412434432325621443244211673446234力6784667634《142324323421432432廠432321241212321<12123212T321221蟲12124衝122屍14234"P12虧1厶可以向中文和英文拼寫模式提供拆分命令，例如以獲得更好的識別結果。例如，可以對"中文拼字(拼寫)"和"英文拼字"進行拆分。這樣做的原因包括以下各項。在使用英文拼寫時，可以直接向文本返回英文字母；但在使用中文拼寫時，輸出音標並隨後將其轉換成中文。因此，這兩個拼寫模式的過程是不同的。英文字母和中文音標中的一些是同音的。因19此，拆分兩個過程避免了混淆。此外，如果拆分該過程，則所激活的CFG可以更加簡單。另外，識別準確度會更高。拆分這兩個命令使CHS受益最大，因為CHS中的音標也是相同的26個英文字母。如果不執行拆分，則用於轉換成中文字符的時間將是未知的。此外，如果用戶旨在對中文使用拼音，則可不執行對有效語音序列的更嚴格的檢査。以下描述在用戶說出命令時所觸發和呈現的一系列拼寫模式面板(或屏幕截圖)。圖6示出在用戶期望亞洲字符/詞作為輸出時所呈現的拼寫對話框面板600的屏幕截圖。在用戶說出"中文拼字"時，呈現拼寫模式面板600，且其包括指示面板600是中文拼寫(拼字)面板的標題欄602，使用發音來獲得字符或同音字命令來改變字符(注音拼字或諧音換字)604，發音(注音)606，以及各中文對話框選擇器同音字(諧音)(H)選擇器608、確定(確定)(0)選擇器610、和取消(取消)(E)選擇器612。在用戶說出"英文拼字"時，圖7示出在用戶期望英文單詞作為輸出時所呈現的拼寫模式對話框面板700的屏幕截圖。面板700用中文示出"拼寫(拼字)面板"702、"清晰地拼寫單詞"(或吐字清晰)的中文指令(用清晰的聲音拼出文字)704、"再次拼寫"的中文指令(再拼字一次)706、以及用中文標記的一個或多個選擇器確定(確定)選擇器708和取消(取消)選擇器710。面板700還呈現英文字母和/或其它字符(例如@)的經索引和排序的列表712。雖然在該實施例中被示為有某種程度的不同，但面板600和700具有除在一個中出現而不在另一個中出現的特徵之外的更相似的外觀以提供更一致的用戶體驗是合乎需要的。圖8-10呈現與使用同音字糾正的過程相關聯的屏幕截圖。圖8示出所呈現的用於同音字命令處理的拼寫對話框面板800的屏幕截圖。用於獲得作為同音字的正確字符的命令被發聲。所顯示/識別的詞作為608中的"諧音(同音字)"來提供。該語音命令界面可被認為比鍵入更高效，因為可以避免對音標的重複鍵入。換言之，有時所發聲的命令被正確地識別，但用戶想要不同的字符。並非提示用戶重複發音，該命令可被處理以輸出同音字列表。使用這一功能，通過語音來糾正提供了超過手動輸入(例如鍵入)的改進用戶體驗。S卩，在用戶通過鍵入手動地輸入發音並從同音字列表中選擇詞時，該詞將作為底下有虛線的文本來呈現。在該模式中，用戶仍然可以改變來自列表的字符。然而，在用戶對詞確信時，用戶可以選擇回車(或"確定")選擇器610以在文本中鎖定該詞，以使輸入系統不再從所分配的LM分數自動調整該詞。因此，一旦在對話框面板800中鎖定了詞，則如果用戶想要再次改變該詞，則必須重試音標。該語音命令界面通過識別"諧音"命令而節省了手動輸入的額外努力。作為第一步驟，用戶通過說"更正1號字"來選擇要糾正的詞。隨後加亮第一字符802。用戶隨後可以說用於同音字的"諧音"或選擇"諧音"("同音字")選擇器608，以獲得原始中文字符的同音字(H)字符。面板800還以中文呈現對話框選擇器同音字選擇器608、確定選擇器610和取消選擇器612。注意，可以對面板800中的任何字符(標記為1、2或3的域中)執行通過同音字命令或提供發音的糾正，其中802是第一字符。然而，候選字符列表將是不同的。來自同音字命令的候選列表將包含音調相同或稍微不同的字符。來自提供發音的候選列表將包含與用戶給出的發音精確匹配的字符。如果用戶將採用發音，則將使第二字符被加亮來呈現圖8的屏幕截圖，而非如圖IO所示的第一字符被加亮。隨後，在用戶提供了發音後，呈現圖11的屏幕截圖。圖9示出響應於用於同音字糾正的語音激活命令來呈現的拼寫模式對話框面板900的屏幕截圖。拼寫嚮導支持原始字符的發音，以便在列表框902中呈現經索引的同音字符列表。用戶隨後可以通過說出相關聯的索引號，如第一候選的"一"或"一號"，或在該情況下點擊字符906來選擇所需字符。作為響應，發音面板900將清除列表框902，用所選字符906替換原始字符802，並且如圖IO的面板1000所示，列表框902已響應於所發聲的索引選擇而被清除。嚮導隨後將交互移動到第二字符1002(第二域中)以進行類似處理，如以上根據圖8的字符802(第一域中)所述。繼續圖10，所發聲的糾正可以通過提供發音來完成。如果嚮導尚未移動到並加亮第二字符1002，則用戶通過說出"更正二號字"來通過選擇或導航到要糾正的詞來開始，以加亮第二字符1002。21圖11示出所呈現的用於語音發音的拼寫對話框面板1100的屏幕截圖。接著，用戶說出用於發音的"TL4h"，該發音在發音域1102中被呈現給用戶，並且嚮導再次在列表框902中提供經索引的詞列表。列表框卯2以更頻繁使用的詞在頂部並且較不頻繁使用的詞靠近底部的次序列出候選詞。另外，在系統指示用諸如姓等關鍵詞來糾正第一字符802時，系統將檢測到該關鍵詞並調整對後續字符候選列表的糾正。在這種情況下，在糾正其餘字符時，用於名的字符將提升到候選列表902的頂部。如上所述，用戶隨後可以通過說出相關聯的索引號來選擇所需字符，諸如與第二候選相關聯的"二"或"二號"以獲得"薰"。此後，所選候選替換舊字符且發音面板1100將被清除，並且列表框902將從對話框中移除。如果SR不正確地識別了發音，則嚮導將基於上述混淆矩陣來顯示最接近的音素。圖12示出所呈現的用於糾正所說出的發音的拼寫對話框面板1200的屏幕截圖。用戶可以通過說來表達要糾正的音素以與嚮導進行交互，例如"更正第一個音"。第一音素1202隨後將被加亮。音素列表框1204隨後將被呈現為具有以音素距離為次序的音素列表。用戶隨後可以說出"〈"(等於拼音中的"qi")，以使第一誤識別的音素1202被正確的音素"〈"替換，如列表框1204中的經索引的"1"。圖13示出基於對所說出的發音的糾正來呈現的具有修訂的同音字列表框902的拼寫對話框面板1300的屏幕截圖。基於改變的音素來糾正同音字符列表框902。接著，用戶通過說出相關聯的號碼來選擇圖14中示出的第一字符1402，如在該情況下是"一"或"一號"。因此，所選候選替換原始字符且發音域1102將被清除，並且列表框902將從對話框中移除。圖14示出在光標移動到下一字符以對所說出的發音進行處理或在圖13的處理完成時所呈現的拼寫對話框面板1400的屏幕截圖。如此處所描述的，名字可能需要拼寫嚮導，因為每一用戶不會精確知道名字中所使用的字符。因此，提示可以從名字中獲得並提供。例如，在某些情況下，可能只有幾百個類型的姓值得考慮，並且如上所述，已經知道該集合是固定的。因此，在選擇總是詞/字符串的第一字符的姓時，列表框中所顯示的字符候選列表將被調整。例如，對於使用'fan'的名字，該字符可以是凡、繁、煩、藩、犯等。對於大多數字符，用戶將選擇正面或中性意義的名字，在以上前兩個示例中示出。然而，如果訓練數據是從報紙上獲得的(這是大多數當前語言訓練系統的情況)，該字符可能與具有很高頻率計數的最後的意義"犯"相關聯。因此，通過在數據文件中提供類別信息，詞的列表可以根據提示來調整。可被考慮的提示包括但不限於個人名字(例如姓)、街道名稱(例如利用路、街、市和縣)、以及公司/組織名稱(例如利用公司和院)。當用戶更熟悉或精通在拼寫模式中用多個字符來選擇詞並且基於有限的字符序列來正確地解析該詞(以尋找詞邊界)時，以上場景更易於由所公開的系統來處理(或識別)。如果用戶只從多個字符的詞中選擇一個字符，則該系統可能丟失該新詞的詞邊界信息。上述第二方法通過包含所需字符的詞的語音輸入來獲得中文字符。圖15示出根據第二方法將正面、中性、和負面意義用於字符加權的系統1500。圖15的識別組件102示出多個亞洲語言引擎502，其中第一引擎504使用詞中的字符方法404，該方法又使用數據文件1502來提供數據。每一語言引擎502都可以使用數據文件1502來基於詞中的字符方法404獲得字符。第一數據文件1504包括正面和中性意義的詞，第二數據文件1506包括負面意義的詞，而第三數據文件1508包括詞典中的不是這兩個數據文件(1504和1506)的一部分的其餘詞。根據詞中的字符方法404，和/或除提供發音來獲得字符之外，用戶還可以通過給出包含所需字符的其它詞來獲得字符。類似於"a,asinapple"用戶可以諸如通過說出包含所需字符"薰"的詞"薰陶的薰"指定該字符。"薰陶"是包含所需字符"薰"的詞。詞"的"是指示所需字符是該詞的一部分的所有格形式。為獲得SR識別準確度，具有關於往往用來指定字符的詞的信息或數據是合乎需要的。在許多情況下，往往使用最頻繁使用的詞以及具有正面語義的詞來指定字符。以下是可以獲得CFG的詞的方式。可以收集名字的大型語料庫，以具有這些名字中通常將使用的字符的列表。此外，該語料庫應當是有效字符的小子集。另外，識別準確度可以通過尋找詞的包含該字符的大型語料庫，隨後將這些詞分組到包括正面或中性意義的第一組或文件1504和包括負面意義的第二組或文件1506來改進。往往使用具有正面或中性意義的詞來指定名字中使用的字符。系統1500可包括向詞分配加權數據或值的加權組件1510。隨後可以向正面和中性意義分配較高的加權值，向負面意義分配中間加權值，並向詞典中的不包含通常在名字中使用的字符的其餘詞分配較低加權值。此外，這三個組中的詞可以使用圖5的頻率組件514以基於詞使用頻率來排序。該方法例如適用於中文以及日文中的漢字。在UI光標處於拼寫窗口的頂部(或拆分或中文)面板中的各字符(諸如802、1002和1402中的各字符)中的一個的上方時，該方法活動。即，用戶可以提供發音或者包含該字符的詞以最終獲得所需字符。上述第三方法406提供詞分解來獲得中文字符。圖16示出根據第三方法按所需字符的子分量的語音輸入來採用詞分解的系統1600。識別組件102示出多個亞洲語言引擎502，其中第一引擎504使用字符分解方法406，該方法又利用數據文件1602來提供數據。每一語言引擎502都可以使用數據文件1602來基於字符分解方法406獲得字符。第一數據文件1604包括可分解字符而第二數據文件1606包括字符的組成分量。用戶可以通過說"木子；李"來指定"李"以通過提供詞的子分量來獲得所需字符，其中"木"和"子"是組合形成"李"的子分量符號；"木"是該字符的頂部符號而"子"是底部符號。可以理解，可分解並且用戶還普遍使用的字符並不很多。因此，將收集可被分解的所有字符和普遍使用的可分解表達式並將其包括在語法中。類似於第二方法404，在光標處於拼寫嚮導面板的拆分面板的頂部面板中的各字符(諸如802、1002和1402中的各字符)中的一個的上方時，第三方法406可以活動。換言之，用戶可以通過發音或包含詞、或子分量來得到所需字符。系統1600包括用於尋找、處理和存儲流行字符1604並將這些字符分解成組成分量1606的流行性組件1608。簡要參考圖2，共享組件208允許用戶共享本地詞典，以改進其他用24戶的SR準確度或減少他們的糾正努力。在用戶使用本體系結構的各方面時，該用戶可以"教導"該系統，或該系統可以學習該用戶的活動和/或系統數據/參數(例如，使用圖3的推斷組件302的學習和推理能力)。如用戶所指示的，所識別的詞的概率可以改變，以示出哪些詞被最頻繁地使用。另外，如果詞未出現在圖2的默認詞典202中，則用戶可以將其添加到詞典的用戶定義的部分。此時，用戶可以"告訴"語音識別器102在詞典中的哪裡(例如默認或用戶定義的)可以找到附加的詞。跨多個用戶共享、加載、以及上傳新詞典的能力方便提供持續改進的分布式語料庫。換言之，每一用戶將使用心疼或類似的詞來"教導"各個用戶計算機和方法。例如，在組或協作環境中，與其他用戶共享用戶定義的詞典是有好處的。例如，在團隊項目的上下文中，隨著用戶用新詞更新相關聯的用戶詞典，共享可以將這些新詞傳播給項目團隊的其他成員。共享可以用多種方式來執行，包括在其中在多個用戶之間共享單個文件以及批量共享對逐詞共享的中央位置。除域另一用戶或團隊共享之外，所公開的體系結構的共享組件208包括向供應商實體提供關於語音識別器102學習了什麼的反饋，以使供應商可以改進默認詞典的能力。為此，語音識別器102可包括允許用戶指示向用戶定義的詞典添加的新詞是否可以在用戶系統、項目團隊、禾P/或公司邊界之外共享的機制。如果允許，則識別器102可以將該信息發送到供應商，以供審閱並包括在下一公共發行或更新的默認詞典中。然而，如果用戶不允許這一點，則不向供應商發送新添加的項。可以發送到供應商的項的示例是社區中最近變得流行的新的工業範圍的詞，而專用詞的示例可以是公司名稱或項目的內部名稱。應當考慮安全問題以確保共享不違反例如智慧財產權規章、共享的內容的範圍、以及共享的決策過程。所公開的體系結構還方便使用和實現不同亞洲語字符集的命令。例如，日語具有四種不同類型的書寫系統平假名、片假名、日文漢字和日文羅馬字。平假名可被認為是日文語音系統，並且也是有效的書寫系統(類似於西班牙語，其中用戶寫的即是該詞聽起來的)。片假名是較正式的書寫系統，其具有到平假名的一對一映射。日文漢字通常用於書寫名字。類似於中文，一組平假名聲音可對應於日文漢字中的多個同音字。因此，可以採用相同的拼寫面板和過程來從平假名獲得日文漢字。此外，並非像在中文中一樣提供同音字功能，將給出平假名和片假名的按鈕，以便如果用戶只想要平假名或對應的片假名，則可以利用在拆分面板方法(圖17中的1708或圖18中的1806)的頂部詞面板中得到詞的語音命令能力或按鈕。可以有一個按鈕或選擇器供用戶選擇和/或根據按鈕名稱的語音命令來將平假名轉換成日文羅馬字。因為一組平假名可以對應於多個日文羅馬字字符，所以在用戶說出例如"口一7字"("日文羅馬字")等平假名發音以觸發日文羅馬字轉換時，用於列出曰文漢字的同音字的列表框將被清除並用日文羅馬字的結果來重新填充。隨後，用戶可以說所需日文羅馬字字符前的索引號來將該日文羅馬字字符移動到頂部詞面板(圖17中的1708或圖18中的1806)。例如，對於諸如"土"，該字符在平假名、片假名、日文漢字、曰文羅馬字等四種書寫系統的輸出如下平假名，6片假名日文羅馬字tsuchi、tuchi、tuti日文漢字土存在共享同一發音(同一片假名)的其它日文漢字，例如，日文漢字同音字槌、鎚、壌、椎圖17示出所呈現的用於通過平假名的語音/鍵入輸入來進行日語識別和處理以獲得日文漢字的拼寫對話框面板1700的屏幕截圖。面板1700包括指示使用平假名的標題欄^力、'《入力"冬A)。列表框1704示出日文羅馬字詞列表的日文漢字同音字列表或圖18中的1802。串1706告訴用戶使用平假名作為輸入來處理到所需書寫系統的轉換。詞面板1708存儲輸26入到詞處理器應用程式的最終字符。發音域1710示出所識別的輸入以供處理。面板1700還包括以下選擇器日文羅馬字(a—7字)(R)1712、平假名(^6力；&)(H)選擇器1714、片假名(力夕力於)(K)選擇器1716、確定(OK)(0)選擇器1718、以及取消(*^>七A)(E)選擇器1720。為獲得日文漢字字符，用戶可以說出"O6力；&入力"冬^"("平假名輸入面板")以觸發嚮導拼寫面板1700，隨後說出"，6"(平假名中的"土")，這作為反饋在發音域1710中呈現給用戶(此後，列表框1704將自動地說出日文漢字同音字符的列表，每一字符前具有數字索引)。用戶隨後可以說出"l番"("第一個")來使列表框1704中的第一個詞"土"被移動到詞面板域1708。列表框1704此後不再展示。用戶隨後可以說"確定"來關閉拼寫面板1700，並且使用當前使用的任何文字處理程序來將詞面板1708中的詞"土"複製到文檔中。為獲得平假名，用戶可以說^力；《入力八°木A"以觸發拼寫面板1700的啟動。在用戶說出"，6"以使"，6"呈現在發音域1710中時，列表框1704將自動地生成日文漢字同音字符的列表作為默認列表；然而，用戶可以選擇忽略該列表。接著，用戶可以說出^力5&"("平假名")並且1710中所識別的"，^"將自動地被移動到詞面板1708。列表框1704隨後將被移除，因為不再需要它了。通過說"OK(確定)"，用戶使對話框拼寫面板1700關閉，並且詞面板1708中的詞將被複製到當前打開的文檔中。為獲得片假名，用戶可以說出^力；^入力"冬A"以觸發拼寫面板1700的啟動。在用戶說出"，6"以使"，6"呈現在發音面板域1710中時，列表框1704將自動地生成日文漢字同音字符的列表；然而，用戶可以選擇忽略該列表。接著，用戶可以說"力夕力於"("片假名")，並且系統將獲得片假名版本千"(片假名中的"土")，並且該系統將在詞面板1708中直接寫f"。隨後可以使列表框1704消失，因為不再需要它了。用戶可以選擇"OK"來關閉拼寫面板1700，並且詞面板1708中的詞將經由現有文字處理器來複製到文檔中。圖18示出所呈現的用於與獲得日文羅馬字相關的日語識別和處理的拼寫對話框面板1800的屏幕截圖。為獲得日文羅馬字，用戶可以說"^b力、'&入力"木A"以觸發拼寫面板1800來打開。在用戶說出"，6"以使"，6"呈現在發音面板域1804中時，列表框1802將在列表框1802中自動地生成日文漢字同音字符的列表；然而，用戶可以忽略該列表。如果用戶說出"a—T字"("日文羅馬字")，則系統會將"，6"轉換成曰文羅馬字版本。因為存在日文羅馬字版本的多個候選，所以用日文羅馬字的候選替換列表框1802中的日文漢字候選。用戶隨後可以說出"l番"以獲得列表框1802中的第一個詞，以使"tsuchi"移動到詞面板1806。隨後可以使列表框1802消失。如果用戶說"OK"，則拼寫面板1800關閉，並且詞面板1806中的詞將被複製到文檔中或當前正在使用的文字處理器中。儘管參考如屏幕截圖的各個附圖示出並描述了向用戶顯示信息的一些方式，但相關領域的技術人員可以認識到，可採用各種其它替換方案。術語"屏幕"、"屏幕截圖"、"網頁"、"文檔"和"頁面"在本文中一般可互換使用。頁面或屏幕作為顯示描述、作為圖形用戶界面或通過描繪屏幕(例如，無論是個人計算機、PDA、行動電話還是其它合適的設備)上的信息的其它方法被存儲和/或傳輸，其中要顯示在頁面上的布局和信息或內容被存儲在存儲器、資料庫或另一存儲設施中。圖19示出根據所公開的體系結構的識別語音的方法。儘管出於解釋簡明的目的，此處例如以流圖或流程圖形式示出的一個或多個方法被示出並描述為一系列動作，但是可以理解和明白，這些方法不受動作的次序的限制，因為根據本發明，某些動作可以按與此處所示並描述的不同的次序和/或與其它動作同時發生。例如，本領域技術人員將會明白並理解，方法可被替換地表示為一系列相互關聯的狀態或事件，諸如以狀態圖的形式。此外，並非一方法中所示的所有動作都是對於新穎實現所必需的。在1900處，語音識別引擎接收亞洲語語音形式的語音輸入。在1902處，對亞洲語語音信號進行識別處理以輸出結果。在1904處，進入拼寫/糾正模式來拼寫新詞或糾正結果。在1906處，基於語音發音和/或字符選擇來單遍糾正結果的拼寫。在1908處，隨後將經糾正的結果輸出到文檔或應用程式。圖20示出使用拼寫嚮導來糾正識別結果的方法。在2000處，識別引擎接收亞洲語語音輸入。在2002處，對亞洲語語音信號進行識別處理，並進入糾正模式以糾正結果的拼寫。在2004處，啟動拼寫嚮導作為糾正模式的一部分。在2006處，通過語音發音來將亞洲語字符輸入到嚮導。在2008處，經由嚮導基於語音發音來糾正拼寫。圖21示出將語音發音轉換成字符的方法。在2100處，開始為轉換過程準備數據文件。在2102處，創建經索引的詞和詞值的數據文件，該值包括發音、音調、使用頻率、以及類別。在2104處，按照使用頻率的次序來創建經索引的發音和具有發音作為值的詞的數據文件。在2106處，創建音素距離的混淆矩陣的數據文件。在2108處，訪問數據文件以經由拼寫嚮導進行發音處理。圖22示出在亞洲語和英語中使用拆分命令來進行糾正處理的方法。在2200處，呈現亞洲語和英語兩者中的拆分命令。在2202處，進行是否要進入英文拼寫糾正模式的檢査。如果是，則在2204處，進入英文拼寫模式。在2206處，通過拼寫模式中可用的方法基於語音信號來呈現候選字符列表。在2208處，基於所選候選來拼寫新詞或糾正誤識別的詞。如果在2202處，未進入英文拼寫模式，則流程去到2210以進入亞洲語拼寫模式，並如上所述隨後去到2206以繼續。圖23示出在亞洲語拼寫嚮導中使用同音字命令的方法。在2300處，呈現亞洲語和英語兩者中的拆分命令。在2302處，進入亞洲語拼寫糾正模式。在2304處，接收同音字命令。在2306處，基於目標字符的同音字字符來呈現候選字符的列表。在2308處，基於所選候選來糾正誤識別的詞。圖24示出將加權值應用於詞意義的方法。在2400處，開始準備通過包含所需字符的詞來進行糾正。在2402處，收集名字的大型語料庫。在2404處，尋找包含名字中的字符的詞。在2406處，將詞分組到正面和中性意義的文件中。在2408處，將詞分組到負面意義的文件中。在2410處，將高加權應用於正面和中性意義組中的詞。在2412處，將中等加權應用於負面意義組中的詞。在2414處，將低加權應用於不在這兩組中的詞。在2416處，根據使用頻率來對詞進行排序。圖25示出共享經更新的詞典的方法。在2500處，進入糾正模式。在2502處，跟蹤和記錄糾正模式期間所採用的新詞。在2504處，將新詞輸入到本地詞典中。在2506處，隨後將經更新的詞典傳送給其他用戶。在2508處，用戶可以將經更新的詞典傳送給供應商以更新分發詞典語料庫。圖26示出將字符分解用於拼寫糾正的方法。在2600處，啟動拼寫糾正模式。在2602處，用戶說出所需字符的子分量符號。在2604處，該方法循環通過子分量和相應字符之間的關係的對應的表。在2606處，如果存在超過一個匹配，則呈現子分量的所有可能的字符。在2608處，隨後基於子分量來選擇候選字符。圖27A和27B示出基於用於拼寫糾正的多個方法來進行糾正處理的方法。在2700處，引擎接收亞洲語語音輸入。在2702處，在UI中呈現所識別的引擎結果。在2704處，系統接收進入拼寫/糾正模式的語音命令(直接輸入新詞)。流程隨後去到2706，在此，為詞上下文處理同樣的和/或其它字符。另選地，流程可以從2702去到2708，在此，系統接收選擇詞來糾正的語音命令。在2710處，系統接收進入拼寫模式和選擇並糾正字符的語音命令。如上所述，流程隨後去到2706，在此，為詞上下文處理同樣的和/或其它字符。移到圖27B，在2712處，基於所計算的上下文來訪問可能的詞列表。例如，上下文可以是個人名字。在2714處，基於同樣的和/或其它字符來對詞列表的字符進行排序。在2716處，選擇對字符進行選擇的方法。在2718處，流程可以行進到2720，在2720中，選擇在其中以類似用法說出包含字符的詞的方法。另選地，在2722處，選擇通過提供所需字符的發音來獲得字符的方法。另外，在2724處，選擇在其中按子分量來說出詞以獲得字符的方法。或者，在2726處，選擇說出(多個)詞以獲得同音字列表並從該同音字列表中進行選擇的方法。在2728處，添加新字符或隨後用所選字符替換拼錯的詞中的不正確的字符。在2730處，隨後從用戶接收對整個詞正確性的語音確認。在2732處，隨後使用正確的字符來糾正引擎結果。如在本申請中所使用的，術語"組件"和"系統"旨在表示計算機相關的實體，其可以是硬體、硬體和軟體的組合、軟體、或者執行中的軟體。例如，組件可以是但不限於，在處理器上運行的進程、處理器、硬碟驅動器、多個(光和/或磁存儲介質的)存儲驅動器、對象、可執行代碼、執行的線程、程序、和/或計算機。作為說明，運行在伺服器上的應用程式和伺服器都可以是組件。一個或多個組件可以駐留在進程和/或執行的線程內，且組件可以位於一臺計算機內上/或分布在兩臺或更多的計算機之間。現在參考圖28，示出了可用於執行根據所公開的體系結構的糾正處理的計算系統2800的框圖。為了提供用於其各方面的附加上下文，圖28及以下討論旨在提供對其中可實現該各方面的合適的計算系統2800的簡要概括描述。儘管以上描述是在可在一個或多個計算機上運行的計算機可執行指令的一般上下文中進行的，但是本領域的技術人員將認識到，新穎實施例也可結合其它程序模塊和/或作為硬體和軟體的組合來實現。一般而言，程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、組件、數據結構等等。此外，本領域的技術人員可以理解，本發明的方法可用其它計算機系統配置來實施，包括單處理器或多處理器計算機系統、小型計算機、大型計算機、以及個人計算機、手持式計算設備、基於微處理器的或可編程消費電子產品等，其每一個都可操作上耦合到一個或多個相關聯的設備。所示各方面也可以在其中某些任務由通過通信網絡連結的遠程處理設備來執行的分布式計算環境中實施。在分布式計算環境中，程序模塊可以位於本地和遠程存儲器存儲設備中。計算機通常包括各種計算機可讀介質。計算機可讀介質可以是可由計算機訪問的任何可用介質，且包括易失性和非易失性介質、可移動和不可移動介質。作為示例而非限制，計算機可讀介質可以包括計算機存儲介質和通信介質。計算機存儲介質包括以存儲如計算機可讀指令、數據結構、程序模塊或其它數據等信息的任何方法或技術實現的易失性和非易失性、可移動和不可移動介質。計算機存儲介質包括但不限於RAM、ROM、EEPROM、快閃記憶體或者其它存儲器技術、CD-ROM、數字視頻盤(DVD)或其它光碟存儲、磁帶盒、磁帶、磁碟存儲或其它磁存儲設備、或可以用於存儲所需信息並且可以由計算機訪問的任何其它介質。再次參考圖28，用於實現各方面的示例性計算系統2800包括計算機2802，計算機2802包括處理單元2804、系統存儲器2806和系統總線2808。系統總線2808向包括但不限於系統存儲器2806的各系統組件提供到處理單元2804的接口。處理單元2804可以是市場上可購買到的各種處理器中的任意一種。雙微處理器和其它多處理器體系結構也可用作處理單元2804。系統總線2808可以是若干種總線結構中的任一種，這些總線結構還可互連到存儲器總線(帶有或沒有存儲器控制器)、外圍總線、以及使用各類市場上可購買到的總線體系結構中的任一種的局部總線。系統存儲器2806包括只讀存儲器(ROM)2810和隨機存取存儲器(RAM)2812。基本輸入/輸出系統(BIOS)儲存在諸如ROM、EPROM、EEPROM等非易失性存儲器2810中，其中BIOS包含幫助諸如在啟動期間在計算機2802內的元件之間傳輸信息的基本例程。RAM2812還可包括諸如靜態RAM等高速RAM來用於高速緩存數據。計算機2802還包括內置硬碟驅動器(HDD)2814(例如，EIDE、SATA)，該內置硬碟驅動器2814還可被配置成在合適的機殼(未示出)中外部使用；磁軟盤驅動器(FDD)2816(例如，從可移動磁碟2818中讀取或向其寫入)；以及光碟驅動器2820(例如，從CD-ROM盤2822中讀取，或從諸如DVD等其它高容量光學介質中讀取或向其寫入)。硬碟驅動器2814、磁碟驅動器2816和光碟驅動器2820可分別通過硬碟驅動器接口2824、磁碟驅動器接口2826和光碟驅動器接口2828來連接到系統總線2808。用於外置驅動器實現的接口2824包括通用串行總線(USB)和IEEE1394接口技術中的至少一種或兩者。驅動器及其相關聯的計算機可讀介質提供了對數據、數據結構、計算機可執行指令等的非易失性存儲。對於計算機2802，驅動器和介質容納適當的數字格式的任何數據的存儲。儘管以上對計算機可讀介質的描述涉及HDD、可移動磁碟以及諸如CD或DVD等可移動光學介質，但是本領域的技術人員應當理解，示例性操作環境中也可使用可由計算機讀取的任何其它類型的介質，諸如zip驅動器、磁帶盒、快閃記憶體卡、盒式磁帶等等，並且任何這樣的介質可包含用於執行所公開的體系結構的新穎方法的計算機可執行指令。多個程序模塊可存儲在驅動器和RAM2812中，包括作業系統2830、一個或多個應用程式2832、其它程序模塊2834和程序數據2836。所有或部分作業系統、應用程式、模塊和/或數據也可被高速緩存在RAM2812中。應該明白，所公開的體系結構可以用市場上可購得的各種作業系統或作業系統的組合來實施。用戶可以通過一個或多個有線/無線輸入設備，例如鍵盤2838和諸如滑鼠2840等定點設備將命令和信息輸入到計算機2802中。輸入/輸出設備可包括話筒/揚聲器2837和其它設備(未示出)，例如，IR遙控器、操縱杆、遊戲手柄、指示筆、觸控螢幕等等。這些和其它輸入設備通常通過耦合到系統總線2808的輸入設備接口2842連接到處理單元2804，但也可通過其它接口連接，如並行埠、IEEE1394串行埠、遊戲埠、USB埠、IR接口等等。監視器2844或其它類型的顯示設備也經由接口，諸如視頻適配器2846連接至系統總線2808。除了監視器2844之外，計算機通常包括諸如揚聲器、印表機等其它外圍輸出設備(未示出)。計算機2802可使用經由有線和/或無線通信至一個或多個遠程計算機，諸如遠程計算機2848的邏輯連接在網絡化環境中操作。遠程計算機2848可以是工作站、伺服器計算機、路由器、個人計算機、可攜式計算機、基於微處理器的娛樂設備、對等設備或其它常見的網絡節點，並且通常包括相對於計算機2802描述的許多或所有元件，儘管為簡明起見僅示出了存儲器/存儲設備2850。所描繪的邏輯連接包括到區域網(LAN)2852和/或例如廣域網(WAN)2854等更大的網絡的有線/無線連接。這一LAN和WAN連網環境常見於辦公室和公司，並且方便了諸如內聯網等企業範圍計算機網絡，所有這些都可連接到例如網際網路等全球通信網絡。當在LAN連網環境中使用時，計算機2802通過有線和/或無線通信網絡接口或適配器2856連接到區域網2852。適配器2856可以方便到LAN2852的有線或無線通信，並且還可包括其上設置的用於與無線適配器2856通信的無線接入點。當在WAN連網環境中使用時，計算機2802可包括數據機2858，或連接到WAN2854上的通信伺服器，或具有用於通過WAN2854，諸如通過網際網路建立通信的其它裝置。或為內置或為外置以及有線和/或無線設備的數據機2858經由串行埠接口2842連接到系統總線2808。在網絡化環境中，相對於計算機2802所描述的程序模塊或其部分可以存儲在遠程存儲器/存儲設備2850中。應該理解，所示網絡連接是示例性的，並且可以使用在計算機之間建立通信鏈路的其它手段。計算機2802可用於與操作上設置在無線通信中的任何無線設備或實體通信，這些設備或實體例如有印表機、掃描儀、臺式和/或可攜式計算機、可攜式數據助理、通信衛星、與無線可檢測標籤相關聯的任何一個設備或位置(例如，公用電話亭、報亭、休息室)以及電話機。這至少包括Wi-Fi和藍牙TM無線技術。由此，通信可以如對於常規網絡那樣是預定義結構，或者僅僅是至少兩個設備之間的自組織(adhoc)通信。現在參考圖29，示出了用於根據所公開的體系結構的糾正處理的示例性計算環境2900的示意性框圖。系統2900包括一個或多個客戶機2902。客戶機2902可以是硬體和/或軟體(例如，線程、進程、計算設備)。例如，客戶機2902可容納cookie和/或相關聯的上下文信息。系統2900還包括一個或多個伺服器2904。伺服器2904也可以是硬體和/或軟體(例如，線程、進程、計算設備)。伺服器2904可以例如通過使用本體系結構來容納線程以執行變換。在客戶機2902和伺服器2904之間的一種可能的通信能夠以適合在兩個或多個計算機進程之間傳輸的數據分組的形式進行。數據分組可包括例如cookie和/或相關聯的上下文信息。系統2900包括可以用來使客戶機2902和伺服器2904之間通信更容易的通信框架2906(例如，諸如網際網路等全球通信網絡)。通信可經由有線(包括光纖)和/或無線技術來促進。客戶機2902操作上被連接到可以用來存儲對客戶機2902本地的信息(例如，cookie和/或相關聯的上下文信息)的一個或多個客戶機數據存儲2908。同樣地，伺服器2904可在操作上連接到可以用來存儲對伺服器2904本地的信息的一個或多個伺服器數據存儲2910。以上所描述的包括所公開的體系結構的各示例。當然，描述每一個可以想到的組件和/或方法的組合是不可能的，但本領域內的普通技術人員應該認識到，許多其它組合和排列都是可能的。因此，本新穎的體系結構旨在涵蓋所有這些落入所附權利要求書的精神和範圍內的更改、修改和變化。此外，就在說明書或權利要求書中使用術語"包括"而言，這一術語旨在以與術語"包含"在被用作權利要求書中的過渡此時所解釋的相似的方式為包含性的。權利要求1.一種計算機實現的轉換系統(100)，包括用於基於語音輸入來輸出亞洲語字符的語音識別組件(102)；以及用於基於所述語音識別組件的不正確的輸出來生成經糾正的輸出的糾正組件(104)。2.如權利要求1所述的系統，其特徵在於，所述糾正組件包括方便口頭或手動地進行用戶交互的用於選擇並糾正所述不正確的輸出的拼寫嚮導。3.如權利要求1所述的系統，其特徵在於，所述糾正組件接收與使用本地音標的詞發音相關的信息。4.如權利要求1所述的系統，其特徵在於，所述糾正組件接收有關如何通過提供所述字符在其中被使用的詞來書寫詞的信息。5.如權利要求1所述的系統，其特徵在於，所述糾正組件接收與如何組成所述字符相關的信息。6.如權利要求l所述的系統，其特徵在於，還包括採用基於概率和/或基於統計的分析來預測或推斷期望自動執行的動作的推斷組件。7.如權利要求1所述的系統，其特徵在於，還包括用於與其他用戶和詞典供應商共享經更新的詞典的共享組件。8.如權利要求1所述的系統，其特徵在於，還包括用於基於意義來對詞進行加權的加權組件。9.如權利要求1所述的系統，其特徵在於，還包括用於存儲使用頻率信息的頻率組件，所述糾正組件使用該使用頻率信息來提供候選字符的排序列表。10.如權利要求1所述的系統，其特徵在於，所述亞洲語字符具有中文或日文的書寫形式，該書寫形式包括具有相關聯的固定發音的象形文字。11.一種識別語音的計算機實現的方法，包括識別亞洲語語音信號來輸出結果(1902);進入拼寫/糾正模式以糾正所述結果的拼寫(1904);以及基於語音發音或字符選擇中的至少一個來單遍糾正所述結果的拼寫(l麵)。12.如權利要求11所述的方法，其特徵在於，還包括響應於接收到所述亞洲語語音信號來自動地進入所述拼寫/糾正模式，其中糾正模式包括接收所述語音發音的拼寫嚮導。13.如權利要求11所述的方法，其特徵在於，還包括應用存儲用於糾正所述拼寫的音素距離的混淆矩陣。14.如權利要求11所述的方法，其特徵在於，還包括使用發聲的同音命令來糾正所述拼寫。15.如權利要求11所述的方法，其特徵在於，還包括基於將詞分解成諸符號子分量來糾正所述拼寫。16.如權利要求11所述的方法，其特徵在於，還包括在糾正所述拼寫的同時發展新詞典，並將所述新詞典傳送給另一用戶。17.如權利要求11所述的方法，其特徵在於，還包括基於所述亞洲語語音信號的語言來在多個書寫系統之間切換。18.如權利要求11所述的方法，其特徵在於，還包括基於包含所述字符的一個或多個詞的語音輸入來選擇該字符。19.如權利要求11所述的方法，其特徵在於，還包括生成候選字符的區分了優先次序的列表，並將所述候選字符作為經索引的列表來呈現以供通過手動地或通過語音命令中的一種方式來選擇。20.—種計算機實現的系統，包括用於識別亞洲語語音信號來輸出結果的計算機實現的裝置(102);用於進入拼寫/糾正模式來糾正所述結果的拼寫的計算機實現的裝置(302);用於執行關鍵字搜索的計算機實現的裝置(502);以及用於基於語音命令和手動字符選擇來單遍糾正所述結果的拼寫的計算機實現的裝置(104)。全文摘要一種用於在亞洲語言語音識別系統中糾正不正確的識別結果的體系結構。可以響應於接收到語音輸入來啟動一種拼寫模式，該拼寫模式用於糾正識別結果的不正確的拼寫或生成新詞。糾正可以通過語音和/或手動選擇和輸入來獲得。該體系結構方便單遍糾正，而非像常規系統中那樣多次糾正。使用該拼寫模式來糾正的詞是作為一個單元來糾正的並且被當作詞。該拼寫模式至少適用於亞洲大陸的語言，如簡體中文、繁體中文、和/或諸如日文等其它亞洲語言。文檔編號G06F17/28GK101669116SQ200880013543公開日2010年3月10日申請日期2008年4月8日優先權日2007年4月26日發明者A·奇特拉普,K·E·弗裡吉,S-Z·郭,T·美和,Y·宮申請人:微軟公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

用於生成亞洲語字符的識別體系結構的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法