新四季網

語音輸入的字詞級糾正的製作方法

2023-06-07 03:14:51

專利名稱:語音輸入的字詞級糾正的製作方法
技術領域:
本說明書涉及糾正從向計算設備的語音輸入轉錄的文字中的一個或者多個字詞。
背景技術:
語音輸入的轉錄是一種越來越流行的向計算設備中輸入信息的方式。對於移動計 算設備(比如行動電話和智慧型電話)而言甚至更是如此,其中可用於容用戶進行用戶輸入的接口不如桌面型計算機中的用戶接口(比如全尺寸鍵盤)那樣易於操縱。例如一些移動計算設備使用最小硬體鍵盤(例如完全QWERTY鍵盤的子集)、虛擬/軟體鍵盤(例如觸屏鍵盤)或者甚至十二個鍵的電話鍵區(例如ITU-T文字錄入)。通常,這些用戶輸入接口比傳統桌面型用戶接口更小,並且用戶經常使用他們的拇指來鍵入或者在鍵入之時看一個鍵打一個字。這可以至少部分說明越來越多地使用向移動計算設備的語音輸入。

發明內容
總體上,本文獻描述糾正從向計算設備的語音輸入轉錄的文字中的一個或者多個字詞。在一些實施方式中,計算設備是無線行動裝置(比如行動電話或者智慧型電話)。計算設備例如從用戶接收語音輸入並且向與計算設備分離的轉錄系統發送語音輸入。轉錄系統轉錄語音輸入並且向計算設備提供對應字詞網格。計算設備允許用戶使用來自字詞網格的替代字詞和/或短語對轉錄的文字中的一個或者多個字詞進行糾正。在第一方面中,一種用於糾正轉錄的文字中的字詞的計算機實施的方法包括從移動計算設備中的麥克風接收語音音頻數據。該方法還包括向轉錄系統發送來自移動計算設備的語音音頻數據。該方法還包括在移動計算設備接收轉錄系統從語音音頻數據轉錄的字詞網格。該方法還包括在移動計算設備的顯示器屏幕上呈現來自字詞網格的一個或者多個轉錄的字詞。該方法還包括在移動計算設備接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。該方法還包括響應於接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現來自字詞網格的用於所選轉錄的字詞的一個或者多個替代字詞。該方法還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括響應於接收替代字詞的用戶選擇,用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。實施方式可以包括以下特徵中的任何、所有或者零個特徵。該方法可以包括響應於接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現用於所選轉錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;並且響應於接收去除命令的用戶選擇,從呈現的轉錄的字詞去除所選轉錄的字詞。該方法可以包括在顯示器屏幕上呈現來自字詞網格的用於呈現的轉錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;並且響應於接收替代短語的用戶選擇,用所選替代短語取代呈現的轉錄的字詞。該方法可以包括響應於接收去除命令或者替代字詞的用戶選擇,自動基於所選替代字詞或者去除的轉錄的字詞從字詞網格選擇至少 一個新的替代短語;並且用新的替代短語取代呈現的替代短語。接收呈現的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現的字詞的用戶選擇和替代字詞的用戶選擇。字詞網格可以包括與轉錄的字詞和替代字詞對應的節點、在節點之間的邊,邊標識經過字詞網格的可能路徑,並且每個路徑可以具有路徑正確的關聯概率。該方法可以包括從字詞網格中所選轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用於所選轉錄的字詞的替代字詞。該方法可以包括從字詞網格中呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用於呈現的轉錄的字詞的替代短語。在第二方面中,一種在計算機可讀介質上編碼的電腦程式產品,可操作用於使一個或者多個處理器執行用於糾正轉錄的文字中的字詞的操作,操作包括從移動計算設備中的麥克風接收語音音頻數據。操作還包括向轉錄系統發送來自移動計算設備的語音音頻數據。操作還包括在移動計算設備接收轉錄系統從語音音頻數據轉錄的字詞網格。操作還包括在移動計算設備的顯示器屏幕上呈現來自字詞網格的一個或者多個轉錄的字詞。操作還包括在移動計算設備接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。操作還包括響應於接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現來自字詞網格的用於所選轉錄的字詞的一個或者多個替代字詞。操作還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。操作還包括響應於接收替代字詞的用戶選擇,用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。實施方式可以包括以下特徵中的任何、所有或者零個特徵。操作可以包括響應於接收轉錄的字詞的用戶選擇,在顯示器屏幕上呈現用於所選轉錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;並且響應於接收去除命令的用戶選擇,從呈現的轉錄的字詞去除所選轉錄的字詞。操作可以包括在顯示器屏幕上呈現來自字詞網格的用於呈現的轉錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;並且響應於接收替代短語的用戶選擇,用所選替代短語取代呈現的轉錄的字詞。操作可以包括響應於接收去除命令或者替代字詞的用戶選擇,自動基於所選替代字詞或者去除的轉錄的字詞從字詞網格選擇至少一個新的替代短語;並且用新的替代短語取代呈現的替代短語。接收呈現的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現的字詞的用戶選擇和替代字詞的用戶選擇。字詞網格可以包括與轉錄的字詞和替代字詞對應的節點、在節點之間的邊,邊標識經過字詞網格的可能路徑,並且每個路徑可以具有路徑正確的關聯概率。操作可以包括從字詞網格中所選轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用於所選轉錄的字詞的替代字詞。操作可以包括從字詞網格中呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用於呈現的轉錄的字詞的替代短語。在第三方面中,一種用於糾正轉錄的文字中的字詞的計算機實施的系統包括轉錄系統,可操作用於接收語音音頻數據並且作為響應將語音音頻數據轉錄成字詞網格。該系統還包括移動計算設備,移動計算設備包括麥克風,可操作用於接收語音音頻並且生成語音音頻數據,網絡接口,可操作用於向轉錄系統發送語音音頻數據並且作為響應從轉錄系統接收字詞網格,顯示器屏幕,可操作用於呈現來自字詞網格的一個或者多個轉錄的字詞,用戶接口,可操作用於接收轉錄的字詞中的至少一個轉錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,指令在由處理器執行時執行以下操作在顯示器屏幕上呈現來自字詞網格的用於所選轉錄的字詞的一個或者多個替代字詞;接收替代字詞中的至少一個替代字詞的用戶選擇;並且用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。這裡描述的系統和技術可以提供以下優點中的一個或者多個優點。首先,系統可以用最少用戶輸入(比如一個、兩個或者三個用戶輸入)對轉錄的文字中的一個或者多個字詞進行糾正。第二,系統可以提供在遠程轉錄系統的對語音輸入向文字的轉錄而在糾正轉錄的文字中的一個或者多個字詞期間無或者最少的與遠程轉錄系統的附加通信。第三,系統可以在具有有限輸入接口(比如小型觸屏)的計算設備中提供對轉錄的文字的糾正的高效用戶選擇。 在附圖和下文描述中闡述一個或者多個實施方式的細節。根據說明書和附圖並且根據權利要求書將清楚其它特徵和優點。


圖I是示出了用於糾正轉錄的文字中的一個或者多個字詞的系統的例子的示意圖。圖2是示出了用於糾正轉錄的文字中的一個或者多個字詞的移動計算設備的例子的框圖。圖3A-B是用於糾正轉錄的文字中的一個或者多個字詞的字詞網格的例子。圖4A-D是用於糾正轉錄的文字中的一個或者多個字詞的圖形用戶接口的例子。圖5是示出了用於糾正轉錄的文字中的一個或者多個字詞的過程的例子的流程圖。圖6示出了可以與在本文中描述的計算機實施的方法和系統結合使用的計算設備和移動計算設備的例子。在各圖中的相似標號指示相似要素。
具體實施例方式圖I是示出了用於糾正轉錄的文字中的一個或者多個字詞的系統100的例子的示意圖。一般而言,系統允許用戶的設備向伺服器系統發送語音的音頻數據並且讓伺服器系統發送回用於轉錄語音的可能解決方案的排列,從而如果第一建議解決方案不準確,則用戶可以容易替換被伺服器系統確定為其它可能解決方案的其它字詞或者字詞集。系統100包括通過網絡106與轉錄系統104通信的移動計算設備102。移動計算設備102從用戶接收語音音頻輸入並且將語音音頻轉換成語音數據輸出108。移動計算設備102通過網絡106向轉錄系統104發送語音數據輸出108。轉錄系統104將語音數據輸108轉錄成多個字詞並且在字詞網格110中排列字詞。字詞網格110包括用於語音數據輸出108轉錄的最可能或者最佳假設以及替代轉錄或者假設。轉錄系統104向移動計算設備102發送字詞網格110。移動計算設備102向用戶呈現來自字詞網格110的最可能轉錄。移動計算設備102然後從用戶接收一個或者多個字詞選擇112、呈現用於所選字詞的對應替代字詞並且從用戶接收一個或者多個替代選擇114。字詞選擇112指示向用 戶呈現的轉錄的文字中的一個或者多個不正確轉錄的字詞。在一些實施方式中,替代字詞是用於不正確字詞的下一最佳假設。響應於替代選擇114,移動計算設備102用所選替代字詞替換呈現的轉錄的文字中的不正確字詞。在一些實施方式中,移動計算設備102也呈現用於轉錄的文字的一個或者多個替代短語。例如替代短語可以是用於語音數據輸出108或者語音數據輸出108的包括多個字詞的部分的轉錄的下一最佳假設。移動計算設備102可以從用戶接收替代短語的選擇並且用所選替代短語取代呈現的轉錄的文字的對應部分。在一些實施方式中,移動計算設備102是行動電話或者智慧型電話並且包括有限的用戶輸入接口(比如小型QWERTY硬體鍵盤、小型觸屏或者數字鍵區)。移動計算設備102使用無線連接(比如蜂窩電話數據連接、Wi-Fi連接或者可以用於向轉錄系統104發送數據和從轉錄系統104接收數據的其它無線連接)來接入網絡106。在一些實施方式中,網絡106包括一個或者多個網絡(比如區域網、廣域網和/或網際網路)。網絡106中的一個或者多個網絡可以是無線的(比如蜂窩電話網絡或者Wi-Fi網絡)。轉錄系統104包括將語音數據輸出108轉錄成字詞網格110的語音識別器。一般而言,字詞網格110包括用於語音數據輸出108轉錄的多個假設。在一些實施方式中,字詞網格110包括特定字詞在轉錄的文字中出現於特定位置的一個或者多個加權因子或者概率。用於說話聲轉錄的每個假設代表經過字詞網格110的可能路徑。在一些實施方式中,從假設中的一個字詞向下一字詞的分叉點依賴於假設中的其它字詞。例如字詞網格110中的特定字詞可以具有依賴於假設中包括的其它字詞的多個權值或者概率。此外,字詞網格110可以包括用於字詞網格110中包括的字詞集或者來自字詞網格110的字詞的最可能組合的子集的所有可能假設。移動計算設備102選擇通過字詞網格110的最有可能路徑,並且向用戶呈現該假設。圖2是示出了用於糾正轉錄的文字中的一個或者多個字詞的移動計算設備200的例子的框圖。移動計算設備200包括負責呈現從用戶說話聲轉錄的文字並且用於接收一個或者多個用戶輸入以糾正轉錄的文字的字詞糾正模塊202。具體而言,移動計算設備200包括從用戶接收語音音頻輸入206的語音輸入接口204。例如語音輸入接口 204可以是將來自用戶的說話聲中的聲音轉換成語音數據輸出208的麥克風。語音輸入接口 204向字詞糾正模塊202傳遞語音數據輸出208,並且字詞糾正模塊202向轉錄系統發送語音數據輸出208。轉錄系統對語音數據輸出208執行語音識別操作以生成字詞網格210。轉錄系統向移動計算設備200發送字詞網格210。字詞糾正模塊202接收字詞網格210並且在顯示器接口 214中呈現來自字詞網格210的轉錄的文字212。在一些實施方式中,顯示器接口 214是硬體顯示器屏幕(比如液晶顯示器(IXD)屏幕)。呈現的轉錄的文字212包括來自字詞網格210的多個字詞,並且轉錄的字詞網格212包括待由用戶糾正的一個或者多個字詞。字詞糾正模塊202從用戶接收轉錄的文字212中的不正確字詞(即不是用戶說出的字詞)的選擇216。字詞糾正模塊202通過用戶輸入接口 218 (比如觸屏、跟蹤球或者其它指示設備或者鍵盤)接收選擇216。字詞糾正模塊202呈現用於選擇216的一個或者多個替代字詞220。字詞糾正模塊202使用顯示器接口 214來顯示替代字詞220。字詞糾正模塊202通過用戶輸入接口 218從用戶接收呈現的替代字詞之一的選擇222。字詞糾正模塊202用從替代字詞的選擇222取代從轉錄的文字212的選擇216並且在顯示器接口 214中向用戶呈現更新的轉錄的字
o圖3A是用於糾正轉錄的字詞中的一個或者多個字詞的字詞網格300的例子。這裡呈現字詞網格300為有限狀態轉錄器。字詞網格300包括與在字詞之間的可能邊界對應的一個或者多個節點302a-g。字詞網格300包括用於由字詞網格300產生的轉錄假設中的可能字詞的多個邊304a-I。此外,每個邊304a-I可以具有該邊是來自對應節點的正確邊的一個或者多個權值或者概率。權值由轉錄系統確定並且可以例如基於在語音數據與用於該邊的字詞之間的匹配的置信度以及字詞有多麼好地在語法和/或詞彙上與字詞網格300中的其它字詞相配。例如起初,經過字詞網格300的最可能路徑可以包括具有文字「We’re comingabout 11:30」的邊304c、304e、304i和304k。第二最佳路徑可以包括具有文字「deerhunting scouts 7:30」 的邊 304d、304h、304j 和 3041。每對節點可以具有與各種轉錄假設中的替代字詞對應的一個或者多個路徑。例如開始於節點302a並且結束於節點302c的在節點對之間的初始最可能路徑是邊304c 「we’re」。這一路徑具有包括邊304a_b 「we are」和邊304d 「deer」的替代路徑。因而邊304e 「coming」具有包括邊304f-g 「come at」和邊304h 「hunting」的替代字詞。邊304i 「about」具有包括邊304j 「scouts」的替代字詞,並且邊304k 「11:30」具有包括邊3041 「7:30」的替代字詞。 圖3B是用於糾正轉錄的文字中的一個或者多個字詞的字詞網格350的例子。字詞網格350是分層次的。字詞網格350包括多個節點352a-I,這些節點代表用於轉錄的文字的各種假設中的字詞。在節點352a-I之間的邊示出了可能假設包括節點352c、352e、352i和352k 「we,re coming about 11:30」、節點 352a、352b、352e、352i 和 352k 「we are comingabout 11:30,,、節點 352a、352b、352f、352g、352i 和 352k「we are come at about 11:30,,、節點 352d、352f、352g、352i 和 352k 「deer come at about 11:30」、節點 352d、352h、352j和 352k 「deer hunting scouts 11:30」以及節點 352d、352h、352j 和 3521 「deer huntingscouts 7:30」。同樣,在節點352a_I之間的邊可以具有基於語音識別的置信度和所得文字的語法/詞彙分析的關聯權值或者概率。在這一例子中,「we’re coming about 11:30」目前可以是最佳假設,並且「deer hunting scouts 7:30」可以是次最佳假設。可以在字詞網格350中進行將字詞及其替代分組在一起的一個或者多個劃分354a-d。例如劃分354a包括字詞「we,re」以及替代「we are」和「deer」。劃分354b包括字詞「coming」以及替代「comeat」和「hunting」。劃分354c包括字詞「about」和替代「scouts」,並且劃分354d包括字詞「11:30」 和替代 「7:30」。隨著用戶從最佳假設選擇字詞用於糾正而從其它假設選擇替代用於取代不正確字詞,其它假設之一可以變成最佳假設。例如,如果用戶選擇「we』 re」、然後選擇替代「deer」 以取代 「we,re,,,則 「deer hunting scouts 7:30」 可以變成最佳假設。在一些實施方式中,字詞糾正模塊僅呈現和/或允許用戶選擇如下替代,存在從這些替代到轉錄的文字中的其它字詞的邊。例如,如果當前呈現「we』 re coming about11:30」作為最佳假設,則字詞糾正模塊可以呈現「we are」而不是「deer」作為用於「we’re」的替代,因為「deer」無如下邊,該邊連接到轉錄的文字的其餘字詞「…coming about 11:30」。字詞「we are」具有通向「…coming about 11:30」的邊,因此包含於「we』 re」的替代列表中。在另一例子中,如果用戶選擇字詞「coming」用於糾正,則字詞糾正模塊可以擴展選擇以包括「we』 re coming」、然後呈現包括「we are come at」和「deer come at」的替代。圖4A是用於糾正轉錄的文字中的一個或者多個字詞的⑶I 400的例子。⑶I 400可以與接收文字輸入的應用(比如即時消息應用、電子郵件應用或者字處理器應用)關聯。⑶I 400包括文字輸入區域402和用於向文字輸入區域402中輸入文字的鍵盤404。在一些實施方式中,鍵盤404是觸屏鍵盤。在一些實施方式中提供GUI 400的計算設備可以包括用於向文字輸入區域402中進行輸入的物理鍵盤。此外,提供⑶I 400的計算設備可以接收發聲或者語音輸入。例如鍵盤404可以包括用於發起向文字輸入區域402中的語音到文字輸入的控制項或者圖標。字詞糾正模塊向轉錄系統發送接收的語音數據並且接收字詞。GUI 400在文字輸入區域402中呈現最佳假設「we,re coming about 11:30」。用戶可以通過選擇字詞來請求糾正字詞。例如用戶可以通過在屏幕上按壓來進行字詞「we’re」的選擇406。取而代之,⑶I 400可以具有用於選擇文字輸入區域402中的字詞的關聯指示設備或者其它導航控制項。⑶I在替代短語控制項408中呈現次最佳假設「Deer hunting scouts 7:30」。用戶可以選擇替代短語控制項408以用替代短語控制項408中所示文字取代文字輸入區域402中的轉錄的文字。圖4B是用於糾正轉錄的文字中的一個或者多個字詞的⑶I 420的例子。⑶I 420示出了來自字詞網格的用於所選字詞「we’re」的替代字詞的列表422。列表422包括替代「we are」和「deer」。列表422也包括用於從文字輸入區域402去除字詞而未用替代取代它的去除控制項。這裡,用戶對去除控制項進行選擇424以請求⑶I 420從文字輸入區域402去除字詞「we』 re」。圖4C是用於糾正轉錄的文字中的一個或者多個字詞的⑶I 440的例子。字詞糾正模塊已經更新⑶I 440以不再在呈現於文字輸入區域402中的轉錄假設中包括字詞「we’re」。此外,字詞糾正模塊已經基於文字輸入區域402中的由於用戶進行的糾正而產生的當前最佳假設來更新替代短語控制項408以包括新的次最佳假設「Come at about 11:30」。用戶可以對替代短語控制項408進行選擇442以請求用「come at about 11:30」取代文字輸入區域402中的文字。圖4D是用於糾正轉錄的文字中的一個或者多個字詞的⑶I 460的例子。字詞糾正模塊已經更新⑶I 460以包括通過用戶選擇替代短語控制項408來請求的新的最佳轉錄假設「Come at about 11:30」。在一些實施方式中,字詞糾正模塊允許用戶通過進行僅兩個簡單用戶輸入來糾正字詞。例如用戶可以觸控螢幕幕以選擇不正確字詞、然後第二次觸控螢幕幕以選擇用於取代不正確字詞的替代。在一些實施方式中,字詞選擇模塊可以響應於單個用戶輸入來糾正一個或者多個字詞。例如用戶可以選擇替代短語控制項408以用次最優假設取代最優假設。在另一例子中,當僅一個替代字詞存在時,字詞糾正模塊可以自動響應於選擇不正確字詞來取代不正確字詞而未提供替代列表。在又一例子中,當一個替代正確的概率明顯大於其它替代時,字詞糾正模塊可以自動響應於選擇不正確字詞用最佳替代取代不正確字詞而未提供替代列表。替代正確的概率明顯更大可以例如包括概率接近百分之一百的最佳替代和概率接近零的其它替代或者概率比次最佳替代大若干倍的最佳替代。在一些實施方式中,對字詞的長按可以指示應當從文字輸入區域402和假設去除字詞。取而代之,對不正確字詞的長按可以指 示對用次最佳替代取代不正確字詞的請求。圖5是示出了用於糾正轉錄的文字中的一個或者多個字詞的過程500的例子的流程圖。過程500可以例如由系統(比如系統100、移動計算設備200、字詞網格300和/或⑶I 400、420、440和460)執行。為了呈現清楚,下文描述使用系統100、移動計算設備200、字詞網格300和/或⑶I 400、420、440和460作為用於描述過程500的例子的基礎。然而另一系統或者系統組合可以用來執行過程500。過程500開始於從移動計算設備中的麥克風接收(502)語音音頻數據。例如用戶可以向蜂窩電話或者智慧型電話上的麥克風中輸入說話聲。過程500向轉錄系統發送(504)來自移動計算設備的語音音頻數據。例如移動計算設備102可以向轉錄系統104發送語音數據輸出108。過程500在移動計算設備接收轉錄系統從語音音頻數據轉錄的字詞網格。例如移動計算設備200可以接收從語音數據輸出208轉錄的字詞網格210。過程500在移動計算設備的顯示器屏幕上呈現(508)來自字詞網格的一個或者多個轉錄的字詞。例如字詞糾正模塊202可以在⑶I 400中呈現轉錄的文字212。如果過程500在移動計算設備接收(510)呈現的轉錄字詞中的至少一個轉錄的字詞的用戶選擇,則響應於接收轉錄的字詞的用戶選擇,過程500在顯示器屏幕上呈現(512)來自字詞網格的用於所選轉錄的字詞的一個或者多個替代字詞。例如字詞糾正模塊202可以接收轉錄的字詞「we』 re」的選擇406並且作為響應呈現替代字詞的列表422。過程500在移動計算設備接收(514)替代字詞中的至少一個替代字詞的用戶選擇。例如字詞糾正模塊202可以接收去除控制項的選擇424或者列表422中的替代字詞「weare」和「deer」中的一個或者多個替代字詞的選擇。響應於接收替代字詞的用戶選擇,過程500用所選替代字詞取代(508)呈現的轉錄的字詞中的所選轉錄的字詞。例如字詞糾正模塊202可以在GUI 440的文字輸入區域402中呈現更新的轉錄的文字「coming about 11:30」。圖6示出了可以用來實施這裡描述的技術的計算設備600和移動計算設備的例子。計算設備600旨在於代表各種形式的數字計算機(比如膝上型計算機、桌面型計算機、工作站、個人數字助理、伺服器、刀片伺服器、大型機和其它適當計算機)。移動計算設備旨在於代表各種形式的行動裝置(比如個人數字助理、蜂窩電話、智慧型電話和其它相似計算設備)。這裡所示部件、它們的連接和關係以及它們的功能是為了僅舉例並且不是為了限制本文中描述和/或要求保護的本發明的實施方式。計算設備600包括處理器602、存儲器604、存儲設備606、連接到存儲器604和多個高速擴展埠 610的高速接口 608以及連接到 低速擴展埠 614和存儲設備606的低速接口 612。處理器602、存儲器604、存儲設備606、高速接口 608、高速擴展埠 610和低速接口 612中的每個部件使用各種總線來互連並且可以裝配於公共母板上或者以如適當的其它方式來裝配。處理器602可以處理用於在計算設備600內執行的指令(包括存儲於存儲器604中或者存儲設備606上以在外部輸入/輸出設備(比如耦合到高速接口 608的顯示器616)上顯示CTI的圖形信息的指令)。在其它實施方式中,多個處理器和/或多個總線可以如適當的那樣與多個存儲器和存儲器類型一起使用。也可以連接多個計算設備而每個設備提供必需操作的部分(例如作為伺服器組、一組刀片伺服器或者多處理器系統)。存儲器604存儲計算設備600內的信息。在一些實施方式中,存儲器604是一個或者多個易失性存儲器單元。在一些實施方式中,存儲器604是一個或者多個非易失性存儲器單元。存儲器604也可以是另一形式的計算機可讀介質(比如磁碟或者光碟)。存儲設備606能夠提供用於計算設備600的海量存儲。在一些實施方式中,存儲設備606可以是或者包含計算機可讀介質(比如軟盤設備、硬碟設備、光碟設備或者磁帶設備、快閃記憶體或者其它相似固態存儲器設備或者設備陣列(包括在存儲區域網絡或者其它配置中的設備))。電腦程式產品可以有形地具體化於信息載體中。電腦程式產品也可以包含在被執行時執行一種或者多種方法(比如上文描述的方法)的指令。電腦程式產品也可以有形地具體化於計算機或者機器可讀介質(比如存儲器604、存儲設備606或者處理器602上的存儲器)中。高速接口 608管理用於計算設備600的帶寬密集操作,而低速接口 612管理較低帶寬密集操作。這樣的功能分配僅為舉例。在一些實施方式中,高速接口 608耦合到存儲器604、顯示器616 (例如通過圖形處理器或者加速器)並且耦合到可以接受各種擴展卡(未示出)的高速擴展埠 610。在該實施方式中,低速接口 612耦合到存儲設備606和低速擴展埠 614。可以包括各種通信埠(例如USB、藍牙、乙太網、無線乙太網)的低速擴展埠 614可以耦合到一個或者多個輸入/輸出設備(比如鍵盤、指示設備、掃描儀或者通過網絡適配器連接到網絡設備(比如交換機或者路由器))。可以如圖中所示以多個不同形式實施計算設備600。例如它可以實施為標準伺服器620或者多次實施於一組這樣的伺服器中。此外,它可以實施於個人計算機(比如膝上型計算機622)中。它也可以實施為機架伺服器系統624的部分。取而代之,來自計算設備600的部件可以與行動裝置(比如移動計算設備650)中的其它部件(未示出)組合。這樣的設備中的每個設備可以包含計算設備600和移動計算設備650中的一個或者多個設備,並且整個系統可以由相互通信的多個計算設備組成。移動計算設備650包括處理器652、存儲器664、輸入/輸出設備(比如顯示器654)、通信接口 666和收發器668以及其它部件。移動計算設備650也可以具有用於提供附加存儲的存儲設備(比如微驅動或者其它設備)。使用各種總線來互連處理器652、存儲器664、顯不器654、通信接口 666和收發器668中的每個部件,並且若干部件可以裝配於公共母板上或者如適當的那樣以其它方式來裝配。處理器652可以執行移動計算設備650內的指令(包括存儲於存儲器664中的指令)。處理器652可以實施為包括單獨和多個模擬和數字處理器的晶片的晶片組。處理器652可以例如提供移動計算設備650的其它部件的協調(比如控制用戶接口、移動計算設備650運行的應用和移動計算設備650的無線通信)。處理器652可以通過耦合到顯示器654的控制接口 658和顯示器接口 656來與用戶通信。顯示器654可以例如是TFT (薄膜電晶體液晶顯示器)顯示器或者OLED (有機發光二極體)顯示器或者其它適當顯示器技術。顯示器接口 656可以包括用於驅動顯示器654以向用戶呈現圖形和其它信息的適當電路。控制接口 658可以從用戶接收命令並且轉換它們用於向處理器652提交。此外,外部接口 662可以提供與處理器652的通信以便實現移動計算設備650與其它設備的近場通信。外部接口 662可以在一些實施方式中提供有線通 信或者在其它實施方式中提供無線通信,並且也可以使用多個接口。存儲器664存儲移動計算設備650內的信息。存儲器664可以實施為一個或者多個計算機可讀介質、一個或者多個易失性存儲器單元或者一個或者多個非易失性存儲器單元中的一項或者多項。擴展存儲器674也可以被提供並且通過可以例如包括SIMM (單列直插式存儲器模塊)卡接口的擴展接口 672連接到移動計算設備650。擴展存儲器674可以提供用於移動計算設備650的額外存儲空間或者也可以存儲用於移動計算設備650的應用或者其它信息。具體而言,擴展存儲器674可以包括用於實現或者補充上文描述的過程的指令並且也可以包括安全信息。因此例如擴展存儲器674可以被提供作為用於移動計算設備650的安全模塊並且可以用允許安全使用移動計算設備650的指令來編程。此外,可以經由SIMM卡將安全應用與附加信息一起提供(比如以不可黑客方式在SIMM卡上放置識別信息)。如上文討論的那樣,存儲器可以例如包括快閃記憶體和/或NVRAM存儲器(非易失性隨機存取存儲器)。在一些實施方式中,電腦程式產品有形地具體化於信息載體中。電腦程式產品包含在執行時執行一種或者多種方法(比如上文描述的方法)的指令。電腦程式產品可以是計算機或者機器可讀介質(比如存儲器664、擴展存儲器674或者處理器652上的存儲器)。在一些實施方式中,可以例如通過收發器668或者外部接口 662在傳播的信號中接收電腦程式產品。移動計算設備650可以通過可以在必需時包括數位訊號處理電路的通信接口 666進行無線通信。通信接口 666可以提供在各種模式或者協議(比如GSM(全球移動通信系統)語音呼叫、SMS (短消息服務)、EMS (增強型消息接發服務)或者MMS消息接發(多媒體消息接發服務)、CDMA (碼分多址)、TDMA (時分多址)、I3DC (個人數字蜂窩)、WCDMA (寬帶碼分多址)、CDMA2000或者GPRS (通用分組無線電服務)以及其它模式或者協議)之下的通信。這樣的通信例如可以通過使用射頻的收發器668來出現。此外,短程通信可以比如使用藍牙、WiFi或者其它這樣的收發器(未示出)來出現。此外,GPS(全球定位系統)接收器模塊670可以向移動計算設備650提供附加的與導航和位置有關的無線數據,該數據可以如適當的那樣由在移動計算設備650上運行的應用使用。移動計算設備650也可以使用音頻編碼解碼器660來可聽地通信,該編碼解碼器可以從用戶接收口頭信息並且將它轉換成可用數字信息。音頻編碼解碼器660可以類似地比如通過例如移動計算設備650的聽筒中的揚聲器生成用於用戶的可聽聲音。這樣的聲音可以包括來自語音電話呼叫的聲音、可以包括記錄的聲音(例如語音消息、音樂文件等)並且也可以包括由在移動計算設備650上操作的應用生成的聲音。可以如圖中所示以多個不同形式實施移動計算設備650。例如它可以實施為蜂窩電話680。它也可以實施為智慧型電話682、個人數字助理或者其它相似行動裝置的部分。這裡描述的系統和技術的各種實施方式可以實施於數字電子電路、集成電路、專門設計的ASIC(專用集成電路)、計算機硬體、固件、軟體和/或其組合中。這些各種實施方式可以包括在包括可以是專用或者通用的至少一個可編程處理器(該處理器被耦合成從 存儲系統、至少一個輸入設備和至少一個輸出設備接收數據和指令並且向存儲系統、至少一個輸入設備和至少一個輸出設備發送數據和指令)的可編程系統上可執行和/或可解譯的一個或者多個電腦程式中的實施方式。這些電腦程式(也稱為程序、軟體、軟體應用或者代碼)包括用於可編程處理器的機器指令並且可以用高級過程和/或面向對象的程式語言和/或用彙編/機器語言來實施。如這裡所用,術語機器可讀介質和計算機可讀介質指代用來向可編程處理器提供機器指令和/或數據的任何電腦程式產品、裝置和/或設備(例如磁碟、光碟、存儲器、可編程邏輯器件(PLD))(包括接收作為機器可讀信號的機器指令的機器可讀介質)。術語機器可讀信號指代用來向可編程處理器提供機器指令和/或數據的任何信號。為了提供與用戶的交互,這裡描述的系統和技術可以實施於如下計算機上,該計算機具有用於向用戶顯示信息的顯示器設備(例如CRT (陰極射線管)或者LCD (液晶顯示器)監視器)以及用戶可以向計算機提供輸入的鍵盤和指示設備(例如滑鼠或者跟蹤球)。其它種類的設備也可以用來提供與用戶的交互;例如向用戶提供的反饋可以是任何形式的感官反饋(例如視覺反饋、聽覺反饋或者觸覺反饋);並且可以用包括聲學、語音或者觸覺輸入的任何形式接收來自用戶的輸入。這裡描述的系統和技術可以實施於如下計算系統中,該計算系統包括後端部件(例如作為數據伺服器)或者包括中間件部件(例如應用伺服器)或者包括前端部件(例如具有如下圖形用戶接口或者Web瀏覽器的客戶端計算機,用戶可以通過該圖形用戶接口或者Web瀏覽器來與這裡描述的系統和技術的實施交互)或者這樣的後端、中間件或者前端部件的任何組合。系統的部件可以由任何數字數據通信形式或者介質(例如通信網絡)互連。通信網絡的例子包括區域網(LAN)、廣域網(WAN)和網際網路。計算系統可以包括客戶端和伺服器。客戶端和伺服器一般相互遠離並且通常通過通信網絡交互。客戶端和伺服器的關係藉助在相應計算機上運行並且相互具有客戶端-伺服器關係的電腦程式來產生。雖然上文已經具體描述少數實施方式,但是其它修改是可能的。此外,在圖中描繪的邏輯流程無需所示特定順序或者依次順序以實現希望的結果。此外,可以提供其它步驟或者可以從描繪的流程消除步驟,並且可以向描述的系統添加或者從描述的系統去除其它部件。因而其它實施方式在所附權利要求的範圍內。
權利要求
1.一種計算機實施的方法,用於糾正轉錄的文字中的字詞,所述方法包括 從移動計算設備中的麥克風接收語音音頻數據; 向轉錄系統發送來自所述移動計算設備的所述語音音頻數據; 在所述移動計算設備接收由所述轉錄系統從所述語音音頻數據轉錄的字詞網格;在所述移動計算設備的顯示器屏幕上呈現來自所述字詞網格的一個或者多個轉錄的字詞; 在所述移動計算設備接收對所述呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇; 響應於接收到對所述轉錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現來自所述字詞網格的用於所述選擇的至少一個字詞的一個或者多個替代字詞; 在所述移動計算設備接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及響應於接收到對所述至少一個替代字詞的所述用戶選擇,用所述選擇的替代字詞取代所述呈現的轉錄的字詞中的所述選擇的轉錄的字詞。
2.根據權利要求I所述的方法,還包括 響應於接收到對所述轉錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現用於所述選擇的轉錄的字詞的去除命令; 在所述移動計算設備接收對所述去除命令的用戶選擇;以及 響應於接收到對所述去除命令的所述用戶選擇,從所述呈現的轉錄的字詞去除所述選擇的轉錄的字詞。
3.根據權利要求2所述的方法,還包括 在所述顯示器屏幕上呈現來自所述字詞網格的用於所述呈現的轉錄的字詞的至少一個替代短語; 在所述移動計算設備接收對所述替代短語的用戶選擇;以及 響應於接收到對所述替代短語的所述用戶選擇,用所述選擇的替代短語取代所述呈現的轉錄的字詞。
4.根據權利要求3所述的方法,還包括 響應於接收到對所述去除命令或者所述替代字詞的所述用戶選擇,自動基於所述選擇的替代字詞或者所述去除的轉錄的字詞從所述字詞網格選擇至少一個新的替代短語;以及用所述新的替代短語取代所述呈現的替代短語。
5.根據權利要求I所述的方法,其中接收對所述呈現的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇包括通過所述移動計算設備的觸屏接口接收對所述呈現的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇。
6.根據權利要求I所述的方法,其中所述字詞網格包括與所述轉錄的字詞和所述替代字詞對應的節點、在所述節點之間的邊,所述邊標識經過所述字詞網格的可能路徑,並且每個路徑具有所述路徑正確的關聯概率。
7.根據權利要求6所述的方法,還包括從所述字詞網格中所述選擇的轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用於所述選擇的轉錄的字詞的所述替代字詞。
8.根據權利要求6所述的方法,還包括從所述字詞網格中所述呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用於所述呈現的轉錄的字詞的所述替代短語。
9.一種在計算機可讀介質上編碼的電腦程式產品,可操作用於使一個或者多個處理器執行用於糾正轉錄的文字中的字詞的操作,所述操作包括 從移動計算設備中的麥克風接收語音音頻數據; 向轉錄系統發送來自所述移動計算設備的所述語音音頻數據; 在所述移動計算設備接收由所述轉錄系統從所述語音音頻數據轉錄的字詞網格;在所述移動計算設備的顯示器屏幕上呈現來自所述字詞網格的一個或者多個轉錄的字詞; 在所述移動計算設備接收對所述呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇; 響應於接收到對所述轉錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現來自所述字詞網格的用於所述選擇的轉錄的字詞的一個或者多個替代字詞; 在所述移動計算設備接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及響應於接收到對所述替代字詞的所述用戶選擇,用所述選擇的替代字詞取代所述呈現的轉錄的字詞中的所述選擇的轉錄的字詞。
10.根據權利要求9所述的電腦程式產品,所述操作還包括 響應於接收到對所述轉錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現用於所述選擇的轉錄的字詞的去除命令; 在所述移動計算設備接收對所述去除命令的用戶選擇;以及 響應於接收到對所述去除命令的所述用戶選擇,從所述呈現的轉錄的字詞去除所述選擇的轉錄的字詞。
11.根據權利要求10所述的電腦程式產品,所述操作還包括 在所述顯示器屏幕上呈現來自所述字詞網格的用於所述呈現的轉錄的字詞的至少一個替代短語; 在所述移動計算設備接收對所述替代短語的用戶選擇;以及 響應於接收到對所述替代短語的所述用戶選擇,用所述選擇的替代短語取代所述呈現的轉錄的字詞。
12.根據權利要求11所述的電腦程式產品,所述操作還包括 響應於接收到對所述去除命令或者所述替代字詞的所述用戶選擇,自動基於所述選擇的替代字詞或者所述去除的轉錄的字詞從所述字詞網格選擇至少一個新的替代短語;以及用所述新的替代短語取代所述呈現的替代短語。
13.根據權利要求9所述的電腦程式產品,其中接收對所述呈現的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇包括通過所述移動計算設備的觸屏接口接收對所述呈現的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇。
14.根據權利要求9所述的電腦程式產品,其中所述字詞網格包括與所述轉錄的字詞和所述替代字詞對應的節點、在所述節點之間的邊,所述邊標識經過所述字詞網格的可能路徑,並且每個路徑具有所述路徑正確的關聯概率。
15.根據權利要求14所述的電腦程式產品,所述操作還包括從所述字詞網格中所述選擇的轉錄的字詞的開始節點與結束節點之間的一個或者多個替代路徑識別用於所述選擇的轉錄的字詞的所述替代字詞。
16.根據權利要求14所述的電腦程式產品,所述操作還包括從所述字詞網格中所述呈現的轉錄的字詞的開始節點與結束節點之間的至少一個替代路徑識別用於所述呈現的轉錄的字詞的所述替代短語。
17.一種計算機實施的系統,用於糾正轉錄的文字中的字詞,所述系統包括 轉錄系統,可操作用於接收語音音頻數據並且作為響應將所述語音音頻數據轉錄成字詞網格;以及 移動計算設備,包括 麥克風,可操作用於接收語音音頻並且生成所述語音音頻數據, 網絡接口,可操作用於向所述轉錄系統發送所述語音音頻數據並且作為響應從所述轉錄系統接收所述字詞網格, 顯示器屏幕,可操作用於呈現來自所述字詞網格的一個或者多個轉錄的字詞,用戶接口,可操作用於接收對所述轉錄的字詞中的至少一個轉錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,所述指令在由所述處理器執行時執行以下操作在所述顯示器屏幕上呈現來自所述字詞網格的用於所述選擇的轉錄的字詞的一個或者多個替代字詞;接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及用所述選擇的替代字詞取代所述呈現的轉錄的字詞中的所述選擇的轉錄的字詞。
全文摘要
可以在一種計算機實施的方法以及其它實施方式中實施本說明書的主題內容,其中該方法用於糾正轉錄的文字中的字詞,該方法包括從麥克風接收語音音頻數據。該方法還包括向轉錄系統發送語音音頻數據。該方法還包括接收轉錄系統從語音音頻數據轉錄的字詞網格。該方法還包括呈現來自字詞網格的一個或者多個轉錄的字詞。該方法還包括接收呈現的轉錄的字詞中的至少一個轉錄的字詞的用戶選擇。該方法還包括呈現來自字詞網格的用於所選轉錄的字詞的一個或者多個替代字詞。該方法還包括接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括用所選替代字詞取代呈現的轉錄的字詞中的所選轉錄的字詞。
文檔編號G06F17/27GK102971725SQ201180008973
公開日2013年3月13日 申請日期2011年1月5日 優先權日2010年1月5日
發明者M·J·勒鮑, W·J·伯恩, J·N·吉科夫, B·M·巴林格爾, T·克裡斯簡森 申請人:谷歌公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀