為所應用的領域自動生成語音識別界面的製作方法
2023-11-10 07:27:22
專利名稱:為所應用的領域自動生成語音識別界面的製作方法
技術領域:
本發明涉及一種用於為所應用的領域自動生成語音識別界面的通用方法,以及用於實現這種方法的設備。
語音識別界面尤其在操作者-系統交互系統中被使用,其是人機界面的特定情況。此類界面是這樣一種裝置,通過此裝置,操作者可以訪問系統或者機器中包括的功能。更具體地說,這種界面使操作者能夠通過感知模態(perception modality)來評估系統的狀態,並且使用動作模態(action modality)來修改這種狀態。這種界面通常是操作者-系統交互時上行線路進行的考慮和設計工作、當研究用戶和與其交互的系統之間的關係時作為約束而實施的結果。
例如計算機系統的人機界面的系統界面必須是自然的、有效的、智能的(能夠自己適應環境)、可靠的、直觀的(也就是說,易於理解和使用),換言之,儘可能「透明的」,以便使用戶能夠在沒有因未落入其主要目標的活動而增加其工作量的情況下進行其工作。
通過使用為我們所熟知的信息交流渠道,諸如語音和打手勢,所述語音界面更加是用戶友好的並且是更加有效的。儘管如此,與傳統的界面例如圖形相比,實現它們更加複雜,這是因為它需要獲取多種學科的知識,通常是高級的,並且需要開發複雜的過程來採用此知識以便「智能地」管理操作者和系統之間的對話。
目前,所述語音界面是「人工地」生成的,即,對於每個新的界面來說,所述界面的所有功能需要被重新研究,而無法使用任何幫助措施(例如狀態機)來簡化其實現方式。
本發明的目的在於提供一種依照最容易並且最簡單的方式來自動生成語音界面的方法,並且所述方法花費儘可能短的開發時間並且成本最低。
本發明的另一目的在於提供一種用於實現此方法的設備,所述設備便於使用並且便宜。
依照本發明的方法的特徵在於輸入所應用的語音界面領域的概念模型,生成表示應用分類的通用語法規則的集合,解釋其限制得以滿足的不同通用語法規則,根據所解釋的通用語法並且根據所述概念模型來產生所涉及的應用領域的語法,並且管理操作者-系統的交互。
依照本發明的用於自動生成語音界面的設備包括概念模型輸入裝置、推導裝置、用於提供通用模型的裝置以及用於執行專用於所涉及的應用領域的語法的裝置。
通過閱讀實施例的詳細說明,將會更好地理解本發明,把所述實施例作為非限制性的例子並且通過附圖來示出,其中
圖1是由本發明實現的主要裝置的框圖,圖2是比圖1更加詳細的框圖,以及圖3是圖1和2的執行裝置的詳細框圖。
圖1示出了輸入裝置1,用於輸入描述相關應用領域的概念模型的數據以及互連所述數據的關係。在把語音控制用於領航飛行器的情況下,所述數據例如可以是飛行器的所有設備以及所有功能的技術名詞以及它們的不同的相互關係。
此外,語法規則的集合2被構造並且存儲,以便形成表示應用分類的通用模型(對於先前提及的示例而言,這種分類往往涉及車輛的總體控制)。根據概念模型1和通用模型2,推導裝置3自動地計算需要生成所期望的語音界面的資源集合,並且據此,推斷在所涉及的應用環境中,由此界面可能處理的語言語句集合。
此外,本發明的設備包括修訂裝置4和解釋裝置5。所述修訂裝置4由操作者或者設備的設計者來監控。其功能在於修訂由操作者使用裝置1輸入的數據,以便校正違背所涉及的應用的語義的詞語,和/或添加新詞語以便使所應用的領域的語法更豐富。所述解釋裝置5通過解釋生成專用於所應用領域的語法時所應用的規則來簡化由操作者輸入的數據的修訂。
執行裝置6負責自動地生成所涉及的應用領域的語音界面。生成這種界面的方法依賴於取決於所述應用並且是特定資源(也就是說,組成經由裝置1輸入的概念模型的所有概念以及組成詞彙的詞語集合)的資源、與不取決於這種應用(通用資源,也就是說,語法的句法規則以及所有的基本詞彙)並且是專用於所使用的語言的資源之間的區別。
為了實現這種方法,語音界面的設計者需要使用輸入裝置1來描述專用於所涉及的應用的資源,即概念模型以及這種應用的詞彙。對所述設計者來說,這需要定義他希望能夠通過語音來控制的應用的概念,然後用詞語描述這些概念。這種輸入工作可以通過使用所涉及的應用的形式模型而變得更為方便,如果這種模型存在並且是可利用的話。
當由此獲取了專用於所述應用的資源時,全部自動操作的推導裝置3使用這些特定資源以及由裝置2提供的通用資源來計算所述應用的語音界面的語言學模型。這種語言學模型由專用於此界面的子語言的語法以及詞彙組成。所述推導裝置3還用於計算這種子語言的語句集合(也就是其措辭),以及涉及所述應用的所有知識,並且需要管理操作者-系統對話。
然後,由操作者使用所述修訂裝置4來顯示對應於其輸入工作的所有或者某些措辭,以便能夠通過添加、刪除或者修改來精煉這種措辭。為了幫助從事這種任務的操作者,用於生成解釋的裝置5能夠自動地識別操作者輸入的概念和詞彙數據,由此,創立所生成的子語言的語句的給定特徵或者語句集合。
最後,所述執行裝置6形成當使用這種由此產生的語音界面時被啟用的環境,以便確認這種界面。為此目的,所述執行裝置使用由輸入裝置1和推導裝置3提供的所有數據。
圖2表示用於實現本發明方法的設備的示例性實施例。所述操作者具有輸入界面7,諸如圖形界面,用於輸入所涉及的應用的概念模型8。他還具有包含應用的實體或者概念的資料庫9,以及這種應用的詞彙10。由此,所述概念模型包括應用的實體及其相互關聯,即,連結應用概念的表述關係。概念模型的輸入被設計為使用兩個主要知識源的迭代和輔助過程,所述兩個主要知識源是通用語法11以及基本詞彙12。
實現所述推導裝置3的一種方式在於擴展句法以及語義語法,以便能夠考慮概念上的限制。由此,能夠在這種高級形式內定義通用語法,其適於經由操作者輸入的數據來自動地適用於所應用領域。所述推導裝置因此能用於計算專用於所應用領域的句法/語義語法以及詞彙。由此,如圖2中利用圖表所示出的那樣,所述設備使用由操作者輸入的概念模型8來推斷傳輸到所述推導裝置13的語言學模型。此處應該注意的是,概念模型不僅用於計算語言學模型以及連結到它的子模型(用於識別的語言學模型、用於分析的語言學模型以及用於生成的語言學模型),而且還用於管理操作者-系統對話,以便根據所述應用的概念以及對象來執行每一件事情。
對於修訂-解釋裝置14的修訂功能來說,其可經由圖形界面7來訪問,以便輸入所述應用的概念模型。他們使用語法生成器15,其計算對應於所輸入的模型的語法,並且提供用於顯示所有或者某些相應語句的機制。為此目的,所述語法生成器15包括用於分析語句的句法以及語義語法16,用於生成語句的語法17以及用於語音識別的語法18。
對於所述修訂-解釋裝置14的解釋功能來說,其基於由推導裝置13執行的計算的形式分析,以便識別根據其創立這些語句的特徵的數據。這些裝置由操作者使用以便反覆地設計其模型,同時檢驗將生成的語句是否準確地符合其期望。
圖3詳細示出了語音界面的執行裝置6的示例性實施例。這些裝置包括-語音識別設備19,用於使用由語言學模型自動推導的語法18;-語句分析器20,其使用由所述推導裝置13提供的語言學模型。它從句法上並且從語義上來檢驗所述語句的準確性;-對話處理器21,用於使用由操作者輸入的概念模型,以及所述應用的語言學實體的資料庫9,其由操作者輸入或者由應用22自動地構造;-語句生成器23,用於使用由語言學模型自動推導出的語句生成語法17;
-語音合成設備24。
在當前的實例中,用於執行語音界面的元件19至21以及23、24的集合由多代理型系統25來管理。
現在,將使用非常簡單的例子來解釋輸入裝置、修訂裝置以及解釋裝置的實現方式。
A)輸入裝置為了能夠利用語音講出電視頻道(CHANNEL)、電視播送節目(PROGRAMME)、電影(MOVIE)、卡通(CARTOON)的概念,以及電視頻道播放(PLAY)電視播送節目的事實,所述輸入裝置必須首先被用來描述涉及所述概念也就是被考慮的詞彙。
首先,當編譯詞彙時,所述輸入裝置用來幫助語音界面的設計者。為此,提供了一種機制,對於特定詞語(例如詞彙的英語譯本「movie(電影)」以及用於法語版本的「film(電影)」)而言,其對應於這種詞語提供所有的變化形式(例如,唯一的以及多個通用名稱或者動詞的詞形變化)。詞彙的設計者因此只有從所有這些形成中選擇那些他希望在語音界面中找到的。
然後,經由這些相同的輸入裝置來創建必須能夠用語音講出的概念。在當前的實例中,此意味著創建CHANNEL、PROGRAMME、MOVIE以及CARTOON實體,以及PLAY關係。把這些概念與詞彙中的詞語集合連結。由此,所述MOVIE概念將被連結到詞語「movie」、「movies」、「film」以及「films」。這些連結可用於創建若干子句,所述子句由所述推導裝置使用·entity([CARTOON,[cartoon]])·entity([MOVIE,[movie]])·entity([PROGRAMME,[programme]])·entity([CHANNEL,[channel 5,cnn]])·etc.
對於PLAY關係來說,必須解釋涉及此關係的各方電視播送頻道以及節目。這產生了意欲供推導裝置使用的另一類型的子句·functional_structure([PLAY,Subject(CHANNEL),DirectObject(PROGRAMME),[play]]).
然後,所述輸入裝置用於解釋這些概念之間的若干額外的關係。例如,電影是電視播送節目的一種類型。這些關係的結果將用於創建由所述推導裝置使用的其他子句·is_a(MOVIE,PROGRAMME)·etc.
這些輸入裝置的提供主要是簡化需要實現語音界面的特定資源的輸入。實際上,這種輸入很大程度上通過從經由圖形界面提供的標準集合中選擇某些標準來執行。由推導裝置需要的資源文件(子句)根據所選標準集合的這種圖形表示來被自動生成。這樣能夠使語音界面的設計者避免在資源文件中產生語法錯誤和遺漏。
B)修訂裝置所述修訂裝置由語音界面的設計者使用,以便確認或者校正已經經由所述輸入裝置創建的概念模型。
修訂過程的第一步在於顯示對應於所述概念模型的所有或者某些措辭。
在當前的例子中,可以顯示下列短語1)A movie2)A cartoon3)A movie plays Channel 54)etc語句「a movie plays Channel 5」是不正確的。所述解釋裝置揭露此錯誤來源於不正確定義PLAY關係的事實·functional_structure([PLAY,Subject(PROGRAMME),DirectObject(CHANNEL),[play]]).
PROGRAMME充當對象而不是·functional_structure(PLAY,Subject(CHANNEL),DirectObject(PROGRAMME),[play])).
CHANNEL充當對象所述修訂裝置由語音界面的設計者使用,以便顯示此錯誤,並且用於修改概念模型以便校正它。
C)解釋裝置所述解釋裝置的用途在於識別並且描述概念模型的子集或者特徵,其中所述概念模型的編譯生成對應於特殊語句的子語法、對應於特殊語言學表達式的語句部分,或者對應於特殊語言學屬性的表達式特徵。
由此,所述解釋裝置能夠使用戶通過選擇語句、表達式或者由語法生成的屬性,來找到並且理解創立它的概念模型的子集或者特徵。
然後,他可以通過重複所述過程來修改所述概念模型以便修改所述語句、表達式或者生成的屬性,精煉所述概念模型以便獲得所要求的語言的語法。
舉例來說,在如下四個表達式中的單元實體和任務實體之間的關係中,使用多個的可能性取決於此關係的基數。
1.「the mission of the unit」2.「the missions of the unit」3.「the mission of the units」4.「the missions of the units」所討論的關係通過如下概念規則來描述entity(unit,relationship(mission,X,Y)如果X=1並且Y=1,那麼只有表達式1.是語法允許的。如果X=1而Y=n,那麼只有表達式1.和2.是語法所允許的。如果X=n而Y=1,那麼只有表達式1.和3.是語法所允許的。最後,如果X=n並且Y=n,那麼所有表達式都是語法允許的(n≥2)。
在此例子中,所述解釋裝置必須允許用戶識別出概念規則的基數必須被修改以便獲得對應於他希望其語言中包括的多個表達式的語法的事實。
所述解釋裝置的實施例在於基於語法編譯方法來構造回溯分析法,其將能夠從所述結果開始來找出得出此結果的概念規則,並且由此向用戶描述它們。
權利要求
1.一種用於為所應用的領域自動生成語音識別界面的通用方法,其特徵在於,輸入所應用的語音界面領域的概念模型(1,7),生成表示應用分類的通用語法規則(11)的集合,解釋其限制得以滿足的不同通用語法規則,根據所解釋的通用語法並且根據所述概念模型(13)來產生所涉及的應用領域(6)的語法,並且管理操作者-系統的交互。
2.如權利要求1所述的方法,其特徵在於,修訂所輸入的數據,並且校正違背所涉及的應用的語義的詞語。
3.如權利要求1或者2所述的方法,其特徵在於,修訂所輸入的數據(4),並且添加新的詞語以便豐富所應用領域的語法。
4.如先前任一項權利要求所述的方法,其特徵在於,生成解釋(5),用於解釋當生成專用於所應用領域的語法時所應用的規則。
5.一種用於為所應用領域自動生成語音識別界面的設備,其特徵在於,所述設備包括概念模型輸入裝置(1,7),推導裝置(3,13),用於提供通用模型(2,11)的裝置以及用於執行專用於所涉及的應用領域(6,15)的語法的裝置。
6.如權利要求5所述的設備,其特徵在於,所述設備還包括修訂裝置(4,14)。
7.如權利要求5或者6所述的設備,其特徵在於,所述設備還包括解釋裝置(5,14)。
全文摘要
一種用於自動生成語音識別界面的設備包括用於圖形記錄概念模型的裝置(1),推導裝置(3),用於提供通用模型(2)的裝置以及用於實行相關應用領域中的特定語法的裝置(6)。
文檔編號G10L15/26GK1745409SQ200380109387
公開日2006年3月8日 申請日期2003年12月15日 優先權日2002年12月31日
發明者P·比松, C·塞多格波, O·格裡斯瓦爾, C·勞迪, B·古戎 申請人:泰勒斯公司