用於語音處理的方法及裝置的製作方法
2023-07-25 11:22:36
專利名稱:用於語音處理的方法及裝置的製作方法
多年來日用語音識別及語音控制系統的發展體現為計算機技術的主要發展路線。在該發展過程中取得了顯著的進步及建立了有市場的語音識別系統,它在實際使用中也被證實是經受了考驗的。該技術取得進展的系統也基本適用於計算機及所連接的外圍裝置的語音控制。僅用相對少的詞彙可處理的簡單語音識別系統也已用於消費電子裝置領域及機動車設備以及其它領域,在這些領域中根據有限的詞彙可進行裝置有意義的聲音控制。
在語音識別系統中通常具有工具,藉助它可輸入要由語音識別系統識別的詞彙。通常詞或表達通過電腦程式的相應表面軟體以正字的描述方式輸入及自動地轉換成語音識別系統的內部描述方式(通常為語音的書寫(音標)的變型)。在該自動的及通過字典查找所支持的轉換過程中可能在語音的音標書寫上產生錯誤,它們由不充分的轉換規則和/或不完整的詞彙引起。因為該語音識別系統將其識別過程建立在這樣地產生的語音音標的基礎上,因此通過錯誤的音標書寫在語音識別時也產生錯誤。
為了保證最佳的性能,對此將要關注儘可能無誤地校正音標書寫。
迄今這樣地解決該問題,即用戶在輸入正字的(正確)描述方式後,可人工地檢驗由系統產生的音標書寫。但通常對於未培訓人員這是困難的。因此使用了不同的輔助措施,它們以市場暢銷的軟體(SW)方式提供1.用戶可對於不同的發言符號被告知包含這些符號的典型詞,及手工地校正該音標書寫方式。在此情況下在某些系統中用戶還應得到以下支持不可能使用音標書寫的錯誤的符號順序,其方式是通過所使用的軟體僅可輸入這樣的符號序列它們對於所使用的音標符號組為合適的ASCII序列。
2.由音標書寫方式藉助市場暢銷的文本-語音軟體系統、即語音合成系統使音標書寫再轉換成可聽的語音。這用於由系統對一個字自動產生的符號序列的聲音似真性檢驗。這種聽覺檢驗僅可消除明顯的錯誤並從屬於聲音通道的不完善性。此外,應保證語音識別及語音合成所使用的發音字母的一致性,它是以最少情況給出的。
因此本發明的目的是給出一種語音處理的改進方法及裝置,它們尤其可通過實質性改進的用戶適用性及與此相關地通過提高了的精確性及可靠性而顯出其特色。
該目的在其方法方面將通過權利要求1的特徵來實現,及在其裝置方面將通過權利要求6的特徵來實現。
本發明具有其基本構思,即考慮用一種在語音書寫(音標)上簡單及可靠的可處理輸出來取代對於語音科學未受訓練的用戶不習慣並難以處理的、轉換成語音書寫的字的輸出。本發明還包括這樣的構思,即對此選擇一種被稱為「似正字」(pseudo-orthographisch)的輸出形式,它不要求用戶具有語音書寫的特殊符號的知識及其專門規則。簡言之,「如人們說出它那樣」實現轉換字的輸出。
這對於外行來說易於理解及很好處理的轉換成語音書寫的語音似正字輸出也需要語音處理方法中的一個附加步驟,即由語音書寫轉換成該似正字表示的轉換步驟。該附加步驟包括一種方法,其中以自學習方式或通過對預定調準單元的訪問由字的語音單位轉換成所述書寫的簡單字單位。在一個簡單及合乎要求的實施形式中,該轉換通過對一個已存儲的音位-字位表的訪問來進行,該表至少藉助配置規則使原來的存儲初始化及必要時在系統使用期間的自學習過程中根據用戶的附加輸入來擴展。
在一個特別適用的及在所述自學習處理意義上有利的實施形式中,該方法還包括另一個反向轉換的步驟,即由(通過用戶在輸入用於校正原始轉換結果時使用的)似正字表示轉換成語音書寫。在該步驟上亦可使用所述的表配置及在必要時通過自學習處理來補充及細化。
根據上述方法特徵,實施所述方法的裝置除了具有一個用於將似正字輸入轉換成音標的本身公知的第一轉換單元外,還具有一個將音標轉換成似正字表示的第二轉換單元及一個用於以該表示形式輸出的輸出單元。
對於該方法的進一步構型,即藉助似正字表示可實現校正用戶的輸入,該裝置具有一個相應的第三轉換單元。
為了使用所述的音位-字位配置表,在一個優選實施形式中,該裝置設有一個相應的存儲器,在該存儲器中可存取地保持用於第二和/或第三轉換單元的配置表。
本發明的其它優點及目的將由從屬權利要求及以下藉助附圖
對優選實施例的描述中得出。
附圖以功能框圖的形式表示用於實施根據本發明的方法的語音處理裝置1的一個實施形式的概圖。該語音處理裝置1包括一個聲音輸入單元3,在其輸出端提供一個預處理的語音流S1,該語音流被輸送給一個語音識別單元5,後者輸出一個被描述的文本S2。該語音識別單元5包括一個詞彙存儲器5a,其中存儲語音識別單元的詞彙,-而在傳統的語音識別系統中存儲語音標記。
詞彙存儲器5a將通過藉助字母數字輸入單元7輸入附加的概念詞被不斷地修改,該概念詞在第一轉換單元9中由正字輸入格式轉換成語音書寫(音標)。一個詞典存儲器11支持第一轉換單元9中的轉換過程。為了檢驗及校正已進行的輸入,設有第二轉換單元13,用於將語音書寫轉換成似正寫表示。這將在一個圖象屏上15上對用戶顯示出來。
此外還設有一個第三轉換單元17,用於通過字母數字輸入單元7將似正寫輸入轉換成語音標記,其輸出端與語音識別單元5的詞彙存儲器5a相連接。第二及第三轉換單元13,17被配置給以一個查找表的形式布置的配置存儲器19,用於預定的音位-字位配置。
一個通過用戶實現的以正確的正字標記輸入的新概念字將在第一轉換單元9中轉換成音標,-視該形式的系統的具體組織而定被傳送到詞彙存儲器5a。但在任何情況下,被轉換成音標的字被傳送到第二轉換單元13,在該單元中進行對似正字表示的另一轉換,這被顯示在圖象屏15上及必要時引起用戶通過輸入單元7(現在為似正字表示,這也可顯示在圖象屏上)作出校正的輸入或確認所顯示的似正字表示。該似正字輸入將在第三轉換單元17中轉換成音標及這時(第一次、或當字已在首次輸入時以校正模式接收在詞彙存儲器5a中)傳送到詞彙存儲器5a。由此它的內容被擴展了在語音標記上被檢驗的詞彙。
以下用兩個例子來解釋上述的方案例1通過字母數字輸入單元7以正字書寫方式輸入「Jacques Chrac」。在第一轉換單元9中將由它構成發音標記「sh a xk sh irr a xk」。第二轉換單元由它構成「sch a k sch i r a k」,及以該標記將輸入的名字顯示在圖象屏15上。由該標記(不用知道在第一轉換中使用的發音字母)可識別出由系統產生的發音標記是適合的。用戶可認可該轉換結果,及該新輸入的名字將(以發音標記的形式)到達詞彙存儲器5a中。
例2通過輸入單元7輸入「Professional Service」。第一轉換單元9由它產生發音標記「P r of ae sh o nell s oe r v icce」。在第二轉換單元13的另一轉換結果中將以似正字標記得到「Profaschonell Sorwieke」,及該表示將又被顯示在圖象屏上。
用戶可直接確認出由系統產生的產生的音標是不正確的,-只要它不對應於輸入字組合的通常發音的話。現在用戶將藉助輸入單元使用顯示在屏上的似正字標記進行校正,及該校正結果將在第三轉換單元17中由似正字又轉換成發音標記,及以該方式存儲在詞彙存儲器5a中。在該給出的例中,用戶將輸入「Profaschonnell Sorwis」,及相應地將該新字組合(以發音標記方式)存儲在詞彙存儲器5a中。
可以看出,所給出的方法也可多級地實施,其方式是在第一次校正後通過用戶再次由發音標記轉換成似正字及以該表示顯示出來,以使得必要時可交互地消除系統的錯誤。這裡最好是使用一個(本身公知的)神經網結構的自學習系統,通過它可進行第一轉換過程(正字-音標)的配置存儲器19和/或配置規程存儲器內容的自適配。
本發明的實施並不被限制在上述例子上,而可具有專業人員能力範圍中的許多變化。
權利要求
1.用於語音處理的方法,其中在第一轉換步驟中進行正字輸入到音標的轉換及設有一個由用戶進行的轉換結果的檢驗及校正步驟,其特徵在於具有一個由音標轉換成似正字表示的及以該表示輸出第二轉換步驟。
2.根據權利要求1的方法,其特徵在於具有一個以似正字表示進行的輸入轉換成音標的第三轉換步驟。
3.根據權利要求1或2的方法,其特徵在於第二和/或第三轉換步驟包括語音字單位向簡單語義字單位轉換或相反的轉換。
4.根據權利要求3的方法,其特徵在於第二和/或第三轉換步驟通過在一個已存儲的音位-字位表(19)上的訪問來進行。
5.根據權利要求3或4的方法,其特徵在於第二和/或第三轉換步驟藉助一種自學習方法,尤其通過使用一個不斷修改音位-字位表(19)的神經網來進行。
6.用於實施根據以上權利要求中一項的裝置(1),具有一個字母數字輸入單元(7),及一個在輸入側與它連接的第一轉換單元、用於將正字輸入轉換成音標,以及一個顯示單元(15)用於已輸入字的光學顯示,其特徵在於具有一個用於將音標轉換成似正字表示的第二轉換單元(13),其輸出端與顯示單元連接。
7.根據權利要求6的裝置,其特徵在於具有一個用於將以似正字表示進行的輸入轉換成音標的第三轉換單元。
8.根據權利要求6或7的裝置,其特徵在於第二和/或第三轉換單元(13,17)與一個用於存儲音位-字位表的存儲器(19)相連接。
9.根據權利要求6至8中一項的裝置,其特徵在於第二轉換單元(13)在輸出側與一個語音識別單元(5)的詞彙存儲器(5a)相連接。
全文摘要
本發明涉及語音處理方法,其中在第一轉換步驟中進行正字輸入到音標的轉換及設有一個由用戶進行的轉換結果的檢驗及校正步驟,及具有一個由音標轉換成似正字表示的及以該表示輸出第二轉換步驟。
文檔編號G10L13/08GK1359512SQ00809905
公開日2002年7月17日 申請日期2000年4月11日 優先權日1999年7月6日
發明者G·尼德邁爾 申請人:西門子公司