語音輔助輸入系統及方法
2023-08-02 08:46:01 1
專利名稱:語音輔助輸入系統及方法
技術領域:
本發明涉及一種輸入系統及方法,尤其涉及一種語音輔助輸入系統及方法。
背景技術:
隨著通訊技術的發展,各類用於通訊的電子產品成本越來越低,市場價格也隨之
下降,從而得以更普遍的應用,例如,手機的普及率越來越高,成為廣大用戶日常生活中不
可缺少的通訊工具。在使用手機的過程中,手機的簡訊息功能的利用率相當高。
目前,手機簡訊息的輸入法主要依賴拼音輸入和手動選字來完成,但是如果需要
輸入標點符號或者阿拉伯數字,則需要切換輸入法來選取所需要的標點符號或者阿拉伯數
字。用戶需要花費時間切換輸入法來尋找所需要的符號及阿拉伯數字。
發明內容
鑑於以上內容,有必要提供一種語音輔助輸入系統,可以通過語音輸入來獲取所需的內容,省去了手動切換輸入法的步驟,達到快速輸入的目的。 此外,還有必要提供一種語音輔助輸入方法,可以通過語音輸入來獲取所需的內容,省去了手動切換輸入法的步驟,達到快速輸入的目的。 —種語音輔助輸入系統,該系統運行於手機中,該手機還包括語音樣本資料庫,該語音樣本資料庫用於存儲各樣本及各樣本相應的語音信號的特徵參數,該系統包括獲取模塊,用於當啟動語音輔助輸入系統時,獲取所輸入的語音信號;前置處理模塊,用於對所獲取的語音信號進行前置處理;特徵擷取模塊,用於擷取所述前置處理後語音信號中的特徵參數;計算模塊,用於根據所擷取的特徵參數計算所述語音樣本資料庫中各樣本的機率;及生成模塊,用於根據所述計算的結果生成待選樣本列表。 —種語音輔助輸入方法,應用於手機中,該手機包括語音樣本資料庫,該語音樣本資料庫用於存儲各樣本及各樣本相應的語音信號的特徵參數,該方法包括如下步驟當啟動手機的語音輔助輸入系統時,獲取所輸入的語音信號;對所獲取的語音信號進行前置處理;擷取所述前置處理後語音信號中的特徵參數;根據所擷取的特徵參數計算語音樣本資料庫中各樣本的機率;及根據所述計算的結果生成待選樣本列表。 相較於現有技術,所述的語音輔助輸入系統及方法,可以對所輸入的語音信號進行處理並擷取該語音信號中的特徵參數,將所擷取的特徵參數與手機中的語音樣本進行比對計算,根據計算的結果生成待選樣本列表以供用戶選擇,避免了手動輸入時需切換輸入法的步驟,節省了大量時間,達到快速輸入的目的。
圖1是本發明語音輔助輸入系統的應用環境圖。
圖2是本發明語音輔助輸入系統的功能模塊圖。
圖3是本發明語音輔助輸入方法的較佳實施方式的流程圖。
圖4是本發明的端點檢測的能量檢測方法示意圖。
具體實施例方式
如圖l所示,是本發明語音輔助輸入系統的較佳實施方式的應用環境圖。該語音輔助輸入系統IO運行於手機1中,該手機1還包括語音樣本資料庫12。所述語音樣本資料庫12用於存儲各樣本及各樣本相應的語音信號特徵參數。所述樣本包括,但不限於,標點符號及阿拉伯數字,例如冒號、逗號、分號、句號及0、1、2、3、4、5、6、7、8、9。所述語音輔助輸入系統10可以對所輸入的語音信號進行處理並擷取該語音信號中的特徵參數,將所擷取的特徵參數與手機1中的語音樣本資料庫12中的各樣本的語音信號特徵參數進行比對計算,根據計算的結果生成待選樣本列表以供用戶選擇。 如圖2所示,是本發明語音輔助輸入系統的功能模塊圖。所述的語音輔助輸入系統10包括獲取模塊100、前置處理模塊102、參數擷取模塊104、識別模塊106及生成模塊108。 所述獲取模塊100用於當啟動語音輔助輸入系統時,獲取所輸入的語音信號。例如,若用戶口語輸入"冒號",則獲取模塊100則獲取該"冒號"的語音信號。
所述前置處理模塊102用於對所獲取的語音信號進行前置處理。所述前置處理是指對原始語音進行處理,使處理後的信號更能反映語音的本質特徵。所述前置處理包括,但不限於,端點檢測和預強調。所述端點檢測的方法包括,但不限於,能量檢測法。所述能量檢測法是指在一段語音信號中,判斷有聲、無聲區域的方法。因為靜音部分得能量一定比有聲部分低,因此可以設置一個門檻值,能量值大於該門檻值的部分即為有聲區域,能量值小於該門檻值的部分為無聲區域。如圖4所示的能量檢測方法示意圖,若設置門檻值為5,圖中Nl至N2段的能量值大於5,即為有聲部區域,N1為語音信號的起始點,N2為語音信號的結束點。所述預強調是指對語音信號中衰減的高頻信號進行補償。因為聲音從人的嘴唇發出後,聲音頻率較高的部分會衰減,所以需要用預強調對衰減的部分進行補償。預強調就是讓聲音通過一個高通濾波器來補償高頻的損失。 所述特徵擷取模塊104用於擷取所述前置處理後語音信號中的特徵參數。所述特
徵參數包括,但不限於,頻譜和音高。所述頻譜是指從將語音信號經過傅立葉裝換後的語音
信號中取得的參數;所述音高是指語音信號的波形圖中基本周期的長度。 所述計算模塊106用於根據所擷取的特徵參數計算語音樣本資料庫12中各樣本
的機率。所述計算的方法包括,但不限於,動態時間軸校準。所述動態時間軸校準是指根據
所輸入的語音信號的特徵參數與各樣本的特徵參數進行比對計算,以得到各樣本的語音信
號特徵參數與所擷取的特徵參數相同的機率。 所述生成模塊108用於根據所述計算的結果生成待選樣本列表。所述待選樣本列表是指所述計算的機率最大前幾名的樣本列表,例如機率最大前3名的樣本列表、機率最大前4名的樣本列表。若用戶輸入語音信號為"冒號",語音樣本資料庫12中計算出的機率最大的第l名到第4名為""," ","。","、",則生成待選樣本列表1:2* 3。 4、。
用戶可在該待選樣本列表中選取所需要的內容。 如圖3所示,是本發明語音輔助輸入方法的較佳實施方式的流程圖。
步驟S10,啟動手機1的語音輔助輸入系統10。
步驟S12,獲取模塊100獲取用戶輸入的語音信號。例如,若用戶口語輸入"冒號",則獲取模塊100則獲取該"冒號"的語音信號。 步驟S14,前置處理模塊102對所獲取的語音信號進行前置處理。所述前置處理包括,但不限於,端點檢測和預強調。所述端點檢測是指在語音信號中將語音和非語音信號時段區分開來,準確地確定出語音信號的起始點和結束點。所述端點檢測的方法包括,但不限於,能量檢測法。所述能量檢測法是在一段語音信號中,判斷有聲、無聲區域的方法。因為靜音部分得能量一定比有聲部分低,因此可以設置一個門檻值,能量值大於該門檻值的起始點為端點檢測的起始點,能量值小於該門檻值的起始點為端點檢測的起始點。如圖4所示,圖4為語音信號的能量圖,若設置門檻值為5,圖中Nl至N2段的能量值大於5,即為有聲部區域,Nl為語音信號的起始點,N2為語音信號的結束點。所述預強調是指對語音信號中衰減的高頻信號進行補償。因為聲音從人的嘴唇發出後,聲音頻率較高的部分會衰減,所以需要用預強調對衰減的部分進行補償。預強調就是讓聲音通過一個高通濾波器來補償高頻的損失。 步驟S16,特徵擷取模塊104擷取所述前置處理後語音信號中的特徵參數。所述特
徵參數包括,但不限於,頻譜和音高。所述頻譜是指從將語音信號經過傅立葉裝換後的語音
信號中取得的參數;所述音高是指語音信號的波形圖中基本周期的長度。 步驟S18,計算模塊106根據所擷取的特徵參數計算語音樣本資料庫12中各樣本
的機率。所述計算的方法包括,但不限於,動態時間軸校準。所述動態時間軸校準是指根據
所輸入的語音信號的特徵參數與各樣本的特徵參數進行比對計算,以得到各樣本的語音信
號特徵參數與所擷取的特徵參數相同的機率。 步驟S20,生成模塊108根據所述計算的結果生成待選樣本列表。所述待選樣本列表是指所述計算的機率最大的前幾名樣本的列表,例如機率最大前3名的樣本列表、機率最大前4名的樣本列表。若用戶輸入語音信號為"冒號",語音樣本資料庫12中計算出的機率最大的第l名到第4名為"",'"","。","、",則生成待選樣本列表1:2"3。 4、。用戶
可在該待選樣本列表中選取所需要的內容。 以上實施方式僅用以說明本發明的技術方案而非限制,儘管參照以上較佳實施方式對本發明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發明的技術方案進行修改或等同替換都不應脫離本發明技術方案的精神和範圍。
權利要求
一種語音輔助輸入系統,該系統運行於手機中,該手機還包括語音樣本資料庫,該語音樣本資料庫用於存儲各樣本及各樣本相應的語音信號的特徵參數,其特徵在於,該系統包括獲取模塊,用於當啟動語音輔助輸入系統時,獲取所輸入的語音信號;前置處理模塊,用於對所獲取的語音信號進行前置處理;特徵擷取模塊,用於擷取所述前置處理後語音信號中的特徵參數;計算模塊,用於根據所擷取的特徵參數計算所述語音樣本資料庫中各樣本的機率;及生成模塊,用於根據所述計算的結果生成待選樣本列表。
2. 如權利要求1所述的語音輔助輸入系統,其特徵在於,所述前置處理包括端點檢測 和預強調。
3. 如權利要求2所述的語音輔助輸入系統,其特徵在於,所述端點檢測的方法包括能 量檢測方法。
4. 如權利要求1所述的語音輔助輸入系統,其特徵在於,所述特徵參數包括頻譜和音高。
5. 如權利要求1所述的語音輔助輸入系統,其特徵在於,所述待選樣本列表至少包括 計算模塊所計算的結果中機率最大的樣本。
6. —種語音輔助輸入方法,應用於手機中,該手機包括語音樣本資料庫,該語音樣本數 據庫用於存儲各樣本及各樣本相應的語音信號的特徵參數,其特徵在於,該方法包括如下 步驟當啟動手機的語音輔助輸入系統時,獲取所輸入的語音信號; 對所獲取的語音信號進行前置處理; 擷取所述前置處理後的語音信號中的特徵參數; 根據所擷取的特徵參數計算語音樣本資料庫中各樣本的機率;及 根據所述計算的結果生成待選樣本列表。
7. 如權利要求6所述的語音輔助輸入方法,其特徵在於,所述前置處理包括步驟 端點檢測,即在語音信號中將語音和非語音信號時段區分開來,準確地確定出語音信號的起始點和結束點;預強調,即對語音中衰減的高頻信號進行補償。
8. 如權利要求6所述的語音輔助輸入方法,其特徵在於,所述特徵參數包括頻譜和音高。
9. 如權利要求6所述的語音輔助輸入方法,其特徵在於,所述待選樣本列表至少包括 所計算的結果中機率最大的樣本。
全文摘要
一種語音輔助輸入系統,該系統運行於手機中,該手機還包括語音樣本資料庫,該語音樣本資料庫用於存儲各樣本及各樣本相應的語音信號的特徵參數,該系統包括獲取模塊,用於當啟動語音輔助輸入系統時,獲取所輸入的語音信號;前置處理模塊,用於對所獲取的語音信號進行前置處理;特徵擷取模塊,用於擷取所述前置處理後語音信號中的特徵參數;計算模塊,用於根據所擷取的特徵參數計算所述語音樣本資料庫中各樣本的機率;及生成模塊,用於根據所述計算的結果生成待選樣本列表。本發明還提供一種語音輔助輸入方法。
文檔編號H04M1/725GK101753709SQ20081030618
公開日2010年6月23日 申請日期2008年12月11日 優先權日2008年12月11日
發明者張唐瑜 申請人:深圳富泰宏精密工業有限公司;奇美通訊股份有限公司