一種語音信號處理方法、裝置及電子設備與流程
2023-04-29 22:10:37 1

本發明涉及語音信號處理技術領域,特別是涉及一種語音信號處理方法、裝置及電子設備。
背景技術:
目前,市場上有越來越多的產品具有語音交互功能,例如智能音箱、機器人等電子設備。這些電子設備在接收到喚醒指令後,從待機狀態切換至工作狀態,並通過麥克風陣列接收語音信號,即進行拾音,進而可以對該語音信號進行識別和解析,從而響應該語音信號對應的交互指令。
上述具有語音交互功能的電子設備在接收到喚醒指令後,通過麥克風陣列接收周圍環境中的各聲源發出的語音信號,將這些語音信號中音量最大者對應的聲源方位識別為用戶聲源方位,聲音最大的語音信號也即被視為用戶發出的語音信號,進而響應該語音信號對應的交互指令。
通常情況下,應用上述方式能夠較佳的進行語音信號處理,但是如果用戶周圍存在一個或多個音量大於用戶音量的發聲對象,那麼該具有語音交互功能的電子設備便會將接收到的語音信號中音量最大者對應的聲源方位識別為用戶聲源方位,並對音量最大的語音信號進行識別和解析得到交互指令,進而會進行錯誤的響應,導致用戶體驗不佳。
技術實現要素:
本發明實施例公開了一種語音信號處理方法、裝置及電子設備,用以避免響應錯誤,提升用戶體驗。技術方案如下:
第一方面,本發明實施例提供了一種語音信號處理方法,應用於具有語音交互功能的電子設備,所述方法包括:
在所述電子設備處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令;
若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位;
繼續接收語音信號,並對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;
響應所述用戶語音信號對應的交互指令。
可選的,所述對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號的步驟,包括:
對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,並對繼續接收到的語音信號中來源於所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。
可選的,所述方法還包括:
按照所述用戶聲源方位指示用戶方位。
可選的,所述方法還包括:
判斷從所述用戶聲源方位接收到的語音信號對應的交互指令是否為聲源定位方式轉換指令;
若為是,繼續接收語音信號,將所接收到的語音信號中音量最大者對應的聲源方位確定為用戶聲源方位,並將所接收到的語音信號中音量最大者確定為用戶語音信號,響應所述用戶語音信號對應的交互指令。
可選的,所述判斷所接收到的語音信號對應的交互指令是否為喚醒指令的步驟,包括:
按照以下方式判斷所接收的每一語音信號對應的交互指令是否為喚醒指令:
對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬於預設頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;
判斷過濾處理後的目標語音信號對應的交互指令是否為喚醒指令。
可選的,所述定位所接收到的語音信號的聲源方位為用戶聲源方位的步驟,包括:
定位並記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;
根據第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設備處於睡眠狀態的情況下,定位並記錄的所接收到的語音信號的聲源方位,該語音信號對應的交互指令不為喚醒指令。
可選的,所述根據第一類聲源方位和所述第二類聲源方位定位用戶聲源方位的步驟,包括:
判斷所述第二類聲源方位中是否存在不屬於所述第一類聲源方位的聲源方位;
若為是,將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位。
可選的,所述將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,包括:
確定所述第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量;
當所確定的數量大於1時,將不屬於預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位。
可選的,所述將不屬於所述預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位的步驟,包括:
確定不屬於所述預設頻率段的語音信號對應的聲源方位的數量;
當所確定的數量大於1時,將所述不屬於所述預設頻率段的語音信號中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
可選的,在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,所述方法還包括:
判斷處於同一聲源方位的第一語音信號與第二語音信號的能量差值是否大於第二預設值,其中,所述第一語音信號為所述電子設備處於睡眠狀態時接收到的語音信號,所述第二語音信號為所述電子設備處於工作狀態時接收到的語音信號;
如果是,將該第二語音信號對應的第二類聲源方位確定為所述用戶聲源方位。
可選的,在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,所述方法還包括:
將所述第二類聲源方位中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
可選的,所述將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,包括:
確定所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位為目標聲源方位;
根據所述目標聲源方位,確定目標範圍[a,b],並將所述目標範圍內的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設方位差值的差值,b為所述目標聲源方位與第二預設方位差值的加和。
第二方面,本發明實施例還提供了一種語音信號處理裝置,應用於具有語音交互功能的電子設備,所述裝置包括:
喚醒指令判斷模塊,用於在所述電子設備處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令;
聲源定位模塊,用於在所接收到的語音信號對應的交互指令為喚醒指令的情況下,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位;
用戶語音信號獲得模塊,用於繼續接收語音信號,並對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;
第一交互指令響應模塊,用於響應所述用戶語音信號對應的交互指令。
可選的,所述用戶語音信號獲得模塊包括:
用戶語音信號獲得子模塊,用於對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,並對繼續接收到的語音信號中來源於所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。
可選的,所述裝置還包括:
用戶方位指示模塊,用於按照所述用戶聲源方位指示用戶方位。
可選的,所述裝置還包括:
轉換指令判斷模塊,用於判斷從所述用戶聲源方位接收到的語音信號對應的交互指令是否為聲源定位方式轉換指令;
第二交互指令響應模塊,用於在從所述用戶聲源方位接收到的語音信號對應的交互指令為聲源定位方式轉換指令的情況下,繼續接收語音信號,將所接收到的語音信號中音量最大者對應的聲源方位確定為用戶聲源方位,並將所接收到的語音信號中音量最大者確定為用戶語音信號,響應所述用戶語音信號對應的交互指令。
可選的,所述喚醒指令判斷模塊包括:
信號過濾子模塊和指令判斷子模塊;
所述喚醒指令判斷模塊,具體用於通過所述信號過濾子模塊和指令判斷子模塊判斷所接收的每一語音信號對應的交互指令是否為喚醒指令;
所述信號過濾子模塊,用於對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬於預設頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;
所述指令判斷子模塊,用於判斷過濾處理後的目標語音信號對應的交互指令是否為喚醒指令。
可選的,所述聲源定位模塊包括:
聲源定位子模塊,用於定位並記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;
用戶聲源方位確定子模塊,用於根據第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設備處於睡眠狀態的情況下,定位並記錄的所接收到的語音信號的聲源方位,該語音信號對應的交互指令不為喚醒指令。
可選的,所述用戶聲源方位確定子模塊包括:
判斷單元,用於判斷所述第二類聲源方位中是否存在不屬於所述第一類聲源方位的聲源方位;
用戶聲源方位確定單元,用於在所述第二類聲源方位中存在不屬於所述第一類聲源方位的聲源方位的情況下,將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位。
可選的,所述用戶聲源方位確定單元包括:
數量確定子單元,用於確定所述第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量;
第一方位確定子單元,用於當所確定的數量大於1時,將不屬於預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位。
可選的,所述第一方位確定子單元,具體用於確定不屬於所述預設頻率段的語音信號對應的聲源方位的數量;當所確定的數量大於1時,將所述不屬於所述預設頻率段的語音信號中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
可選的,所述裝置還包括:
能量差值判斷模塊,用於在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,判斷處於同一聲源方位的第一語音信號與第二語音信號的能量差值是否大於第二預設值,其中,所述第一語音信號為所述電子設備處於睡眠狀態時接收到的語音信號,所述第二語音信號為所述電子設備處於工作狀態時接收到的語音信號;如果是,將該第二語音信號對應的第二類聲源方位確定為所述用戶聲源方位。
可選的,所述裝置還包括:
波形比較模塊,用於將所述第二類聲源方位中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
可選的,所述用戶聲源方位確定子模塊包括:
目標聲源方位確定單元,用於確定所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位為目標聲源方位;
第二方位確定單元,用於根據所述目標聲源方位,確定目標範圍[a,b],並將所述目標範圍內的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設方位差值的差值,b為所述目標聲源方位與第二預設方位差值的加和。
第三方面,本發明實施例還提供了一種電子設備,所述電子設備包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內部,處理器和存儲器設置在電路板上;電源電路,用於為電子設備的各個電路或器件供電;存儲器用於存儲可執行程序代碼;處理器通過讀取存儲器中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行上述的語音信號處理方法。
本發明實施例所提供的方案中,具有語音交互功能的電子設備在處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令,若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位,然後繼續接收語音信號,並對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應用戶語音信號對應的交互指令。電子設備將喚醒指令所對應的聲源方位確定為用戶聲源方位,並對繼續接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處於用戶聲源方位的用戶發出的語音信號,因此可以進行正確的響應,提升用戶體驗。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例所提供的一種語音信號處理方法的流程圖;
圖2為本發明實施例所提供的一種語音信號處理裝置的結構示意圖;
圖3為本發明實施例所提供的一種電子設備的結構示意圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
為了避免響應錯誤,提升用戶體驗,本發明實施例提供了一種語音信號處理方法、裝置及電子設備。
下面首先對本發明實施例所提供的一種語音信號處理方法進行介紹。
首先需要說明的是,本發明實施例所提供的一種語音信號處理方法可以應用於具有語音交互功能的電子設備(以下簡稱電子設備),例如,智能音箱、機器人等。該電子設備一般具有麥克風陣列,或與麥克風陣列建立通信連接,該通信連接可以為有線連接或無線連接,其中,無線連接可以為wifi連接、藍牙連接等。該麥克風陣列用於接收語音信號。
如圖1所示,一種語音信號處理方法,應用於具有語音交互功能的電子設備,所述方法包括:
s101,在所述電子設備處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令,若為是,執行步驟s102;
從一定角度來講,電子設備的狀態可以劃分為:睡眠狀態和工作狀態,當電子設備處於睡眠狀態時,需通過接收喚醒指令喚醒電子設備,進而切換至工作狀態。另外,當電子設備處於睡眠狀態時,依然可以持續接收周圍環境中的聲源發出的語音信號,也就是,電子設備處於睡眠狀態時,麥克風陣列依然工作。此時該電子設備可以接收語音信號,以確定是否接收到喚醒指令。
電子設備接收到一段語音信號後,即開始對接收到的這一段語音信號進行語音識別,判斷所接收的這一段語音信號對應的交互指令是否為喚醒指令。具體的,如果這一段語音信號的語音識別結果中包括預設的喚醒詞,那麼該段語音信號對應的交互指令即為喚醒指令。也就是說,電子設備接收到語音信號後,可以對該語音信號進行語音識別,得到語音識別結果,進而便可以判斷出該語音信號的語音識別結果中是否包括預設的喚醒詞。
需要說明的是,電子設備接收到語音信號後,可以在本地進行語音信號的語音識別,得到語音識別結果,也可以將該語音信號發送至伺服器,伺服器接收到該語音信號後,便可以對該語音信號進行語音識別,得到語音識別結果,並將語音識別結果發送至電子設備,電子設備也就能獲得該語音識別結果,進而,便可以判斷該語音信號的語音識別結果中是否包括預設的喚醒詞。
舉例而言,如果預設的喚醒詞為「小雅」,那麼如果電子設備接收到的語音信號對應的語音識別結果中包括「小雅」兩個字,那麼該語音信號對應的交互指令即為喚醒指令;如果電子設備接收到的語音信號對應的語音識別結果中是不包括「小雅」兩個字的其他語句,或者是不具有任何語義的語音信號,例如空調發出的語音信號,那麼該語音信號對應的交互指令便不是喚醒指令。
s102,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位;
電子設備判斷出所接收到的語音信號對應的交互指令為喚醒指令時,說明此時用戶發出了語音信號來喚醒電子設備,以使電子設備可以與用戶進行語音交互,實現功能,電子設備便需要由睡眠狀態切換至工作狀態。
與此同時,電子設備可以定位所接收到的語音信號的聲源方位,將該聲源方位確定為用戶聲源方位。需要說明的是,語音信號的聲源方位的定位方式可以採用時延預估法等聲源定位方式,也就是說,可以根據語音信號到達麥克風陣列中各麥克風處的時間來定位語音信號的聲源方位,在此不做具體限定及說明。
可以理解的是,如果電子設備判斷出所接收到的語音信號所對應的交互指令不是喚醒指令時,那麼便不會轉換至工作狀態,而是在睡眠狀態下繼續接收語音信號,並繼續判斷所接收到的語音信號對應的交互指令是否為喚醒指令。
s103,繼續接收語音信號,並對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;
確定了用戶聲源方位後,由於用戶一般會繼續發出語音信號,所以電子設備可以繼續接收語音信號,並對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號。
可以理解的是,由於用戶聲源方位以外的其他方位也可能存在聲源,即噪聲聲源,這些噪聲聲源也可能會發出語音信號,電子設備也就會接收到這些噪聲聲源發出的語音信號,為了可以更好地接收用戶所發出的語音信號,也就是來源於用戶聲源方位的語音信號,電子設備可以對來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,以減弱來源於用戶聲源方位以外的語音信號的能量,進而獲得用戶語音信號。
需要說明的是,上述噪聲抑制處理可以採用現有的任意噪聲抑制處理方式,例如可以為端點檢測、噪聲分離、頻譜過濾等方式,只要能夠達到將語音信號的能量進行減弱的目的即可,在此不做具體限定。
s104,響應所述用戶語音信號對應的交互指令。
獲得了用戶語音信號後,電子設備便可以響應該用戶語音信號對應的交互指令。電子設備可以通過語音播放等多種形式響應該交互指令,如果電子設備具有顯示屏幕,那麼也可以通過顯示屏幕響應該交互指令,這都是合理的。
舉例而言,如果用戶語音信號對應的交互指令為播放某音樂,那麼電子設備便可以獲取本地保存的音樂資源,或者向伺服器請求該音樂資源,進而進行播放。如果用戶語音信號對應的交互指令為詢問今天天氣情況,那麼電子設備便可以向伺服器請求天氣資源,進而用語音播放等形式將天氣情況告知用戶,進而完成交互指令的響應。
可見,本發明實施例所提供的方案中,具有語音交互功能的電子設備在處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令,若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位,然後繼續接收語音信號,並對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應用戶語音信號對應的交互指令。電子設備將喚醒指令所對應的聲源方位確定為用戶聲源方位,並對繼續接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處於用戶聲源方位的用戶發出的語音信號,因此可以進行正確的響應,提升用戶體驗。
作為本發明實施例的一種實施方式,所述對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號的步驟,可以包括:
對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,並對繼續接收到的語音信號中來源於所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。
為了使獲得的用戶語音信號更強,以便電子設備更準確地響應用戶語音信號對應的交互指令,電子設備在對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理的同時,還可以對繼續接收到的語音信號中來源於用戶聲源方位的語音信息號進行波束增強處理,以增加來源於用戶聲源方位的語音信號的能量,這樣電子設備可以將波束增強處理後的語音信號作為用戶語音信號,對該用戶語音信號進行更準確地識別及解析,得到正確的交互指令,進而,正確地響應該交互指令。
需要說明的是,上述波束增強處理可以採用現有的任意波束增強處理方式,例如可以為語音提取分離、對角加載算法、自適應波速形成等方式,只要能夠達到將語音信號的能量進行增強的目的即可,在此不做具體限定。
作為本發明實施例的一種實施方式,上述方法還可以包括:
按照所述用戶聲源方位指示用戶方位。
為了方便用戶查看當前用戶聲源方位,電子設備可以按照用戶聲源方位指示用戶方位。在一種實施方式中,電子設備可以採用指示燈的方式指示用戶方位,例如,用戶聲源方位為45度方位,那麼電子設備便可以在45度方位上點亮指示燈。在另一種實施方式中,如果電子設備具有顯示屏幕,那麼電子設備也可以在顯示屏幕上顯示用戶聲源方位,或者,在顯示屏幕上顯示指示燈,這都是合理的。在另一種實施方式中,如果電子設備為機器人等具有可活動部件的電子設備,那麼電子設備也可以採用轉動頭部、揮動胳膊等方式來指示用戶方位。
作為本發明實施例的一種實施方式,上述方法還可以包括:
判斷從所述用戶聲源方位接收到的語音信號對應的交互指令是否為聲源定位方式轉換指令;若為是,繼續接收語音信號,將所接收到的語音信號中音量最大者對應的聲源方位確定為用戶聲源方位,並將所接收到的語音信號中音量最大者確定為用戶語音信號,響應所述用戶語音信號對應的交互指令。
由於電子設備的應用場景是可以變化的,當電子設備用於響應多個用戶發出的交互指令時,為了更準確地的響應該多個用戶發出的交互指令,電子設備在接收到來源於用戶聲源方位的語音信號時,可以判斷該語音信號對應的交互指令是否為聲源定位方式轉換指令,如果是,那麼說明用戶發出了聲源定位方式轉換指令,來指示電子設備的應用場景改變了,那麼電子設備便需要響應該聲源定位方式轉換指令,也就是轉換聲源定位的方式。
具體來說,如果該語音信號對應的交互指令為聲源定位方式轉換指令,那麼電子設備便繼續接收語音信號,同時轉換聲源定位的方式,轉換後的聲源定位方式即為:將所接收到的語音信號中音量最大者對應的聲源方位確定為用戶聲源方位,可以理解的是,那麼電子設備此時便可以將所接收到的語音信號中音量最大者確定為用戶語音信號,進而,響應該用戶語音信號對應的交互指令。這樣,在處在不同方位的多個用戶發出交互指令時,電子設備可以接收到每個用戶發出的交互指令,而不是將一個固定的方位作為用戶聲源方位。
當然,在採用轉換後的聲源定位方式定位用戶聲源定位後,電子設備可以對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,也可以對繼續接收到的語音信號中來源於用戶聲源方位的語音信息號進行波束增強處理,進而得到用戶語音信號,這都是合理的。
由於電子設備判斷所接收的每一語音信號對應的交互指令是否為喚醒指令的過程是一樣的,所以,作為本發明實施例的一種實施方式,所述判斷所接收到的語音信號對應的交互指令是否為喚醒指令的步驟,包括:
按照以下方式判斷所接收的每一語音信號對應的交互指令是否為喚醒指令:
對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬於預設頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;
判斷過濾處理後的目標語音信號對應的交互指令是否為喚醒指令。
可以理解的是,電子設備所在的環境中可能存在多個聲源,那麼電子設備也就會接收到周圍環境中的各聲源發出的語音信號,例如,如果電子設備放置於家庭環境中,那麼該電子設備可能接收到多個聲源發出的語音信號,例如,電視機、電冰箱等家電設備發出的語音信號,或者窗外傳來的語音信號等。這些聲源所發出的語音信號中可能有一些語音信號的頻率不屬於人所發出的語音信號的頻率範圍,所以為了濾除該類語音信號,而更準確地定位用戶聲源方位,電子設備可以對接收到的每一語音信號進行過濾處理。
具體來說,人發出的聲音的頻率範圍一般為100-20000hz,那麼不屬於該頻率範圍內的語音信號即不是人所發出的語音信號,那麼也就不可能是用戶發出的語音信號,所以,為了有效去除一些不屬於用戶所發出的語音信號頻率範圍內的語音信號對定位用戶聲源方位的不良影響,在判斷所接收的語音信號對應的交互指令是否為喚醒指令之前,電子設備可以對目標語音信號進行過濾處理,濾除目標語音信號中頻率屬於預設頻率段的語音信號,然後再判斷過濾處理後的目標語音信號對應的交互指令是否為喚醒指令,其中,該目標語音信號指代的是電子設備在睡眠狀態下所接收的一個語音信號。
上述預設頻率段可以為不屬於人發出的聲音頻率範圍內的一個或多個頻率段,可以為低頻頻率段,例如,可以為0-100hz;也可以為高頻頻率段,例如20000-40000hz等,當然也可以包括低頻頻率段及高頻頻率段,這都是合理的。
在電子設備的使用環境中往往存在一些頻率屬於預設頻率段的語音信號,例如一些低音音響設備,其所發出的語音信號的頻率一般為幾十赫茲,明顯不屬於人發出的語音信號的頻率範圍,所以採用上述過濾處理方式即可濾除該類語音信號,減少後續定位用戶聲源方位的工作量,同時使用戶聲源定位更加準確。
對於電子設備所在環境中存在多個聲源的情況而言,作為本發明實施例的一種實施方式,所述定位所接收到的語音信號的聲源方位為用戶聲源方位的步驟,包括:
定位並記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;
根據第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設備處於睡眠狀態的情況下,定位並記錄的所接收到的語音信號的聲源方位,該語音信號對應的交互指令不為喚醒指令。
在電子設備處於睡眠狀態的情況下,判斷出所接收到的語音信號未觸發喚醒指令時,電子設備可以定位並記錄該語音信號的聲源方位,為了方便描述本發明實施例所提供的方案,將該語音信號的聲源方位作為第一類聲源方位。
由於此時電子設備處於睡眠狀態,且所接收到的語音信號對應的交互指令不是喚醒指令,所以可以理解的是,此時電子設備接收到的語音信號是噪音聲源發出的語音信號,並不是用戶發出的語音信號,也就不會觸發電子設備處理該語音信號,那麼電子設備可以將這些語音信號的聲源方位作為第一類聲源方位記錄下來,也就是作為噪音聲源的方位記錄下來,並繼續接到語音信號。
當電子設備判斷出所接收到的語音信號對應的交互指令為喚醒指令時,電子設備可以定位當前接收到的語音信號的聲源方位,並將該聲源方位作為第二類聲源方位記錄下來。
電子設備記錄了上述第一類聲源方位和第二類聲源方位後,便可以根據該第一類聲源方位和該第二類聲源方位定位用戶聲源方位。電子設備在睡眠狀態下接收到的語音信號可能是變化的,也就是說,隨著時間的推移,可能有一些聲源不再發出語音信號,而又可能會有一些之前未發出語音信號的聲源發出語音信號。
例如,電子設備在睡眠狀態下時,可能有電視、空調在發出語音信號,過了一段時間,電視可能被關閉,那麼電視所對應的第一類聲源方位也就不存在了,又過了一段時間,電腦可能被開啟,播放音樂,那麼在第一類聲源方位中便出現了電腦所對應的聲源方位。又例如,電子設備在睡眠狀態下時,可能在某一時刻,一個人在某處發出了語音信號,但是該語音信號對應的交互指令不是喚醒指令,電子設備沒有由睡眠狀態切換至工作狀態,那麼電子設備在此時便會將該人所在的方位記錄在第一類聲源方位中,過了一段時間,該人不再發出語音信號,所以,第一類聲源方位可能是隨著時間而變化的。
由於電子設備由睡眠狀態切換至工作狀態的時刻之前較長時刻對應的第一類聲源方位與第二類聲源方位的差異性可能較大,那麼為了更加簡便且準確地定位用戶聲源方位,可以採用第二類聲源方位和電子設備由睡眠狀態切換至工作狀態時刻之前預設時間段內的第一類聲源方位,來確定用戶目標聲源方位。其中,該預設時間段可以由本領域技術人員根據電子設備的使用場景等實際因素確定,例如,可以為2秒、3秒或5秒等,在此不做具體限定。
在一種實施方式中,根據第一類聲源方位和第二類聲源方位定位用戶聲源方位的方式可以為:判斷所述第二類聲源方位中是否存在不屬於所述第一類聲源方位的聲源方位;若為是,將第二類聲源方位中不屬於第一類聲源方位的聲源方位定位為用戶聲源方位。
可以理解的是,如果第二類聲源方位中存在不屬於第一類聲源方位的聲源方位,那麼該第二類聲源方位中不屬於第一類聲源方位的聲源方位即為:在電子設備由睡眠狀態切換至工作狀態時所定位的,且不屬於第一類聲源方位的聲源方位,那麼便可以確定該聲源方位為用戶發出的對應的交互指令為喚醒指令的語音信號的聲源方位,那麼該聲源方位即為用戶聲源方位。
舉例而言,電子設備由睡眠狀態切換至工作狀態時刻之前預設時間段內的第一類聲源方位為3個,分別為:0度、30度和90度方位,電子設備由睡眠狀態切換至工作狀態時,記錄的第二聲源方位為4個,分別為:0度、30度、60度和90度方位,顯然,60度聲源方位是在電子設備由睡眠狀態切換至工作狀態時新出現的一個聲源方位,而此時電子設備剛好接收到了對應的交互指令為喚醒指令的語音信號,那麼便可以確定該60度聲源方位即為用戶發出的對應的交互指令為喚醒指令的語音信號的聲源方位,也就是用戶聲源方位。
作為本發明實施例的一種實施方式,所述將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,可以包括:
確定所述第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量;當所確定的數量大於1時,將不屬於所述預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位。
在一些情況下,電子設備在接收到對應的交互指令為喚醒指令的語音信號的同時,可能存在另一個或多個聲源方位不屬於第一類聲源方位的其他聲源,這些其他聲源也發出了語音信號,那麼電子設備也就會接收到這些語音信號。例如,在用戶發出對應的交互指令為喚醒指令的語音信號的同時,低音音響設備被開啟,發出語音信號,那麼電子設備便會接收到用戶發出的語音信號和低音音響設備發出的語音信號,顯然,這兩個語音信號的聲源方位均不屬於第一類聲源方位,所以,第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量在此時便為多個。
在這種情況下,為了準確地定位用戶聲源方位,電子設備首先可以確定第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量,如果所確定的數量大於1,說明此時第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量是多個,那麼電子設備便可以將不屬於預設頻率段的語音信號對應的聲源方位確定為用戶聲源方位。
舉例而言,在用戶發出對應的交互指令為喚醒指令的語音信號的同時,低音音響設備被開啟,發出語音信號,那麼電子設備便會接收到用戶發出的語音信號和低音音響設備發出的語音信號,電子設備可以確定第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量為2,顯然是大於1的,那麼電子設備便可以將不屬於預設頻率段的語音信號對應的聲源方位,確定為用戶聲源方位,由於低音音響設備發出的語音信號的頻率屬於一個固定的低頻頻率範圍,那麼將預設頻率段設定為該低頻頻率範圍,便可以準確地將低音音響設備所在的聲源方位排除,進而,電子設備便可以準確地確定出用戶聲源方位。
作為本發明實施例的一種實施方式,所述將不屬於所述預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位的步驟,可以包括:
確定不屬於所述預設頻率段的語音信號對應的聲源方位的數量;當所確定的數量大於1時,將所述不屬於所述預設頻率段的語音信號中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
由於在一些情況下,不屬於上述預設頻率段的語音信號對應的聲源方位的數量也可能是大於1的,也就是說,可能存在多個不屬於上述預設頻率段的語音信號對應的聲源方位,那麼此時為了準確確定用戶聲源方位,電子設備可以進一步通過語音信號的波形比較來確定用戶聲源方位。
可以理解的是,用戶聲源方位即為用戶發出喚醒指令所對應的聲源方位,那麼上述預設波形即可以為喚醒詞對應的語音信號的波形,這樣,與該預設波形的相似度大於第一預設值的波形顯然是與喚醒詞對應的語音信號的波形相似度很高的波形,那麼也就說明該語音信號對應的交互指令很可能就是喚醒指令,那麼該語音信號的聲源方位也就是用戶聲源方位。其中,第一預設值可以由本領域技術人員根據電子設備的使用場景中存在的聲源所發出語音信號的波形特點等因素進行設定,在此不做具體限定。
例如,在用戶發出對應的交互指令為喚醒指令的語音信號的同時,還有其他人發出語音信號,那麼電子設備便會接收到用戶發出的語音信號和其他人發出的語音信號,其他人發出的語音信號的頻率也不屬於預設頻率段,電子設備可以確定不屬於上述預設頻率段的語音信號對應的聲源方位的數量為多個,顯然是大於1的,那麼,電子設備便可以將這多個語音信號的波形與預設的喚醒詞對應的波形進行比較,相似度高於第一預設值的語音信號的聲源方位,也就是用戶聲源方位。可見,通過該語音信號波形比較方式可以更加準確地確定用戶聲源方位。
需要說明的是,在確定出第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量大於1時,也可以先通過上述語音信號波形比較方式,將與預設波形相似度較高的波形對應的語音信號的聲源方位確定出來,如果所確定出的數量仍然大於1,那麼便可以進一步將不屬於上述預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位,這也是合理的。
作為本發明實施例的一種實施方式,在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,上述方法還可以包括:
判斷處於同一聲源方位的第一語音信號與第二語音信號的能量差值是否大於第二預設值;如果是,將該第二語音信號對應的第二類聲源方位確定為所述用戶聲源方位,其中,所述第一語音信號為所述電子設備處於睡眠狀態時接收到的語音信號,所述第二語音信號為所述電子設備處於工作狀態時接收到的語音信號。
由於用戶發出對應的交互指令為喚醒指令的語音信號時,可能正處於與第一類聲源方位中某個聲源方位相同的方位上,那麼此時電子設備定位出的第二類聲源方位就會出現均屬於第一類聲源方位的情況,在這種情況下,為了能夠準確定出用戶聲源方位,電子設備可以判斷處於同一聲源方位的第一語音信號與第二語音信號的能量差值是否大於第二預設值。其中,語音信號的能量可以由音量、頻率、波形特徵等來表徵,在此不做具體限定。
需要說明的是,為了方便描述,上述第一語音信號指代的是電子設備處於睡眠狀態時所接收到的語音信號,其對應的聲源方位也就是第一類聲源方位,上述第二語音信號指代的是電子設備處於工作狀態時所接收到的語音信號,其對應的聲源方位也就是第二類聲源方位。進一步需要說明的是,上述第二預設值可以由本領域技術人員根據電子設備的使用場景中存在的聲源所發出的語音信號的能量等因素進行設定,在此不做具體限定。
如果處於同一聲源方位的第一語音信號與第二語音信號的能量差值大於第二預設值,那麼說明第一語音信號與第二語音信號很可能不是同一個聲源發出的語音信號。舉例來說,如果第一語音信號與第二語音信號都是冰箱所發出的語音信號,那麼二者的能量差值是非常小的,也就不會大於第二預設值;如果第一語音信號是冰箱所發出的語音信號,第二語音信號是用戶發出的語音信號,那麼二者的能量差值一般是比較大的,也就會大於第二預設值。所以當處於同一聲源方位的第一語音信號與第二語音信號的能量差值大於第二預設值時,電子設備便可以將該第二語音信號對應的第二類聲源方位確定為用戶聲源方位。
作為本發明實施例的一種實施方式,在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,上述方法還可以包括:
將所述第二類聲源方位中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
在第二類聲源方位均屬於第一類聲源方位的情況下,電子設備也可以通過語音信號波形比較的方式確定用戶聲源方位,具體實現方式與上述波形比較方式類似,相關之處可以參見上述波形比較方式部分的說明,在此不再贅述。
需要說明的是,如果上述處於同一聲源方位的第一語音信號與第二語音信號的能量差值大於第二預設值的第二語音信號為多個,那麼也可以進一步通過比較該多個第二語音信號的波形與預設波形的相似度來確定用戶聲源方位,具體實施方式可以參見上述語音信號波形比較方式部分的說明,在此不再贅述。
作為本發明實施例的一種實施方式,所述將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位的步驟,可以包括:
確定所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位為目標聲源方位;
根據所述目標聲源方位,確定目標範圍[a,b],並將所述目標範圍內的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設方位差值的差值,b為所述目標聲源方位與第二預設方位差值的加和。
可以理解的是,用戶在發出語音信號的過程中,可能會在小範圍內改變自己所處的位置,那麼其發出的語音信號的聲源方位也就會隨之變化,為了可以在這種情況下也能準確地進行語音信號地接收,電子設備可以將第二類聲源方位中不屬於第一類聲源方位的聲源方位確定為目標聲源方位,然後根據該目標聲源方位,確定目標範圍[a,b],並將該目標範圍內的聲源方位確定為用戶聲源方位。
其中,a可以為目標聲源方位與第一預設方位差值的差值,b可以為目標聲源方位與第二預設方位差值的加和。該第一預設方位差值及第二預設方位差值可以相等,也可以不相等,其具體取值可以由本領域技術人員根據電子設備的使用場景及用戶的活動情況進行設定,例如,可以為10度、15度、30度等,在此不做具體限定。
在一種實施方式中,第一預設方位差值與第二預設方位差值可以相等,例如,用戶聲源方位為60度方位,第一預設方位差值及第二預設方位差值均為30度,那麼電子設備便可以將(60-30=30)度到(60+30=90)度範圍內的聲源方位確定為最終的用戶聲源方位。當然,在另一種實施方式中,第一預設方位差值與第二預設方位差值可以不相等,例如,用戶聲源方位為60度方位,第一預設方位差值為10度,第二預設方位差值為15度,那麼電子設備便可以將(60-10=50)度到(60+15=75)度範圍內的聲源方位確定為最終的用戶聲源方位,這都是合理的。
相應於上述方法實施例,本發明實施例還提供了一種語音信號處理裝置,下面對本發明實施例所提供的一種語音信號處理裝置進行介紹。
如圖2所示,一種語音信號處理裝置,應用於具有語音交互功能的電子設備,所述裝置包括:
喚醒指令判斷模塊210,用於在所述電子設備處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令;
聲源定位模塊220,用於在所接收到的語音信號對應的交互指令為喚醒指令的情況下,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位;
用戶語音信號獲得模塊230,用於繼續接收語音信號,並對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;
第一交互指令響應模塊240,用於響應所述用戶語音信號對應的交互指令。
可見,本發明實施例所提供的方案中,具有語音交互功能的電子設備在處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令,若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位,然後繼續接收語音信號,並對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應用戶語音信號對應的交互指令。電子設備將喚醒指令所對應的聲源方位確定為用戶聲源方位,並對繼續接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處於用戶聲源方位的用戶發出的語音信號,因此可以進行正確的響應,提升用戶體驗。
作為本發明實施例的一種實施方式,所述用戶語音信號獲得模塊230可以包括:
用戶語音信號獲得子模塊(圖2中未示出),用於對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,並對繼續接收到的語音信號中來源於所述用戶聲源方位的語音信息號進行波束增強處理,獲得所述用戶語音信號。
電子設備對繼續接收到的語音信號中來源於用戶聲源方位的語音信息號進行波束增強處理,增加來源於用戶聲源方位的語音信息號的能量,這樣電子設備可以將波束增強處理後的語音信號作為用戶語音信號,對用戶語音信號進行更準確地解析識別,得到正確的交互指令,進而,正確地響應該交互指令。
作為本發明實施例的一種實施方式,所述裝置還可以包括:
用戶方位指示模塊(圖2中未示出),用於按照所述用戶聲源方位指示用戶方位。
電子設備可以按照用戶聲源方位指示用戶方位,可以方便用戶查看當前用戶聲源方位。
作為本發明實施例的一種實施方式,所述裝置還可以包括:
轉換指令判斷模塊(圖2中未示出),用於判斷從所述用戶聲源方位接收到的語音信號對應的交互指令是否為聲源定位方式轉換指令;
第二交互指令響應模塊(圖2中未示出),用於在從所述用戶聲源方位接收到的語音信號對應的交互指令為聲源定位方式轉換指令的情況下,繼續接收語音信號,將所接收到的語音信號中音量最大者對應的聲源方位確定為用戶聲源方位,並將所接收到的語音信號中音量最大者確定為用戶語音信號,響應所述用戶語音信號對應的交互指令。
電子設備在接收到來源於用戶聲源方位的語音信號時,可以判斷該語音信號對應的交互指令是否為聲源定位方式轉換指令,如果是,那麼說明用戶發出了聲源定位方式轉換指令,來指示電子設備的應用場景改變了,那麼電子設備便可以響應該聲源定位方式轉換指令,以響應多個用戶發出的交互指令,並可以更準確地的響應該交互指令。
作為本發明實施例的一種實施方式,所述喚醒指令判斷模塊210可以包括:
信號過濾子模塊(圖2中未示出)和指令判斷子模塊(圖2中未示出);
所述喚醒指令判斷模塊210,具體用於通過所述信號過濾子模塊和指令判斷子模塊判斷所接收的每一語音信號對應的交互指令是否為喚醒指令;
所述信號過濾子模塊,用於對目標語音信號進行過濾處理,濾除所述目標語音信號中頻率屬於預設頻率段的語音信號,其中,所述目標語音信號為:所接收的一個語音信號;
所述指令判斷子模塊,用於判斷過濾處理後的目標語音信號對應的交互指令是否為喚醒指令。
在電子設備的使用環境中往往存在一些頻率屬於預設頻率段的語音信號,例如一些低音音響設備,其所發出的語音信號的頻率一般為幾十赫茲,明顯不屬於人發出的語音信號的頻率範圍,所以採用上述過濾處理方式即可濾除該類語音信號,減少後續定位用戶聲源方位的工作量,同時使用戶聲源定位更加準確。
作為本發明實施例的一種實施方式,所述聲源定位模塊220可以包括:
聲源定位子模塊(圖2中未示出),用於定位並記錄所接收到的語音信號的聲源方位,作為第二類聲源方位;
用戶聲源方位確定子模塊(圖2中未示出),用於根據第一類聲源方位和所述第二類聲源方位定位用戶聲源方位,其中,所述第一類聲源方位為所述電子設備處於睡眠狀態的情況下,定位並記錄的所接收到的語音信號的聲源方位,該語音信號對應的交互指令不為喚醒指令。
在電子設備處於存在多個聲源的環境中時,通過第一類聲源方位和第二類聲源方位可以準確定位用戶聲源方位。
作為本發明實施例的一種實施方式,所述用戶聲源方位確定子模塊可以包括:
判斷單元(圖2中未示出),用於判斷所述第二類聲源方位中是否存在不屬於所述第一類聲源方位的聲源方位;
用戶聲源方位確定單元(圖2中未示出),用於在所述第二類聲源方位中存在不屬於所述第一類聲源方位的聲源方位的情況下,將所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位定位為用戶聲源方位。
由於第二類聲源方位中不屬於第一類聲源方位的聲源方位即為:在電子設備由睡眠狀態切換至工作狀態時所定位的,且不屬於第一類聲源方位的聲源方位,那麼便可以確定該聲源方位為用戶發出的對應的交互指令為喚醒指令的語音信號的聲源方位,那麼便可以準確定位用戶聲源方位。
作為本發明實施例的一種實施方式,所述用戶聲源方位確定單元可以包括:
數量確定子單元(圖2中未示出),用於確定所述第二類聲源方位中不屬於第一類聲源方位的聲源方位的數量;
第一方位確定單元(圖2中未示出),用於當所確定的數量大於1時,將不屬於預設頻率段的語音信號對應的聲源方位,確定為所述用戶聲源方位。
由於低音音響等能夠發出噪音的設備所發出的語音信號的頻率一般屬於一個固定的頻率範圍,那麼將預設頻率段設定為該固定頻率範圍,電子設備可以將不屬於預設頻率段的語音信號對應的聲源方位,確定為用戶聲源方位,這樣可以準確地將屬於預設頻率段的語音信號的聲源方位排除,進而,電子設備便可以準確地確定出用戶聲源方位。
作為本發明實施例的一種實施方式,所述第一方位確定子單元,具體可以用於確定不屬於所述預設頻率段的語音信號對應的聲源方位的數量;當所確定的數量大於1時,將所述不屬於所述預設頻率段的語音信號中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
通過將不屬於預設頻率段的語音信號中,波形與預設波形的相似度的判斷,可以在不屬於預設頻率段的語音信號為多個時,準確定位用戶聲源方位。
作為本發明實施例的一種實施方式,所述裝置還可以包括:
能量差值判斷模塊(圖2中未示出),用於在所述第二類聲源方位均屬於所述第一類聲源方位的情況下,判斷處於同一聲源方位的第一語音信號與第二語音信號的能量差值是否大於第二預設值,其中,所述第一語音信號為所述電子設備處於睡眠狀態時接收到的語音信號,所述第二語音信號為所述電子設備處於工作狀態時接收到的語音信號;如果是,將該第二語音信號對應的第二類聲源方位確定為所述用戶聲源方位。
由於用戶發出對應的交互指令為喚醒指令的語音信號時,可能正處於與第一類聲源方位中某個聲源方位相同的方位上,那麼此時電子設備定位出的第二類聲源方位就會出現均屬於第一類聲源方位的情況,在這種情況下,如果處於同一聲源方位的第一語音信號與第二語音信號的能量差值大於第二預設值,那麼說明第一語音信號與第二語音信號很可能不是同一個聲源發出的語音信號。所以當處於同一聲源方位的第一語音信號與第二語音信號的能量差值大於第二預設值時,電子設備便可以將該第二語音信號對應的第二類聲源方位確定為用戶聲源方位。
作為本發明實施例的一種實施方式,所述裝置還可以包括:
波形比較模塊(圖2中未示出),用於將所述第二類聲源方位中,波形與預設波形的相似度大於第一預設值的語音信號對應的聲源方位確定為所述用戶聲源方位。
通過將第二類聲源方位對應的語音信號的波形與預設波形的相似度的判斷,可以在第二類聲源方位均屬於第一類聲源方位的情況下,準確定位用戶聲源方位。
作為本發明實施例的一種實施方式,所述用戶聲源方位確定子模塊可以包括:
目標聲源方位確定單元(圖2中未示出),用於確定所述第二類聲源方位中不屬於所述第一類聲源方位的聲源方位為目標聲源方位;
第二方位確定單元(圖2中未示出),用於根據所述目標聲源方位,確定目標範圍[a,b],並將所述目標範圍內的聲源方位確定為所述用戶聲源方位,其中,a為所述目標聲源方位與第一預設方位差值的差值,b為所述目標聲源方位與第二預設方位差值的加和。
用戶在發出語音信號的過程中,可能會在小範圍內改變自己所處的位置,那麼其發出的語音信號的聲源方位也就會隨之變化,採用上述用戶聲源方位確定方式,電子設備可以在這種情況下準確地進行語音信號地接收,進而進行準確地響應行為。
本發明實施例還提供了一種電子設備,下面對本發明實施例所提供的電子設備進行介紹。
如圖3所示,一種電子設備,所述電子設備包括:
殼體301、處理器302、存儲器303、電路板304和電源電路305,其中,電路板304安置在殼體301圍成的空間內部,處理器302和存儲器303設置在電路板304上;電源電路305,用於為電子設備的各個電路或器件供電;存儲器303用於存儲可執行程序代碼;處理器302通過讀取存儲器303中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行上述方法實施例中所述的語音信號處理方法。
一種實現方式中,上述語音信號處理方法可以包括:
在所述電子設備處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令;
若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位;
繼續接收語音信號,並對繼續接收到的語音信號中來源於所述用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號;
響應所述用戶語音信號對應的交互指令。
上述語音信號處理方法的其他實現方式參見前述方法實施例部分的說明,這裡不再贅述。
處理器302對上述步驟及上述語音信號處理方法的其他實現方式的具體執行過程以及處理器302通過運行可執行程序代碼來進一步執行的過程,可以參見本發明實施例中圖1及圖2所示實施例的描述,在此不再贅述。
需要說明的是,該電子設備以多種形式存在,包括但不限於:
(1)移動通信設備:這類設備的特點是具備移動通信功能,並且以提供話音、數據通信為主要目標。這類終端包括:智慧型手機(例如iphone)、多媒體手機、功能性手機,以及低端手機等。
(2)超移動個人計算機設備:這類設備屬於個人計算機的範疇,有計算和處理功能,一般也具備移動上網特性。這類終端包括:pda、mid和umpc設備等,例如ipad。
(3)可攜式娛樂設備:這類設備可以顯示和播放多媒體內容。該類設備包括:音頻、視頻播放器(例如ipod),掌上遊戲機,電子書,以及智能玩具和可攜式車載導航設備。
(4)伺服器:提供計算服務的設備,伺服器的構成包括處理器、硬碟、內存、系統總線等,伺服器和通用的計算機架構類似,但是由於需要提供高可靠的服務,因此在處理能力、穩定性、可靠性、安全性、可擴展性、可管理性等方面要求較高。
(5)其他具有數據交互功能的電子裝置。
可見,本發明實施例所提供的方案中,電子設備的處理器通過讀取存儲器中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,在處於睡眠狀態情況下,接收語音信號,並判斷所接收到的語音信號對應的交互指令是否為喚醒指令,若為是,由睡眠狀態切換至工作狀態,並定位所接收到的語音信號的聲源方位為用戶聲源方位,然後繼續接收語音信號,並對繼續接收到的語音信號中來源於用戶聲源方位以外的語音信號進行噪聲抑制處理,獲得用戶語音信號,進而響應用戶語音信號對應的交互指令。電子設備將喚醒指令所對應的聲源方位確定為用戶聲源方位,並對繼續接收到的語音信號中該方位以外的語音信號進行噪聲抑制處理,獲得的用戶語音信號即為處於用戶聲源方位的用戶發出的語音信號,因此可以進行正確的響應,提升用戶體驗。
對於電子設備實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於裝置實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。