新四季網

設備控制方法、裝置及智能設備與流程

2023-05-25 23:56:16


本發明涉及設備控制技術領域,特別是涉及一種設備控制方法、一種設備控制裝置及一種智能設備。



背景技術:

隨著科學技術的快速發展,智能設備逐漸應用到各行各業。現有技術中,用戶每次與智能設備交互之前,需要通過智能設備的預設喚醒詞來喚醒智能設備,也就是說,用戶需通過預設喚醒詞將智能設備從待機狀態切換至工作狀態,然後智能設備才能響應再次接收到的用戶語音信息對應的交互指令,並在響應完上述交互指令後進入待機狀態,若用戶需要再次與智能設備交互,需重複上述過程,重新通過預設喚醒詞喚醒智能設備。

例如,智能設備的名字叫「小明」,那麼上述預設喚醒詞可以為「小明」,則用戶開啟智能設備,並且智能設備處於待機狀態時,用戶想與智能設備進行交互,過程如下:

用戶說「小明」;

智能設備收集到用戶發出的語音信息,識別出包含喚醒詞「小明」,從待機狀態切換至工作狀態;

用戶再次發出語音信息,智能設備的識別結果為:「今天天氣怎麼樣呀?」;

智能設備收集到用戶再次發出的語音信息後,響應再次收集到的語音信息對應的交互指令,如:搜索今天的天氣信息,並向用戶播放搜索到的天氣信息;

在完成響應後,由工作狀態切換至待機狀態。

這時,若用戶需要繼續與智能設備交互,則需重複上述過程,即再次通過喚醒詞喚醒智能設備,進而完成與智能設備的再次交互。

可見,採用上述方式實現用戶與智能設備的交互時,用戶需在每次與智能設備交互之前先喚醒智能設備,過程繁瑣,用戶體驗差。



技術實現要素:

本發明實施例的目的在於提供一種設備控制方法、裝置及智能設備,以簡化用戶與智能設備的交互過程,提高用戶體驗。具體技術方案如下:

第一方面,本發明實施例提供了一種設備控制方法,應用於智能設備,所述方法包括:

響應完第一用戶語音信息對應的交互指令後,持續處於工作狀態,並判斷第一時間間隔是否小於等於目標時間間隔閾值,其中,所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、不包含待機音頻段的用戶語音信息,所述待機音頻段為:語音識別結果包含預設待機詞的音頻段,所述第一時間間隔為:從響應完第一用戶語音信息對應的交互指令的時刻起未接收到用戶語音信息的時間間隔;

若為是,檢測到再次接收到用戶語音信息時,響應目標交互指令,其中,所述目標交互指令為:再次接收到的用戶語音信息對應的交互指令;

若為否,由工作狀態切換至待機狀態。

可選的,所述檢測到再次接收到用戶語音信息時,響應目標交互指令的步驟,包括:

檢測到再次接收到用戶語音信息時,判斷再次接收到的用戶語音信息中是否包含所述待機音頻段;

若包含,由工作狀態切換至待機狀態。

可選的,所述方法還包括:

所述智能設備處於待機狀態時,判斷接收到的用戶語音信息中是否包含喚醒音頻段,其中,所述喚醒音頻段為:語音識別結果中包含預設喚醒詞的音頻段;

若包含,由待機狀態切換至工作狀態,並確定包含所述喚醒音頻段的用戶語音信息的目標接收方向;

所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、來自所述目標接收方向的、不包含待機音頻段的用戶語音信息;

所述再次接收到的用戶語音信息為:再次接收的、來自所述目標接收方向的用戶語音信息。

可選的,所述響應目標交互指令的步驟,包括:

對再次接收到的用戶語音信息進行語音識別,獲得識別結果;

根據所述識別結果確定再次接收到的用戶語音信息的交互場景;

按照所述交互場景響應目標交互指令。

可選的,所述按照所述交互場景響應目標交互指令的步驟,包括:

判斷所述交互場景是否為音頻播放場景;

若為是,播放目標交互指令對應的音頻,並由工作狀態切換至待機狀態。

可選的,所述方法還包括:

獲得以下信息中的至少一種,並根據所獲得的信息確定所述目標時間間隔閾值的取值:

用戶的語速;

用戶的表達習慣;

環境噪聲參數。

第二方面,本發明實施例還提供了一種設備控制裝置,應用於智能設備,所述裝置包括:

第一判斷模塊、響應模塊、第一切換模塊;

其中,

所述第一判斷模塊,用於響應完第一用戶語音信息對應的交互指令後,持續處於工作狀態,並判斷第一時間間隔是否小於等於目標時間間隔閾值,其中,所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、不包含待機音頻段的用戶語音信息,所述待機音頻段為:語音識別結果中包含預設待機詞的音頻段,所述第一時間間隔為:從響應完第一用戶語音信息對應的交互指令的時刻起未接收到用戶語音信息的時間間隔;

所述響應模塊,用於若所述第一判斷模塊的判斷結果為是,檢測到再次接收到用戶語音信息時,響應目標交互指令,其中,所述目標交互指令為:再次接收到的用戶語音信息對應的交互指令;

所述第一切換模塊,用於若所述第一判斷模塊的判斷結果為否,由工作狀態切換至待機狀態。

可選的,所述響應模塊,包括:

判斷子模塊,用於檢測到再次接收到用戶語音信息時,判斷再次接收到的用戶語音信息中是否包含所述待機音頻段;

切換子模塊,用於若所述判斷子模塊的判斷結果為包含待機音頻段時,由工作狀態切換至待機狀態。

可選的,所述裝置還包括:

第二判斷模塊,用於所述智能設備處於待機狀態時,判斷接收到的用戶語音信息中是否包含喚醒音頻段,其中,所述喚醒音頻段為:語音識別結果中包含預設喚醒詞的音頻段;

第二切換模塊,用於若所述第二判斷模塊的判斷結果為包含喚醒音頻段,由待機狀態切換至工作狀態,並確定包含所述喚醒音頻段的用戶語音信息的目標接收方向;

所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、來自所述目標接收方向的、不包含待機音頻段的用戶語音信息;

所述再次接收到的用戶語音信息為:再次接收的、來自所述目標接收方向的用戶語音信息。

可選的,所述響應模塊,包括:

語音識別子模塊,用於對再次接收到的用戶語音信息進行語音識別,獲得識別結果;

確定交互場景子模塊,用於根據所述識別結果確定再次接收到的用戶語音信息的交互場景;

響應子模塊,用於按照所述交互場景響應目標交互指令。

可選的,所述響應子模塊具體用於:

判斷所述交互場景是否為音頻播放場景;

若為是,播放目標交互指令對應的音頻,並由工作狀態切換至待機狀態。

可選的,所述裝置還包括:

調整目標時間間隔閾值模塊,用於獲得以下信息中的至少一種,並根據所獲得的信息確定所述目標時間間隔閾值的取值:

用戶的語速;

用戶的表達習慣;

環境噪聲參數。

第三方面,本發明實施例還提供了一種智能設備,所述智能設備包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內部,處理器和存儲器設置在電路板上;電源電路,用於為電子設備的各個電路或器件供電;存儲器用於存儲可執行程序代碼;處理器通過讀取存儲器中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行權利要求1-6任一項所述的設備控制方法。

與現有技術相比,本發明實施例提供的方案在響應完第一用戶語音信息對應的交互指令後,智能設備持續處於工作狀態,當第一時間間隔小於等於目標時間間隔閾值時,在再次接收到用戶語音信息後,響應再次接收到的用戶語音信息對應的交互指令,從而可以實現從響應完第一用戶語音信息對應的交互指令的時刻起,在目標時間間隔閾值內,用戶不需要再次喚醒智能設備就可以與智能設備進行再次交互,過程簡便,用戶體驗較好。

附圖說明

為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為本發明實施例所提供的一種設備控制方法的流程圖;

圖2為本發明實施例所提供的一種設備控制方法的另一流程圖;

圖3為本發明實施例所提供的一種設備控制裝置的結構示意圖;

圖4為本發明實施例所提供的一種設備控制裝置的另一結構示意圖;

圖5為本發明實施例所提供的一種智能設備的結構示意圖。

具體實施方式

下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。

為了解決現有技術問題,本發明實施例提供了一種智能設備控制方法、裝置及電子設備,以簡化用戶與智能設備的交互過程,提高用戶體驗。

下面先對本發明實施例中涉及的概念進行介紹。

預設喚醒詞:是指可以喚醒智能設備的詞語。例如,喚醒詞為「小明」,智能設備在接收到用戶語音信息後,獲得語音識別結果,當語音識別結果中包含「小明」時,智能設備被喚醒,也就是說,智能設備由待機狀態切換至工作狀態。

預設待機詞:是指可以使智能設備由工作狀態切換至待機狀態的詞語。例如,待機詞為「結束」,智能設備在接收到用戶語音信息後,獲得語音識別結果,當語音識別結果中包含「結束」時,智能設備由工作狀態切換至待機狀態。

喚醒音頻段:指語音識別結果中包含喚醒詞的音頻段。

待機音頻段:指語音識別結果中包含待機詞的音頻段。

待機狀態:是指符合以下情況的狀態:在用戶打開智能設備之後,接收用戶語音信息,但為了降低功耗,只響應包含喚醒音頻段的用戶語音信息對應的交互指令,而不響應接收到的其他用戶語音信息。

工作狀態:是指智能設備被包含喚醒音頻段的用戶語音信息喚醒之後,可以響應用戶語音信息對應的交互指令的狀態。

在對本發明實施例中涉及的概念進行介紹之後,下面將對本發明實施例所提供的一種設備控制方法進行介紹。

需要說明的是,本發明實施例所提供的一種設備控制方法應用於智能設備中,該智能設備可以為:智慧型手機、智能家居產品(如:智能音箱)、智能車載設備、智能穿戴設備、機器人等,這都是合理的;而且該智能設備可以採用與伺服器通信連接的方式工作,也可以單獨工作,本申請並不對此進行限定。

另外,一種應用場景中,上述作為執行主體的智能設備為具有麥克風或者麥克風陣列的設備。

如圖1所示,本發明實施例所提供的一種設備控制方法,包括如下步驟:

s101,響應完第一用戶語音信息對應的交互指令後,持續處於工作狀態,並判斷第一時間間隔是否小於等於目標時間間隔閾值,如果是,則執行s102,如果否,則執行s103;

智能設備處於待機狀態時,若接收到包含喚醒音頻段的用戶語音信息,會從待機狀態切換至工作狀態,當接收到的用戶語音信息為第一用戶語音信息時,響應第一用戶語音信息對應的交互指令,在響應完第一用戶語音信息之後,與現有技術不同,智能設備不會立即進入待機狀態,而是在目標時間間隔閾值內持續保持工作狀態,因此,智能設備不需要被再次喚醒便可以執行s102,即再次接收用戶語音信息。

具體的,上述第一用戶語音信息中不包含待機音頻段,如果包括待機音頻段,則智能設備在接收到該第一用戶語音信息之後,會從工作狀態切換至待機狀態,無法執行本方案的後續步驟;另外,第一用戶語音信息為從待機狀態切換至工作狀態後最近一次接收到的用戶語音信息,這樣,智能設備響應完第一用戶語音信息之後,判斷第一時間間隔是否小於等於目標時間間隔閾值,也就是說,判斷在響應完第一用戶語音信息對應的交互指令的時刻起,智能設備在目標時間間隔閾值之內,是否再次接收到用戶語音信息,如果判斷結果為再次接收到了用戶語音信息,則執行s102,如果判斷結果為沒有再次接收到用戶語音信息,則執行s103。

需要說明的是,不同的交互場景中,對響應完第一用戶語音信息對應的交互指令的時刻可以有不同的定義,具體的,可以認為響應完用戶語音信息對應的交互指令的時刻與這一交互指令的著重點相關。

舉例而言,當第一用戶語音信息的語音識別結果為「最近的學校有哪些」時,智能設備獲得最近的學校信息,並播放所獲得的信息。在這種交互場景中,用戶交互指令的著重點在學校到底有哪些上,所以將學校的信息播放完可以理解為響應完第一用戶語音信息對應的交互指令。

而當第一用戶語音信息的語音識別結果為「播放周杰倫的最新歌曲」時,智能設備獲得周杰倫的最新歌曲並播放。在這種交互場景中,用戶交互指令的著重點在播放這一動作以及周杰倫的最新歌曲上,所以將開始播放周杰倫的最新歌曲即可理解為響應完第一用戶語音信息對應的交互指令。

需要說明的是,上述著重點可以是開發人實現針對各種類型的用戶語音信息進行標記得到的,還可以是通過語音分析方式確定出來的,本申請並不對此進行限定。

另外,目標時間間隔閾值,可以是預先設定的固定值,例如,可以設置為5秒、10秒、15秒、20秒等等,這些都是合理的;也可以根據用戶的表達習慣、語速等確定目標時間間隔閾值,例如,當用戶的表達習慣為說話停頓的頻率較高、或者語速較慢時,可以設置較大的目標時間間隔閾值,以免在用戶語音信息還不完整時,智能設備就進入了待機狀態;另外,還可以根據環境噪音參數來確定目標時間間隔閾值,當環境噪音較大時,可以設置較大的目標時間閾值,以獲取需要響應的用戶語音信息,當環境噪音太大時,為了防止誤接收用戶語音信息,智能設備可以直接由工作狀態切換至待機狀態。

而且,還可以通過用戶的年齡、語速及環境的噪音參數中的兩者或者三者來綜合確定目標時間間隔閾值,當然,還可以根據其他參數來確定目標時間間隔閾值,本申請並不對此進行限定。

s102,檢測到再次接收到用戶語音信息時,響應目標交互指令。

智能設備判斷出響應完第一用戶語音信息的時刻起,若在目標時間間隔閾值之內再次接收到用戶語音信息,則響應目標交互指令,該目標交互指令即為再次接收到的用戶語音信息對應的交互指令。

舉例而言,假設目標時間間隔為5秒,從智能設備響應完第一用戶語音信息的時刻起,在5秒內再次接收到用戶語音信息,語音識別結果為「播放周杰倫的最新歌曲」,則智能設備響應該用戶語音信息對應的交互指令,也就是說,獲得周杰倫的最新歌曲,並播放該最新歌曲。

需要強調的是,語音識別結果為「播放周杰倫的最新歌曲」可以對應一條用戶語音信息,也可以對應多條用戶語音信息。

具體的,當用戶說話比較流暢時,智能設備接收到一條用戶語音信息,且對該條用戶信息進行語音識別,得到的語音識別結果為「播放周杰倫的最新歌曲」;

當用戶說話不流暢時,也就是說,用戶說話有停頓時,智能設備接收到多條用戶語音信息,且對多條用戶信息分別進行語音識別,得到的語音識別結果也有多個,例如,分別為「播放」、「周杰倫」、「最新的」、「歌曲」;由於「播放」、「周杰倫」、「最新的」、「歌曲」這四個單獨的詞語句不完整且沒有完整的含義,此時,智能設備會進行語義解析,將這四個詞進行拼接,當拼接為語句完整且有意義的話時,即拼接為「播放周杰倫的最新歌曲」時,才響應再次接收到的用戶語音信息對應的交互指令。從而可以減少因誤響應而影響用戶體驗。

另外,在特殊情況下,例如用戶剛開始與智能設備進行交互,就因為其他的事情影響而停止了與智能設備的交互時,上述例子中的語音識別結果也可能為「播放」這個單獨的詞,此時,智能設備可以播放「我沒有聽懂」、「請再說一遍」等,當用戶聽到智能設備播放的聲音時,在5秒內可以再次與智能設備進行交互。

可以理解的是,上述語音識別結果可以是:智能設備對再次接收到的用戶語音信息進行語音識別得到的語音識別結果。這種情況下,智能設備可以從本地或者伺服器端獲得上述目標交互指令對應的響應內容,並響應上述目標交互指令。例如:目標交互指令為:播放周杰倫的最新歌曲,則智能設備可以從伺服器獲得周杰倫的最新歌曲,並播放該歌曲;智能設備還可以從本地獲得周杰倫的最新歌曲,並播放該歌曲。

上述語音識別結果還可以是:智能設備將再次接收到的用戶語音信息發送至伺服器,伺服器對所接收的用戶語音信息進行識別得到的語音識別結果。這種情況下,伺服器可以直接根據上述語音識別結果確定目標交互指令的響應內容,並將響應內容發送至智能設備,由智能設備響應上述目標交互指令。

可選地,在一種具體實施方式中,所述檢測到再次接收到用戶語音信息時,響應目標交互指令的步驟,包括:

檢測到再次接收到用戶語音信息時,判斷再次接收到的用戶語音信息中是否包含所述待機音頻段;

若包含,由工作狀態切換至待機狀態。

具體地,假設預設待機詞為「結束」,若再次接收到的用戶語音信息經語音識別後包含「結束」這一預設待機詞,則智能設備由工作狀態切換至待機狀態。

舉例而言,假設目標時間間隔閾值為5秒,智能設備在響應完第一用戶語音信息對應的交互指令的時刻起,在5秒內再次接收到用戶語音信息,經語音識別該用戶語音信息對應的文字為「今天天氣怎麼樣呀?」時,獲得並播放今天的天氣情況;若在播放完今天的天氣狀況後,即響應結束後,5秒內再次接收到用戶語音信息,經語音識別該用戶語音信息對應的文字包含「結束」這個預設待機詞,則智能設備由工作狀態切換至待機狀態。

因此,在智能設備處於工作狀態時,智能設備在響應完任一用戶語音信息對應的交互指令的時刻起,在目標時間間隔閾值內,再次接收到一用戶語音信息時,均可以響應該用戶語音信息對應的交互指令,直到再次接收的用戶語音信息中包含待機音頻段,智能設備才由工作狀態切換至待機狀態。這樣用戶只需要喚醒一次智能設備,就可以與智能設備進行多次交互,從而簡化了交互過程,提高了用戶體驗。

s103,由工作狀態切換至待機狀態。

智能設備判斷出響應完第一用戶語音信息的時刻起,在目標時間間隔閾值之內,未接收到用戶語音信息,說明用戶暫時不與智能設備進行交互,為了降低功耗,智能設備由工作狀態切換至待機狀態。

舉例而言,假設目標時間間隔閾值為5秒,智能設備在響應完第一用戶語音信息對應的交互指令的時刻起,在5秒內未接收到用戶語音信息,則智能設備由工作狀態切換到待機狀態。

與現有技術相比,本方案在響應完第一用戶語音信息對應的交互指令後,智能設備持續處於工作狀態,當第一時間間隔小於等於目標時間間隔閾值時,在再次接收到用戶語音信息時,響應再次接收到用戶語音信息對應的交互指令,從而可以實現從響應完第一用戶語音信息對應的交互指令的時刻起,在目標時間間隔閾值內,用戶不需要再次喚醒智能設備就可以與智能設備進行再次交互,過程簡便,用戶體驗較好。

如圖2所示,本發明實施例所提供的一種設備控制方法還可以包括:

s104,所述智能設備處於待機狀態時,判斷接收到的用戶語音信息中是否包含喚醒音頻段,若包含,執行s105。

其中,所述喚醒音頻段為:語音識別結果中包含預設喚醒詞的音頻段;

s105,由待機狀態切換至工作狀態,並確定包含所述喚醒音頻段的用戶語音信息的目標接收方向。

所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、來自所述目標接收方向的、不包含待機音頻段的用戶語音信息;

所述再次接收到的用戶語音信息為:再次接收的、來自所述目標接收方向的用戶語音信息。

需要說明的是,在智能設備處於待機狀態時,繼續接收用戶語音信息,並且對所接收的語音信息進行語音識別,但是在這種情況下,智能設備僅僅識別所接收的用戶語音信息中是否包含喚醒音頻段即可,當識別出接收到的用戶語音信息中包含喚醒音頻段時,智能設備由待機狀態切換至工作狀態,並將包含喚醒音頻段的用戶語音信息的接收方向作為目標接收方向,這是由於智能設備從該目標接收方向被喚醒,則第一用戶語音信息以及再次接收到的用戶語音信息來自於該目標接收方向的概率較大,因此,此時的第一用戶語音信息及再次接收到的用戶語音信息均限定為來自目標接收方向。

在本申請的一種實現方式中,可以通過對來自目標接收方向的用戶語音信息進行波束增強處理,對來自其他方向的用戶語音信息進行噪聲抑制處理,來減少來自其他方向的用戶語音信息對目標接收方向的用戶語音信息的幹擾,進而得到更佳準確的第一用戶語音信息。

需要說明的是,通常情況下,智能設備上設置有麥克風陣列,所以目標接收方向的確定方法可以為:麥克風陣列中的至少兩個麥克風接收來自各個方向的語音信息的時間差,來確定目標接收方向,其中,確定目標接收方向的方法有多種,如時延預估法,在此不對確定目標接收方向的方法進行具體限定。

當然,智能設備除了可以接收目標接收方向的用戶語音信息,也可以同時接收來自其他方向的用戶語音信息,這樣,用戶可以響應來自各個方向的用戶語音信息對應的交互指令,防止因接收方向單一而造成不能響應其他用戶語音信息對應的交互指令,這在一定程度上也可以提高用戶體驗。

與現有技術相比,當智能設備處於待機狀態時,可以通過包含喚醒音頻段的用戶語音信息使智能設備由待機狀態切換至工作狀態,並且將接收包含喚醒音頻段的用戶語音信息的接收方向確定為目標接收方向,在目標預設時間間隔閾值內,接收來自於目標接收方向的第一用戶語音信息,並響應該第一用戶語音信息對應的交互指令,且再次接收到的用戶語音信息也來自於用戶語音信息,從而可以避免來自其他方向的用戶語音信息的幹擾,提高了用戶體驗。

可選的,在上述任一實施方式中,所述響應目標交互指令的步驟,可以包括:

對再次接收到的用戶語音信息進行語音識別,獲得識別結果;

根據所述識別結果確定再次接收到的用戶語音信息的交互場景;

按照所述交互場景響應目標交互指令。

智能設備在響應完第一用戶語音信息的時刻起,在目標時間間隔閾值內,再次接收到用戶語音信息時,對再次接收到的用戶語音信息進行語音識別,根據語音識別結果確定再次接收到的用戶語音信息的交互場景,然後按照確定的交互場景,響應再次接收到的用戶語音信息對應的交互指令,該交互指令即為目標交互指令。由於再次接收到的用戶語音信息有多種,因此,根據語音識別結果確定出的交互場景也有多種,不同的交互場景具有不同的響應方式。

舉例而言,當再次接收到的用戶語音信息的語音識別結果為「今天的天氣怎麼樣呀?」,智能設備根據該識別結果,在本地或者伺服器查詢今天的天氣信息,並將今天的天氣信息轉化為語音播放出來;而當再次接收到的用戶語音信息的語音識別結果為「播放周杰倫的最近歌曲」,智能設備根據該識別結果,在本地或者伺服器查詢周杰倫的最新歌曲,若在本地查詢周杰倫的最新歌曲,則直接播放查詢到的歌曲,若在伺服器查詢周杰倫的最新歌曲,則將查詢到的最新歌曲下載到本地,然後再進行播放,在開始播放歌曲時,可以強制將智能設備的狀態由工作狀態切換至待機狀態。可見不同的交互場景具有不同的響應方式。可選的,在一種實現方式中,所述按照所述交互場景響應目標交互指令的步驟,包括:

判斷所述交互場景是否為音頻播放場景;

若為是,播放目標交互指令對應的音頻,並由工作狀態切換至待機狀態。

在智能設備再次接收到用戶語音信息後,獲得再次接收到的用戶語音信息的語音識別結果,當識別結果中包含「播放音樂」或者「播放音頻」等類似的信息時,則判斷再次接收到的用戶語音信息的交互場景為「音頻播放場景」,並播放目標交互指令對應的音頻,智能設備的狀態由工作狀態切換至待機狀態。這時智能設備再次接收到用戶語音信息時,智能設備只會檢測是否包含喚醒音頻段,包含喚醒音頻段時,喚醒智能設備,才能繼續響應用戶的交互指令,不包含喚醒音頻段時,不響應用戶的交互指令。這樣可以有效避免其他用戶語音信息對音頻播放造成幹擾。

舉例而言,智能設備再次接收到的用戶語音信息的語音識別結果為「播放周杰倫的最新歌曲」,則判斷此時的交互場景為音頻播放場景,智能設備播放周杰倫的最新歌曲」,在開始播放周杰倫的最新歌曲的時刻起,在目標時間間隔內,可能會再次接收到用戶語音信息,例如再次接收到的用戶語音信息的語音識別結果為「今天天氣怎麼樣呀?」,智能設備獲得今天的天氣信息並播放今天的天氣情況,因此,智能設備可能會暫停播放周杰倫的最新歌曲轉而播報今天的天氣情況,從而影響用戶收聽周杰倫的最新歌曲,降低了用戶體驗。

需要說明的是,若音頻播放還沒有結束,但用戶想要停止,則用戶必須再次將智能設備喚醒,才能終止音頻的播放。具體的,智能設備接收到包含喚醒音頻段的用戶語音信息之後,智能設備被喚醒,從智能設備被喚醒的時刻起,在目標時間間隔內,再次接收到的用戶語音信息經語音識別對應的文字包含「停止播放」時,才能終止音頻的播放。

下面結合具體的應用實例,對本發明實施例所提供的一種設備控制方法進行介紹,在該應用實例中,智能設備的預設喚醒詞為「小明」,待機喚醒詞為「結束」,目標時間間隔閾值為5秒。主要包括以下8個步驟:

1、用戶通過叫「小明」使智能設備從待機狀態切換至工作狀態;

2、在智能設備切換至工作狀態之後,從智能設備切換至工作狀態的時刻起,在5秒內,智能設備接收到一用戶語音信息,語音識別結果為「今天有沒有霧霾?」,智能設備根據該語音識別結果,查詢今天是否有霧霾,並根據查詢結果,播放今天的霧霾情況;

3、在響應結束之後,智能設備在5秒內又接收到一用戶語音信息,語音識別結果為「今天的室外溫度是多少?」,智能設備根據該語音識別結果,查詢今天的室外溫度,並播放今天的室外溫度。由於語音識別結果為「今天的室外溫度是多少?」對應的用戶語音信息為從待機狀態切換至工作狀態後最近一次接收到的用戶語音信息,則第一用戶語音信息為識別結果為「今天的室外溫度是多少?」對應的用戶語音信息;

4、在響應完該第一用戶語音信息對應的交互指令之後,智能設備持續處於工作狀態;

5、在響應完第一用戶語音信息對應的交互指令後,在5秒內再次接收到用戶語音信息,語音識別結果為「最近的學校」,智能設備查詢最近的學校,並播放最近的學校的名稱及路線;

6、但是,若在響應完第一用戶語音信息時,在5秒內,未收到用戶語音信息,智能設備也由工作狀態切換至待機狀態;以及若再次接收到的用戶語音信息的語音識別結果包含「結束」,則由工作狀態切換至待機狀態。

7、在智能設備處於待機狀態時,用戶還可以通過叫「小明」來喚醒智能設備,即使智能設備由待機狀態切換至工作狀態;

8、智能設備被喚醒之後,從被喚醒的時刻起,在5秒內還可以接收到用戶語音信息,並響應接收到的用戶語音信息;在響應完接收到的用戶語音信息的時刻起,在5秒內還可以再次接收到用戶語音信息,並響應再次接收到的用戶語音信息。也就是說,用戶可以與智能設備進行多次對話。

與現有技術相比,在該應用實例中,用戶只需要喚醒一次智能設備,就可以與智能設備進行多次交互,從而簡化了交互過程,提高了用戶體驗。

相應於上述方法實施例,本發明實施例提供了一種設備控制裝置,應用於智能設備,如圖3所示,所述裝置可以包括:

第一判斷模塊310、響應模塊320、第一切換模塊330;

其中,

所述第一判斷模塊310,用於響應完第一用戶語音信息對應的交互指令後,持續處於工作狀態,並判斷第一時間間隔是否大於目標時間間隔閾值,其中,所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、不包含待機音頻段的用戶語音信息,所述待機音頻段為:語音識別結果包含預設待機詞的音頻段,所述第一時間間隔為:從響應完第一用戶語音信息對應的交互指令的時刻起未接收到用戶語音信息的時間間隔;

所述響應模塊320,用於若所述第一判斷模塊310的判斷結果為否,檢測到再次接收到用戶語音信息時,響應目標交互指令,其中,所述目標交互指令為:再次接收到的用戶語音信息對應的交互指令;

所述第一切換模塊330,用於若若所述第一判斷模塊310的判斷結果為是,由工作狀態切換至待機狀態。

與現有技術相比,本本方案在響應完第一用戶語音信息對應的交互指令後,智能設備持續處於工作狀態,當第一時間間隔小於等於目標時間間隔閾值時,在再次接收到用戶語音信息時,響應再次接收到用戶語音信息對應的交互指令,從而可以實現從響應完第一用戶語音信息對應的交互指令的時刻起,在目標時間間隔閾值內,用戶不需要再次喚醒智能設備就可以與智能設備進行再次交互,過程簡便,用戶體驗較好。

可選的,在一種實施方式中,所述響應模塊,可以包括:

判斷子模塊,用於檢測到再次接收到用戶語音信息時,判斷再次接收到的用戶語音信息中是否包含所述待機音頻段;

切換子模塊,用於若包含,由工作狀態切換至待機狀態。

更進一步的,在包含第一判斷模塊310、響應模塊320、第一切換模塊330的基礎上,如圖4所示,本發明實施例所提供的一種設備控制裝置還可以包括:

第二判斷模塊340,用於所述智能設備處於待機狀態時,判斷接收到的用戶語音信息中是否包含喚醒音頻段,其中,所述喚醒音頻段為:語音識別結果中包含預設喚醒詞的音頻段;

第二切換模塊350,用於若第二判斷模塊340的判斷結果為包含喚醒音頻段,由待機狀態切換至工作狀態,並確定包含所述喚醒音頻段的用戶語音信息的接收方向,作為目標接收方向;

所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、來自所述目標接收方向的、不包含待機音頻段的用戶語音信息;

所述再次接收到用戶語音為:再次接收的、來自所述目標接收方向的用戶語音信息。

與現有技術相比,當從智能設備處於待機狀態時,可以通過包含喚醒音頻段的用戶語音信息使智能設備由待機狀態切換至工作狀態,並且將接收包含喚醒音頻段的用戶語音信息的接收方向確定為目標接收方向,在目標預設時間間隔閾值內,接收來自於目標接收方向的第一用戶語音信息,並響應該第一用戶信息對應的交互指令,且再次接收到的用戶語音信息也來自於用戶語音信息,從而可以避免來自其他方向的用戶語音信息的幹擾,提高了用戶體驗。

可選的,在上述任一實施方式中,所述響應模塊,包括:

語音識別子模塊,用於對再次接收到的用戶語音信息進行語音識別,獲得識別結果;

確定交互場景子模塊,用於根據所述識別結果確定再次接收到的用戶語音信息的交互場景;

響應子模塊,用於按照所述交互場景響應目標交互指令。

可選的,在上述實施方式中,所述響應子模塊具體用於:

判斷所述交互場景是否為音頻播放場景;

若為是,播放目標交互指令對應的音頻,並由工作狀態切換至待機狀態。

可選的,在上述實施方式中,所述裝置還包括:

調整目標時間間隔閾值模塊,用於獲得以下信息中的至少一種,並根據所獲得的信息調整所述目標時間間隔閾值的取值:

用戶的語速;

用戶的表達習慣;

環境噪聲參數。

另外,本發明實施例還提供了一種智能設備,如圖5所示,該智能設備可以包括:殼體501、處理器502、存儲器503、電路板504和電源電路505,其中,電路板504安置在殼體501圍成的空間內部,處理器502和存儲器503設置在電路板504上;電源電路505,用於為電子設備的各個電路或器件供電;存儲器503用於存儲可執行程序代碼;處理器502通過讀取存儲器503中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行本申請實施例提供的設備控制方法。

本申請的一種實現方式中,上述設備控制方法,包括:

響應完第一用戶語音信息對應的交互指令後,持續處於工作狀態,並判斷第一時間間隔是否小於等於目標時間間隔閾值,其中,所述第一用戶語音信息為:從待機狀態切換至工作狀態後最近一次接收到的、不包含待機音頻段的用戶語音信息,所述待機音頻段為:語音識別結果包含預設待機詞的音頻段,所述第一時間間隔為:從響應完第一用戶語音信息對應的交互指令的時刻起未接收到用戶語音信息的時間間隔;

若為是,檢測到再次接收到用戶語音信息時,響應目標交互指令,其中,所述目標交互指令為:再次接收到的用戶語音信息對應的交互指令;

若為否,由工作狀態切換至待機狀態。

上述設備控制方法的其他實現方式與前述方法實施例中的實現方式相同,這裡不再贅述。

處理器502對上述步驟的具體執行過程以及處理器502通過運行可執行程序代碼來進一步執行的步驟,可以參見本發明圖1-4所示實施例的描述,在此不再贅述。

由上述可見,本發明實施例中,智能設備在響應完第一用戶語音信息對應的交互指令後,智能設備持續處於工作狀態,當第一時間間隔小於等於目標時間間隔閾值時,在再次接收到用戶語音信息時,響應再次接收到用戶語音信息對應的交互指令,從而可以實現從響應完第一用戶語音信息對應的交互指令的時刻起,在目標時間間隔閾值內,用戶不需要再次喚醒智能設備就可以與智能設備進行再次交互,過程簡便,用戶體驗較好。

對於裝置、智能設備實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。

需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。

本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。

以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀