一種用戶註冊方法、裝置及電子設備與流程
2023-05-09 20:49:11

本發明涉及智能設備技術領域,特別是涉及一種用戶註冊方法、裝置及電子設備。
背景技術:
現實生活中,智能設備通常帶有用戶識別過程,用戶識別過程可包括指紋識別、語音識別或人臉識別等。
在用戶使用智能設備之前,需要預先在智能設備上進行相應指紋、語音或人臉的註冊,當用戶下次使用智能設備時,智能設備可識別出相應的用戶。
現有的基於語音的用戶註冊過程:用戶首先需要向智能設備連續發出多次喚醒語音,智能設備提取各喚醒語音的聲紋特徵並記錄,同時用戶需要在智能設備上輸入該聲紋特徵對應的用戶名稱,以完成註冊。
當用戶下次發出喚醒語音後,智能設備提取喚醒語音的聲紋特徵,當該聲紋特徵與先前記錄的某一個用戶名稱對應的聲紋特徵相近時,可識別出發出該喚醒語音的用戶。
由於現有基於語音的註冊過程中,用戶需要向智能設備連續發出多次喚醒語音並且需要輸入用戶名稱,完成註冊後,智能設備才能識別出發出喚醒語音的用戶,用戶的操作較為繁瑣,用戶體驗較差。
技術實現要素:
本發明的目的在於提供一種用戶註冊方法、裝置及電子設備,以簡化用戶的操作,提高用戶體驗。
為達到上述目的,本發明實施例提供了一種用戶註冊方法,應用於電子設備,所述方法包括:
每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵;
對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;
為每個類別分配一個類別標識;
將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
可選地,所述對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別的步驟,包括:
利用聚類算法計算已保存的各第一聲紋特徵間的相似度;
根據相似度將所有第一聲紋特徵劃分為至少一個類別。
可選地,所述方法還包括:
每次獲得到用戶的服務指令語音後,提取並保存所述服務指令語音對應的第二聲紋特徵;
確定所述服務指令語音對應的服務類型;
將所述第二聲紋特徵與所述每個類別中的每個第一聲紋特徵進行匹配;
將匹配成功的第一聲紋特徵的類別標識與所述服務類型對應存儲。
可選地,所述確定所述服務指令語音對應的服務類型的步驟,包括:
對所述服務指令語音進行識別,獲得服務指令語音識別信息;
對所述服務指令語音識別信息進行語義解析;
根據語義解析結果,確定所述服務指令語音對應的服務類型。
可選地,所述方法還包括:
在提取喚醒語音的聲紋特徵後,將所述聲紋特徵確定為待識別聲紋特徵;
將所述待識別聲紋特徵與每個類別中的第一聲紋特徵進行匹配;
將匹配成功的第一聲紋特徵對應的類別標識確定為目標類別標識;
判斷所述目標類別標識是否對應存儲了服務類型;
如果是,則輸出所存儲的服務類型對應的服務提示信息。
可選地,所述方法還包括:
根據識別出的目標類別標識,輸出索要第一用戶標識的請求;
接收用戶反饋的第一語音信息,並對該第一語音信息進行語音識別得到第一語音識別信息;
將所述第一語音識別信息確定為所述第一用戶標識;
記錄所述第一用戶標識與所述目標類別標識的對應關係。
可選地,所述方法還包括:
當獲得用戶註冊指令後,連續n次獲取喚醒語音樣本,輸出索要第二用戶標識的請求;n為大於1的整數;
接收返回的語音信息,並對該語音信息進行語音識別得到該語音對應的語音識別信息;
將所述語音識別信息確定為所述第二用戶標識,並將所述第二用戶標識分別與n個喚醒語音樣本的聲紋特徵對應存儲。
可選地,所述電子設備為智能設備;所述方法還包括:
通過如下方式獲得到用戶的喚醒語音:
實時檢測語音信息;
在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息;
對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;
當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音。
可選地,所述電子設備為與智能設備通信連接的雲端伺服器;
所述方法還包括:
通過如下方式獲得到用戶的喚醒語音:
接收所述智能設備發送的喚醒語音;所述智能設備發送的喚醒語音為:所述智能設備在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息,對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音,將該喚醒語音發送至所述雲端伺服器的。
本發明實施例還提供了一種用戶註冊裝置,應用於電子設備,所述裝置包括:
第一提取模塊,用於每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵;
聚類模塊,用於對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;
分配模塊,用於為每個類別分配一個類別標識;
第一存儲模塊,用於將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
可選地,所述聚類模塊,包括:
計算單元,用於利用聚類算法計算已保存的各第一聲紋特徵間的相似度;
分類單元,用於根據相似度將所有第一聲紋特徵劃分為至少一個類別。
可選地,所述裝置還包括:
第二提取模塊,用於每次獲得到用戶的服務指令語音後,提取並保存所述服務指令語音對應的第二聲紋特徵;
第一確定模塊,用於確定所述服務指令語音對應的服務類型;
第一匹配模塊,用於將所述第二聲紋特徵與所述每個類別中的每個第一聲紋特徵進行匹配;
第二存儲模塊,用於將匹配成功的第一聲紋特徵的類別標識與所述服務類型對應存儲。
可選地,所述第一確定模塊,包括:
第一識別單元,用於對所述服務指令語音進行識別,獲得服務指令語音識別信息;
解析單元,用於對所述服務指令語音識別信息進行語義解析;
第一確定單元,用於根據語義解析結果,確定所述服務指令語音對應的服務類型。
可選地,所述裝置還包括:
第二確定模塊,用於在提取喚醒語音的聲紋特徵後,將所述聲紋特徵確定為待識別聲紋特徵;
第二匹配模塊,用於將所述待識別聲紋特徵與每個類別中的第一聲紋特徵進行匹配;
第三確定模塊,用於將匹配成功的第一聲紋特徵對應的類別標識確定為目標類別標識;
判斷模塊,用於判斷所述目標類別標識是否對應存儲了服務類型;
第一輸出模塊,用於當所述判斷模塊的判斷結果為是時,則輸出所存儲的服務類型對應的服務提示信息。
可選地,所述裝置還包括:
第二輸出模塊,用於根據識別出的目標類別標識,輸出索要第一用戶標識的請求;
第一識別模塊,用於接收用戶反饋的第一語音信息,並對該第一語音信息進行語音識別得到第一語音識別信息;
第四確定模塊,用於將所述第一語音識別信息確定為所述第一用戶標識;
記錄模塊,用於記錄所述第一用戶標識與所述目標類別標識的對應關係。
可選地,所述裝置還包括:
第二輸出模塊,用於當獲得用戶註冊指令後,連續n次獲取喚醒語音樣本,輸出索要第二用戶標識的請求;n為大於1的整數;
第二識別模塊,用於接收返回的語音信息,並對該語音信息進行語音識別得到該語音對應的語音識別信息;
第三存儲模塊,用於將所述語音識別信息確定為所述第二用戶標識,並將所述第二用戶標識分別與n個喚醒語音樣本的聲紋特徵對應存儲。
可選地,所述電子設備為智能設備;所述裝置還包括:
第一獲取模塊,用於獲得到用戶的喚醒語音:
所述獲取模塊包括:
檢測單元,用於實時檢測語音信息;
第二確定單元,用於在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息;
第二識別單元,用於對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;
第三確定單元,用於當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音。
可選地,所述電子設備為與智能設備通信連接的雲端伺服器;
所述裝置還包括:
第一獲取模塊,用於獲得到用戶的喚醒語音:
所述第一獲取模塊,具體用於接收所述智能設備發送的喚醒語音;所述智能設備發送的喚醒語音為:所述智能設備在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息,對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音,將該喚醒語音發送至所述雲端伺服器的。
本發明實施例還提供了一種電子設備,所述電子設備包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內部,處理器和存儲器設置在電路板上;電源電路,用於為電子設備的各個電路或器件供電;存儲器用於存儲可執行程序代碼;處理器通過讀取存儲器中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行所述的用戶註冊方法。
本發明實施例提供的一種用戶註冊方法、裝置及電子設備,每次接收到喚醒語音後,提取並保存聲紋特徵;對已保存的聲紋特徵進行聚類,將聲紋特徵劃分為至少一個類別;每個類別中的聲紋特徵屬於同一個用戶;為每個類別分配一個類別標識;將每個類別標識與其對應的至少一個聲紋特徵對應存儲,完成用戶註冊。本發明實施例無需像現有技術中一樣,用戶需要向聲紋特徵識別設備連續發出多次喚醒語音並且需要輸入用戶名稱,完成註冊後,聲紋特徵識別設備才能識別出發出語音的用戶,因此,本發明實施例能夠簡化用戶的操作,提高用戶體驗。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例提供的用戶註冊方法的流程圖;
圖2為本發明實施例提供的根據服務指令語音向用戶發送服務提示信息的流程圖;
圖3為本發明實施例提供的用戶註冊裝置的第一種結構示意圖;
圖4為本發明實施例提供的用戶註冊裝置的第二種結構示意圖;
圖5為本發明實施例提供的電子設備的結構示意圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
為達到上述目的本發明實施例提供了一種用戶註冊方法,該方法可應用於電子設備,該電子設備可以為智能設備,也可以為與智能設備通信連接的雲端伺服器。本發明實施例中,智能設備可以是智慧型手機、智能音箱、智慧機器人或智能平板電腦等帶有語音識別功能的設備。
圖1為本發明實施例提供的用戶註冊方法的流程圖,所述方法包括:
s110,每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵。
本實施例中,可設電子設備的應用場景為家庭場景,即家庭中存在至少一個用戶,由於這些用戶長期使用電子設備,任一用戶每次喚醒電子設備,電子設備都會獲取該喚醒語音,同時,電子設備提取並保存喚醒語音對應的第一聲紋特徵(聲紋特徵的提取方法為現有技術)。
在本發明實施例提供的一種具體實現方式中,所述電子設備為智能設備;
智能設備通過如下方式獲得到用戶的喚醒語音:
實時檢測語音信息;在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為待識別語音信息;對所述待識別語音信息進行語音識別,得到目標語音識別信息;當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音。
具體地,處於工作狀態的智能設備,實時檢測周圍的語音信息。設初始時刻周圍的聲音的音量較小,此時處於靜音狀態,當突然檢測到聲音的音量大與某一個預設值的時候,則可確定當前有用戶輸入語音信息,此時進入語音階段,智能設備採集語音階段的語音信息。經過一段時間的語音後,聲音的音量小於預設值,語音再次進入靜音階段,當進入靜音階段達到預設語音停頓時長時,將用戶輸入的語音信息(即智能設備採集到的語音信息)確定為目標待識別語音信息。本實施例中,預設語音停頓時長可自由設定,預設語音停頓時長優選為500毫秒。
之後,智能設備對所述目標待識別語音信息進行語音識別,得到目標語音識別信息,然後將目標語音識別信息與預設的喚醒詞進行匹配,當所述目標語音識別信息與預設的喚醒詞相同時,確定待識別語音信息為喚醒語音。
在本發明實施例的另一種具體實現方式中,當電子設備為與智能設備通信連接的雲端伺服器時,通過如下方式獲得到用戶的喚醒語音:
接收所述智能設備發送的喚醒語音;所述智能設備發送的喚醒語音為:所述智能設備在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息,對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音,將該喚醒語音發送至所述雲端伺服器的。
具體地,智能設備實時檢測周圍的語音信息。設初始時刻周圍的聲音的音量較小,此時處於靜音狀態,當突然檢測到聲音的音量大與某一個預設值的時候,則可確定當前有用戶輸入語音信息,此時進入語音階段,智能設備採集語音階段的語音信息。經過一段時間的語音後,聲音的音量小於預設值,語音再次進入靜音階段,當進入靜音階段達到預設語音停頓時長時,將用戶輸入的語音信息(即智能設備採集到的語音信息)確定為目標待識別語音信息。之後,智能設備對所述目標待識別語音信息進行語音識別,得到目標語音識別信息,然後將目標語音識別信息與預設的喚醒詞進行匹配,當所述目標語音識別信息與預設的喚醒詞相同時,確定待識別語音信息為喚醒語音,並將喚醒語音發送給雲端伺服器,雲端伺服器獲得到用戶的喚醒語音。
s120,對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶。
在本發明實施例的一種具體實現方式中,步驟s120包括:
a1、利用聚類算法計算已保存的各第一聲紋特徵間的相似度。
具體地,可利用聚類算法預設需要匹配的各屬性信息(即聲波頻譜的振動頻率、振動周期和振幅大小等)的相似權重,在任意兩個已保存的第一聲紋特徵的匹配過程中,某一屬性信息相似權值越高說明這兩個第一聲紋特徵的該屬性信息越相似,最後將所有屬性信息的相似權重進行疊加得到相似度,該相似度表明這兩個第一聲紋特徵各屬性信息相似權重的綜合效果,相似度越高說明這兩個第一聲紋特徵的類別的可能性越大。
a2、根據相似度將所有第一聲紋特徵劃分為至少一個類別。
具體地,可預設一個相似度閾值,在計算了各第一聲紋特徵間的相似度之後,相似度高於該相似度閾值的兩個第一聲紋特徵可以為同一類別,相似度低於該相似度閾值的兩個第一聲紋特徵為不同類別,通過此種方式,可將所有第一聲紋特徵分成至少一個類別。可選地,相似度閾值可根據實際情況自由設定。
本實施例中,由於不同用戶發出的喚醒語音的第一聲紋特徵不同,通過採用聚類算法計算已保存的各第一聲紋特徵間的相似度,並對所有第一聲紋特徵進行分類,可將第一聲紋特徵分成至少一個類別,每個類別中的第一聲紋特徵屬於同一個用戶。
s130,為每個類別分配一個類別標識。
s140,將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
具體地,電子設備在獲得各類第一聲紋特徵後,為每個類別分配一個類別標識,即每個類別中的至少一個第一聲紋特徵與該類別的類別標識相關聯,然後將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,以實現一個用戶的第一聲紋特徵對應一個類別標識。
本實施例中,可以實現一個用戶的第一聲紋特徵對應一個類別標識,即一個用戶對應一個類別標識,因此可以實現用戶的隱形註冊。
本發明實施例提供的一種用戶註冊方法,每次獲得到用戶的喚醒語音後,提取並保存喚醒語音對應的第一聲紋特徵;對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;為每個類別分配一個類別標識;將每個類別標識與其對應的至少一個聲紋特徵對應存儲,完成用戶註冊。本發明實施例無需像現有技術中一樣,用戶需要向聲紋特徵識別設備連續發出多次喚醒語音並且需要輸入用戶名稱,完成註冊後,聲紋特徵識別設備才能識別出發出語音的用戶,因此,本發明實施例能夠簡化用戶的操作,提高用戶體驗。
可選地,電子設備還可以根據獲取的服務指令語音,向用戶發出服務提示信息。圖2為本發明實施例提供的根據服務指令語音向用戶發送服務提示信息的流程圖,該步驟包括:
s210,每次獲得到用戶的服務指令語音後,提取並保存所述服務指令語音對應的第二聲紋特徵。
本實施例中,服務指令語音是指用戶發出的帶有服務要求的指令語音。例如,服務指令語音可以為「我想聽周杰倫的東風破」等。
具體地,用戶長期使用電子設備,任一用戶每次向電子設備發出服務指令語音後,電子設備都會獲取該服務指令語音,同時電子設備提取並保存服務指令語音對應的第二聲紋特徵。
s220,確定所述服務指令語音對應的服務類型。
在本發明實施例的一種具體實現方式中,步驟s220可包括如下步驟:
a1、對所述服務指令語音進行識別,獲得服務指令語音識別信息。
具體地,電子設備對接收到的服務指令語音進行語音識別,獲得服務指令語音識別信息。本實施例中,語音識別的具體過程為現有技術,此處不再贅述。
a2、對所述服務指令語音識別信息進行語義解析。
具體地,電子設備對獲取到的服務指令語音識別信息進行語義解析,得到解析結果。本實施例中,該語義解析的過程可以為現有的分詞、停用詞過濾等處理過程。
a3、根據語義解析結果,確定所述服務指令語音對應的服務類型。
具體地,電子設備將語義解析結果分別與預先設定的多個服務指令語句模型進行匹配,可獲知語義解析結果中所包含服務的服務類型。
舉例而言,語義解析結果為「我想聽+忘情水」,該語義解析結果語預設的服務指令語句模型「我想聽+歌曲名稱」相匹配,則可確定該服務指令語音中包含的服務「忘情水」對應的服務類型為歌曲。
s230,將所述第二聲紋特徵與所述每個類別中的每個第一聲紋特徵進行匹配。
具體地,電子設備在獲取到第二聲紋特徵後,將該第二聲紋特徵分別與每個類別中的每個第一聲紋特徵進行匹配。本實施例中,具體的匹配過程可以通過計算第二聲紋特徵與各第一聲紋特徵間的相似度,當相似度達到相似度閾值後,判斷二者匹配成功,具體過程可以參照步驟s120中所述的過程。
s240,將匹配成功的第一聲紋特徵的類別標識與所述服務類型對應存儲。
具體地,當第二聲紋特徵與某一個第一聲紋特徵匹配成功後,說明發出該第二聲紋特徵對應的服務指令語音的用戶即為發出第一聲紋特徵對應的喚醒語音的用戶,此時電子設備對匹配成功的第一聲紋特徵的類別標識與服務類型對應存儲。需要說明的是,由於同一用戶可能會要求多種服務類型(如歌曲、視頻或相聲等),因此匹配成功的第一聲紋特徵的類別標識可以與多個服務類型對應存儲。
本實施例中,通過採用服務指令語音的聲紋特徵匹配與喚醒語音的聲紋特徵進行匹配的方式,可以確定類別標識與服務類型對應關係,進而得到用戶與服務類型對應關係。
需要說明的是,步驟s210-s220的過程可以為:每次獲得到用戶的服務指令語音後,都會運行一次;也可以為每次獲得到用戶的服務指令語音後,對其進行保存,當達到預設次數後,在對這些服務指令語音進行運行上述步驟。
s250,在提取喚醒語音的聲紋特徵後,將所述聲紋特徵確定為待識別聲紋特徵。
具體地,當用戶再次發出喚醒語音使用電子設備時,電子設備提取該喚醒語音的聲紋特徵,並將其作為待識別聲紋特徵。
s260,將所述待識別聲紋特徵與每個類別中的第一聲紋特徵進行匹配。
具體地,電子設備在獲取到待識別聲紋特徵後,將該待識別聲紋特徵分別與每個類別中的每個第一聲紋特徵進行匹配。本實施例中,具體的匹配過程可以通過計算待識別聲紋特徵與各第一聲紋特徵間的相似度,當相似度達到相似度閾值後,判斷二者匹配成功,具體過程可以參照步驟s120中所述的過程。
s270,將匹配成功的第一聲紋特徵對應的類別標識確定為目標類別標識。
s280,判斷所述目標類別標識是否對應存儲了服務類型;如果是,則執行步驟s290;如果否,則輸出服務提示信息過程失敗。
具體地,電子設備確定匹配成功的第一聲紋特徵對應的類別標識,並將該類別標識確定為目標類別標識,判斷該目標類別標識是否對應存儲了服務類型。
s290,輸出所存儲的服務類型對應的服務提示信息。
具體地,如果目標類別標識對應存儲了服務類型,電子設備確定該服務類型,並輸出與該服務類型對應的服務提示信息;如果目標類別標識沒有對應存儲服務類型,則輸出服務提示信息的過程失敗。舉例而言,服務提示信息可以為「您想聽歌曲嗎?」或者「您想聽相聲嗎?」
本實施例中,通過獲知用戶發出的服務指令語音,向用戶發出服務提示信息,提高了用戶的體驗,並且使電子設備更加智能。
可選地,電子設備還可以通過輸出服務提示信息,為用戶推薦其經常要求的服務類型的服務。
具體地,可以針對每個類別標識,記錄其在預設一段時間內(比如一周或一個月等)每次使用過的服務類型,將使用次數最多的服務類型,確定為每次喚醒後的推薦服務,輸出對應的服務提示信息。
例如,用戶一天內使用了10次服務類型為歌曲的服務,而僅使用了1次服務類型為相聲的服務,因此,可確定每次喚醒後的推薦服務的歌曲,輸出對應的服務提示信息(如「您想聽冰雨嗎?」)
實際上,用戶使用次數最多的服務類型,就是用戶一種使用習慣,本實施例中能夠根據用戶的使用習慣來為用戶推薦該服務類型對應服務。
可見,本實施例中,通過獲知用戶要求服務的習慣,為用戶提供相應的服務,提高了用戶的體驗,並且使電子設備更加智能。
可選地,電子設備根據用戶發出的喚醒語音可以確定該喚醒語音的聲紋特徵的類別標識,為了根據其類別標識進一步獲知發出該第一喚醒語音的用戶,使整個系統更加智能,所述方法還包括:
b1、根據識別出的目標類別標識,輸出索要第一用戶標識的請求。
本實施例中,第一用戶標識可以為用戶的名稱(如小明)、用戶的代碼(如001)或用戶的稱呼(如爸爸、媽媽等)。
具體地,當電子設備識別出目標類別標識後,可以輸出索要第一用戶標識的請求,該請求可以通過語音信息的方式輸出,例如,該請求可以為「請說出您的名字」。
可選地,電子設備可以獲取到預設數量的同一類別標識的第一聲紋特徵後,輸出索要第一用戶標識的請求。舉例而言,當電子設備接收了20次同一類別標識的第一聲紋特徵後,可以發出「我們都已經認識這麼久了,還不知道您的名字呢?」的指令。
b2、接收用戶反饋的第一語音信息,並對該第一語音信息進行語音識別得到第一語音識別信息。
具體地,當用戶聽到電子設備輸出的索要第一用戶標記的請求後,會說出包含第一用戶標記(如第一用戶的名稱)的第一語音信息,電子設備接收到該第一語音信息並對其進行語音識別得到對應的第一語音識別信息。
b3、將所述第一語音識別信息確定為所述第一用戶標識。
b4、記錄所述第一用戶標識與所述目標類別標識的對應關係。
具體地,電子設備將識別出第一語音識別信息確定為第一用戶標識,並記錄所述第一用戶標識與所述目標類別標識的對應關係。
本實施例中,當電子設備再次接收到用戶的喚醒語音後,可獲取發出該語音對應的第一用戶標識,並輸出帶有第一用戶標識的語音信息(如小明您好啊),使整個電子設備更加智能,提高了用戶的體驗。
可選地,為了適應不同用戶的使用習慣,本發明實施例還提供了另一種用戶註冊流程,具體包括:
c1、當獲得用戶註冊指令後,連續n次獲取喚醒語音樣本,輸出索要第二用戶標識的請求;n為大於1的整數。
本實施例中,用戶註冊指令為預先設置在電子設備中用於開啟用戶註冊的指令。當用戶發起帶有用戶註冊指令的語音後,電子設備進入用戶註冊的工作狀態。舉例而言,用戶註冊指令可以為「我要註冊」。
第二用戶標識可以為用戶的名稱(如小明)、用戶的代碼(如001)或用戶的稱呼(如爸爸、媽媽等)。其中,n可以為3、4或5等。
具體地,當獲得用戶註冊指令後,用戶連續n次向電子設備發出喚醒語音,電子設備將接收到的n次喚醒語音作為n個喚醒語音樣本,並向用戶發送索要第二用戶標識的請求。
c2、接收返回的語音信息,並對該語音信息進行語音識別得到該語音對應的語音識別信息。
具體地,當用戶聽到電子設備輸出的索要第二用戶標識的請求後,會說出包含第二用戶標識(如用戶的名稱)的語音信息,電子設備接收到該語音信息並對其進行語音識別,得到相應的語音識別信息。
c3、將所述語音識別信息確定為所述第二用戶標識,並將所述第二用戶標識分別與n個喚醒語音樣本的聲紋特徵對應存儲。
具體地,電子設備將語音識別信息確定為第二用戶標識,並將第二用戶標識分別與n個喚醒語音樣本的聲紋特徵對應存儲,以完成用戶註冊。當電子設備再次獲取用戶發出的喚醒語音後,提取該喚醒語音的聲紋特徵,並將該聲紋特徵與各喚醒語音樣本的聲紋特徵進行匹配,根據匹配成功的聲紋特徵對應的第二用戶標識即可獲知發出該喚醒語音的用戶。
也就是說在本實施例中,不僅可以採用圖1所示的流程來進行用戶的隱形註冊,同時也可以採用上述c1~c3的步驟來進行傳統的註冊。因此,本實施例可以適應不同用戶的使用習慣,進一步提高了用戶體驗,增加了電子設備的智能性。
與方法實施例對應的,本發明實施例還提供了一種用戶註冊裝置,可應用於電子設備。圖3為本發明實施例提供的用戶註冊裝置的第一種結構示意圖,所述裝置包括:
第一提取模塊310,用於每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵;
聚類模塊320,用於對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;
分配模塊330,用於為每個類別分配一個類別標識;
第一存儲模塊340,用於將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
本發明實施例提供的一種用戶註冊裝置,每次獲得到用戶的喚醒語音後,提取並保存喚醒語音對應的第一聲紋特徵;對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;為每個類別分配一個類別標識;將每個類別標識與其對應的至少一個聲紋特徵對應存儲,完成用戶註冊。本發明實施例無需像現有技術中一樣,用戶需要向聲紋特徵識別設備連續發出多次喚醒語音並且需要輸入用戶名稱,完成註冊後,聲紋特徵識別設備才能識別出發出語音的用戶,因此,本發明實施例能夠簡化用戶的操作,提高用戶體驗。
進一步地,所述聚類模塊320,包括:
計算單元,用於利用聚類算法計算已保存的各第一聲紋特徵間的相似度;
分類單元,用於根據相似度將所有第一聲紋特徵劃分為至少一個類別。
圖4為本發明實施例提供的用戶註冊裝置的第二種結構示意圖,與圖3不同之處,所述裝置還包括:
第二提取模塊350,用於每次獲得到用戶的服務指令語音後,提取並保存所述服務指令語音對應的第二聲紋特徵;
第一確定模塊360,用於確定所述服務指令語音對應的服務類型;
第一匹配模塊370,用於將所述第二聲紋特徵與所述每個類別中的每個第一聲紋特徵進行匹配;
第二存儲模塊380,用於將匹配成功的第一聲紋特徵的類別標識與所述服務類型對應存儲。
進一步地,所述第一確定模塊360,包括:
第一識別單元,用於對所述服務指令語音進行識別,獲得服務指令語音識別信息;
解析單元,用於對所述服務指令語音識別信息進行語義解析;
第一確定單元,用於根據語義解析結果,確定所述服務指令語音對應的服務類型。
進一步地,所述裝置還包括:
第二確定模塊390,用於在提取喚醒語音的聲紋特徵後,將所述聲紋特徵確定為待識別聲紋特徵;
第二匹配模塊3100,用於將所述待識別聲紋特徵與每個類別中的第一聲紋特徵進行匹配;
第三確定模塊3110,用於將匹配成功的第一聲紋特徵對應的類別標識確定為目標類別標識;
判斷模塊3120,用於判斷所述目標類別標識是否對應存儲了服務類型;
第一輸出模塊3130,用於當所述判斷模塊的判斷結果為是時,則輸出所存儲的服務類型對應的服務提示信息。
進一步地,所述裝置還包括:
第二輸出模塊,用於根據識別出的目標類別標識,輸出索要第一用戶標識的請求;
第一識別模塊,用於接收用戶反饋的第一語音信息,並對該第一語音信息進行語音識別得到第一語音識別信息;
第四確定模塊,用於將所述第一語音識別信息確定為所述第一用戶標識;
記錄模塊,用於記錄所述第一用戶標識與所述目標類別標識的對應關係。
進一步地,所述裝置還包括:
第二輸出模塊,用於當獲得用戶註冊指令後,連續n次獲取喚醒語音樣本,輸出索要第二用戶標識的請求;n為大於1的整數;
第二識別模塊,用於接收返回的語音信息,並對該語音信息進行語音識別得到該語音對應的語音識別信息;
第三存儲模塊,用於將所述語音識別信息確定為所述第二用戶標識,並將所述第二用戶標識分別與n個喚醒語音樣本的聲紋特徵對應存儲。
進一步地,所述電子設備為智能設備;所述裝置還包括:
第一獲取模塊,用於獲得到用戶的喚醒語音:
所述獲取模塊包括:
檢測單元,用於實時檢測語音信息;
第二確定單元,用於在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息;
第二識別單元,用於對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;
第三確定單元,用於當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音。
進一步地,所述電子設備為與智能設備通信連接的雲端伺服器;
所述裝置還包括:
第一獲取模塊,用於獲得到用戶的喚醒語音:
所述第一獲取模塊,具體用於接收所述智能設備發送的喚醒語音;所述智能設備發送的喚醒語音為:所述智能設備在檢測到用戶輸入語音信息後,當靜音時長達到預設語音停頓時長時,將用戶輸入的語音信息確定為目標待識別語音信息,對所述目標待識別語音信息進行語音識別,得到目標語音識別信息;當所述目標語音識別信息與預設的喚醒詞相同時,確定所述待識別語音信息為喚醒語音,將該喚醒語音發送至所述雲端伺服器的。
與上述方法實施例相對應的,本發明實施例還提供了一種電子設備。圖5為本發明實施例提供的電子設備的結構示意圖,所述電子設備包括:
殼體510、處理器520、存儲器530、電路板540和電源電路550,其中,電路板540安置在殼體510圍成的空間內部,處理器520和存儲器530設置在電路板540上;電源電路550,用於為電子設備的各個電路或器件供電;存儲器530用於存儲可執行程序代碼;處理器520通過讀取存儲器530中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,以用於執行上述方法實施例中所述的用戶註冊方法。
一種實現方式中,上述用戶註冊方法可以包括:
每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵;
對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;
為每個類別分配一個類別標識;
將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
上述用戶註冊方法的其他實現方式參見前述方法實施例部分的說明,這裡不再贅述。
處理器520對上述步驟及上述語音信號處理方法的其他實現方式的具體執行過程以及處理器520通過運行可執行程序代碼來進一步執行的過程,可以參見本發明實施例中圖1至圖4所示實施例的描述,在此不再贅述。
需要說明的是,該電子設備以多種形式存在,包括但不限於:
(1)移動通信設備:這類設備的特點是具備移動通信功能,並且以提供話音、數據通信為主要目標。這類終端包括:智慧型手機(例如iphone)、多媒體手機、功能性手機,以及低端手機等。
(2)超移動個人計算機設備:這類設備屬於個人計算機的範疇,有計算和處理功能,一般也具備移動上網特性。這類終端包括:pda、mid和umpc設備等,例如ipad。
(3)可攜式娛樂設備:這類設備可以顯示和播放多媒體內容。該類設備包括:音頻、視頻播放器(例如ipod),掌上遊戲機,電子書,以及智能玩具和可攜式車載導航設備。
(4)伺服器:提供計算服務的設備,伺服器的構成包括處理器、硬碟、內存、系統總線等,伺服器和通用的計算機架構類似,但是由於需要提供高可靠的服務,因此在處理能力、穩定性、可靠性、安全性、可擴展性、可管理性等方面要求較高。
(5)其他具有數據交互功能的電子裝置。
可見,本發明實施例所提供的方案中,電子設備的處理器通過讀取存儲器中存儲的可執行程序代碼來運行與可執行程序代碼對應的程序,每次獲得到用戶的喚醒語音後,提取並保存所述喚醒語音對應的第一聲紋特徵;對已保存的第一聲紋特徵進行聚類,將所述第一聲紋特徵劃分為至少一個類別;每個類別中的第一聲紋特徵屬於同一個用戶;為每個類別分配一個類別標識;將每個類別標識與其對應的至少一個第一聲紋特徵對應存儲,完成用戶註冊。
本發明實施例中,每次接收到喚醒語音後,提取並保存聲紋特徵;對已保存的聲紋特徵進行聚類,將聲紋特徵劃分為至少一個類別;每個類別中的聲紋特徵屬於同一個用戶;為每個類別分配一個類別標識;將每個類別標識與其對應的至少一個聲紋特徵對應存儲,完成用戶註冊。本發明實施例無需像現有技術中一樣,用戶需要向聲紋特徵識別設備連續發出多次喚醒語音並且需要輸入用戶名稱,完成註冊後,聲紋特徵識別設備才能識別出發出語音的用戶,因此,本發明實施例能夠簡化用戶的操作,提高用戶體驗。
對於電子設備實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。