一種語音信息識別的方法及終端設備的製作方法
2023-05-13 18:40:16
一種語音信息識別的方法及終端設備的製作方法
【專利摘要】本發明涉及信息識別領域,尤其涉及一種語音信息識別的方法及終端設備,以解決現有技術中存在當待識別語音信息的聲音來源不穩定,或聲音傳輸設備產生幹擾時,確定的特徵信息容易出現偏差的問題。本發明實施例採用從待識別語音信息中提取濁音信息,從濁音信息中提取基音頻率參數和MFCC,對基音頻率參數進行處理獲得基音頻率參數匹配值;對MFCC進行處理獲得獲得MFCC參數匹配值;根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。由於語音信息中的濁音具有語音基音的周期性;並且濁音信息一般有相對固定的頻率,其特性可以看作是一個準穩態過程,因此根據濁音信息確定的語音信息的特徵信息出現差錯的概率較低。
【專利說明】一種語音信息識別的方法及終端設備
【技術領域】
[0001]本發明涉及信息識別領域,尤其涉及一種語音信息識別的方法及終端設備。
【背景技術】
[0002]隨著電子技術的發展,電子設備升級換代使其具備越來越多的功能,其中,語音控制功能備受關注,各種語音助手類應用隨著出現,語音助手類應用使得用戶可以通過電子設備閱讀簡訊、介紹餐廳、詢問天氣,推薦節目等。實現語音助手類應用中的關鍵為語音識別系統,語音信號不僅包含說話人的語義信息,而且包含了說話人的特徵信息,人們從不同說話人的語音信號中可以提取說話人的性別等身份信息。
[0003]目前的語音信息識別方法主要是通過對樣本語音信號進行處理,獲得Mel頻譜倒譜係數MFCC,根據MFCC對高斯混合模型進行訓練,獲得MFCC對應的高斯混合模型。提取待識別語音信息中的MFCC參數,根據MFCC與訓練後的高斯混合模型的匹配度確定待識別語音信息對應的特徵信息。但是,說話人的語音信息與其他生物特徵相比穩定性較差,如人臉、指紋、掌紋、虹膜等,常常與環境、情緒、健康狀態有關;其次,聲音的傳輸需要通過通訊線路或其他錄音設備進行採集,不可避免地帶來線路噪聲,而且噪聲性能會隨著時間的變化而變化;並且由於地域的不同,方言的種類繁多,說話語調的差異等後天發音習慣也會影響識別結果。
[0004]因此,現有技術中直接提取待識別語音信息中的語音特徵參數確定特徵信息時,當待識別語音信息的聲音來源不穩定,或聲音傳輸設備產生幹擾時,確定的特徵信息容易出現偏差。
【發明內容】
[0005]本發明實施例提供一種語音信息識別的方法,用以解決現有技術中存在當待識別語音信息的聲音來源不穩定,或聲音傳輸設備產生幹擾時,確定的特徵信息容易出現偏差的問題。
[0006]本發明實施例提供了一種語音信息識別方法,該方法包括:
[0007]從待識別語音信息中提取濁音信息;
[0008]從所述濁音信息中提取基音頻率參數,將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值;
[0009]根據所述濁音信息確定濁音信息對應的Mel頻率倒譜係數MFCC,將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值;
[0010]根據所述基音頻率參數匹配值及所述MFCC參數匹配值確定待識別語音信息的特徵信息。
[0011 ] 上述實施例中從待識別語音信息中提取濁音信息,從濁音信息中提取基音頻率參數和MFCC,對基音頻率參數進行處理獲得基音頻率參數匹配值;對MFCC進行處理獲得獲得MFCC參數匹配值;根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。人類的語音大致可以分為清音和濁音兩部分,濁音的聲音段以相對高的能量分布為特徵,具有語音基音的周期性。清音的振幅比較小,波形隨機變化,沒有規律性,非常類似於白噪聲的時域波形;考慮到濁音中包含很多語音信息,根據語音信號本身的特點,其特性可以看作是一個準穩態過程,即具有短時性,因此根據濁音信號確定的說話人的特徵信息出現差錯的概率較低。
[0012]本發明實施例中所述從待識別語音信息中提取濁音信息,具體包括:
[0013]對待識別語音信息進行分幀處理,確定每一幀語音信息的短時能量值,若一幀語音信息的短時能量值小於設定的短時能量閾值,則去除該幀語音信息,得到無背景聲音的待識別語首?目息;
[0014]確定每一幀無背景聲音的待識別語音信息的信號波形過零率,若一幀語音信息的過零率小於設定的過零率閾值,則去除該幀語音信息,得到待識別語音信息的濁音信息。
[0015]上述實施例中通過短時能量值和短時過零率對語音信息進行提取,獲得濁音信息,通過濁音信息確定對應的特徵信息,提高語音信息對應的特徵信息識別的準確率。
[0016]本發明實施例中將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值,具體包括:
[0017]將基音頻率參數代入所述基音頻率匹配模型,得到第一匹配概率值,將得到的第一匹配概率值作為 基音頻率參數匹配值;
[0018]將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值,具體包括:
[0019]將所述MFCC代入所述MFCC參數匹配模型,得到第二匹配概率值,將得到的第二匹配概率值作為MFCC參數匹配值。
[0020]上述實施例中分別獲得基音頻率參數匹配值,MFCC參數匹配值,根據獲得的匹配值確定待識別語首息對應的性別信息。
[0021]本發明實施例中所述特徵信息為待識別語音信息對應的性別信息;
[0022]所述基音頻率匹配模型包括男性基音頻率匹配模型,女性基音頻率匹配模型;
[0023]所述MFCC參數匹配模型包括男性MFCC參數匹配模型,女性MFCC參數匹配模型。
[0024]本發明實施例中所述將基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值,具體包括:
[0025]將所述基音頻率參數分別與男性基音頻率匹配模型和女性基音頻率匹配模型進行匹配,分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值;
[0026]所述將MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值,具體包括:
[0027]將所述MFCC分別與男性MFCC參數匹配模型和女性MFCC參數匹配模型進行匹配,分別獲得男性MFCC參數匹配值,女性MFCC參數匹配值。
[0028]上述實施例中分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值,男性MFCC參數匹配值,女性MFCC參數匹配值,根據獲得的匹配值確定待識別語音信息對應的性別信息。
[0029]本發明實施例中所述根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息,具體包括:
[0030]為基音頻率參數匹配值分配基音頻率參數權重值,為MFCC參數匹配值分配MFCC參數權重值,且基音頻率參數權重值與MFCC參數權重值之和等於I ;[0031]將所述男性基音頻率參數匹配值和基音頻率參數權重值的乘積,與男性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到男性特徵參數值;
[0032]將所述女性基音頻率參數匹配值和基音頻率參數權重值的乘積,與女性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到女性特徵參數值;
[0033]判斷男性特徵參數值與女性特徵參數值的大小,若男性特徵參數值大於女性特徵參數值,則確定待識別語音信息對應的性別信息為男性;若男性特徵參數值小於女性特徵參數值,則確定待識別語音信息對應的性別信息為女性。
[0034]上述實施例中根據基音頻率參數權重值和MFCC參數權重值,確定待識別語音信息對應的性別信息,提高了性別識別的準確率。[0035]本發明實施例中該方法還包括:
[0036]根據確定的性別信息為用戶推薦該性別對應的推薦信息。
[0037]記錄用戶的觀影記錄,根據所述用戶的性別信息將所述觀影記錄添加至對應的推薦信息中,根據影片的實時數據更新推薦信息。
[0038]上述實施例中根據確定的性別信息,確定對應的推薦信息,如果性別識別結果是男性,則進入男版推薦信息界面,根據男性觀眾的喜好進行相應的電視節目,廣告以及影片的推薦等;若判別為女性,會顯示女版的推薦信息界面,根據女性觀眾比較熱衷的節目類型,廣告種類及相應影片推薦等個性化內容,實現電視根據用戶性別差異的個性化推薦功能;並根據用戶喜好,實時更新推薦信息。
[0039]本發明實施例提供了一種語音信息識別的終端設備,所述終端設備包括:
[0040]濁音信息提取模塊,用於從待識別語音信息中提取濁音信息;
[0041]基頻參數處理模塊,用於從所述濁音信息中提取基音頻率參數,將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值;
[0042]MFCC參數處理模塊,用於根據所述濁音信息確定濁音信息對應的Mel頻率倒譜係數MFCC,將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值;
[0043]特徵信息確定模塊,用於根據所述基音頻率參數匹配值及所述MFCC參數匹配值確定待識別語首/[目息的特徵/[目息。
[0044]上述實施例中從待識別語音信息中提取濁音信息,從濁音信息中提取基音頻率參數和MFCC,對基音頻率參數進行處理獲得基音頻率參數匹配值;對MFCC進行處理獲得獲得MFCC參數匹配值;根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。人類的語音大致可以分為清音和濁音兩部分,濁音的聲音段以相對高的能量分布為特徵,具有語音基音的周期性。清音的振幅比較小,波形隨機變化,沒有規律性,非常類似於白噪聲的時域波形;考慮到濁音中包含很多語音信息,根據語音信號本身的特點,其特性可以看作是一個準穩態過程,即具有短時性,因此根據濁音信號確定的說話人的特徵信息出現差錯的概率較低。
[0045]所述濁音信息提取模塊,具體用於:
[0046]對待識別語音信息進行分幀處理,確定每一幀語音信息的短時能量值,若一幀語音信息的短時能量值小於設定的短時能量閾值,則去除該幀語音信息,得到無背景聲音的待識別語首?目息;
[0047]確定每一幀無背景聲音的待識別語音信息的信號波形的過零率,若一幀語音信息的過零率小於設定的過零率閾值,則去除該幀語音信息,得到待識別語音信息的濁音信息。
[0048]上述實施例中通過短時能量值和短時過零率對語音信息進行提取,獲得濁音信息,通過濁音信息確定對應的特徵信息,提高語音信息對應的特徵信息識別的準確率。
[0049]所述基頻參數處理模塊,具體用於:
[0050]將基音頻率參數代入所述基音頻率匹配模型,得到第一匹配概率值,將得到的第一匹配概率值作為基音頻率參數匹配值;
[0051 ] 所述MFCC參數處理模塊,具體用於:
[0052]將所述MFCC代入所述MFCC參數匹配模型,得到第二匹配概率值,將得到的第二匹配概率值作為MFCC參數匹配值。
[0053]上述實施例中分別獲得基音頻率參數匹配值,MFCC參數匹配值,根據獲得的匹配值確定待識別語首息對應的性別信息。
[0054]本發明實施例中述特徵信息為待識別語音信息對應的性別信息;
[0055]所述基音頻率匹配模型包括男性基音頻率匹配模型,女性基音頻率匹配模型;
[0056]所述MFCC參數匹配模型包括男性MFCC參數匹配模型,女性MFCC參數匹配模型。
[0057]本發明實施例中所述基頻參數處理模塊具體用於:
[0058]將所述基音頻率參數分別與男性基音頻率匹配模型和女性基音頻率匹配模型進行匹配,分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值;
[0059]所述MFCC參數處理模塊具體用於:
[0060]將所述MFCC分別與男性MFCC參數匹配模型和女性MFCC參數匹配模型進行匹配,分別獲得男性MFCC參數匹配值,女性MFCC參數匹配值。
[0061]上述實施例中分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值,男性MFCC參數匹配值,女性MFCC參數匹配值,根據獲得的匹配值確定待識別語音信息對應的性別信息。
[0062]本發明實施例中所述特徵信息確定模塊具體用於:
[0063]為基音頻率參數匹配值分配基音頻率參數權重值,為MFCC參數匹配值分配MFCC參數權重值,且基音頻率參數權重值與MFCC參數權重值之和等於I ;將所述男性基音頻率參數匹配值和基音頻率參數權重值的乘積,與男性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到男性特徵參數值;將所述女性基音頻率參數匹配值和基音頻率參數權重值的乘積,與女性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到女性特徵參數值;判斷男性特徵參數值與女性特徵參數值的大小,若男性特徵參數值大於女性特徵參數值,則確定待識別語音信息對應的性別信息為男性;若男性特徵參數值小於女性特徵參數值,則確定待識別語音信息對應的性別信息為女性。
[0064]上述實施例中根據基音頻率參數權重值和MFCC參數權重值,確定待識別語音信息對應的性別信息,提高了性別識別的準確率。
[0065]本發明實施例中所述終端設備還包括信息推薦模塊,用於:
[0066]根據確定的性別信息為用戶推薦該性別對應的推薦信息。
[0067]所述信息推薦模塊,還用於:
[0068]記錄用戶的觀影記錄,根據所述用戶的性別信息將所述觀影記錄添加至對應的推薦信息中,根據影片的實時數據更新推薦信息。[0069]上述實施例中根據確定的性別信息,確定對應的推薦信息,如果性別識別結果是男性,則進入男版推薦信息界面,根據男性觀眾的喜好進行相應的電視節目,廣告以及影片的推薦等;若判別為女性,會顯示女版的推薦信息界面,根據女性觀眾比較熱衷的節目類型,廣告種類及相應影片推薦等個性化內容,實現電視根據用戶性別差異的個性化推薦功能;並根據用戶喜好,實時更新推薦信息。
[0070]本發明實施例採用從待識別語音信息中提取濁音信息,從濁音信息中提取基音頻率參數和MFCC,對基音頻率參數進行處理獲得基音頻率參數匹配值;對MFCC進行處理獲得獲得MFCC參數匹配值;根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。由於語音信息中的濁音的聲音段以相對高的能量分布為特徵,具有語音基音的周期性,而且能量大部分集中在低頻段內;並且濁音信息一般有相對固定的頻率,其特性可以看作是一個準穩態過程,即具有短時性,因此根據濁音信號確定的說話人的特徵信息出現差錯的概率較低。
【專利附圖】
【附圖說明】
[0071]圖1為本發明實施例中一種語音信息識別的方法的流程示意圖;
[0072]圖2為本發明實施例對語音信息識別設備進行訓練的方法的流程示意圖;
[0073]圖3為本發明實施例中提取濁音信息的具體方法的流程示意圖;
[0074]圖4為本發明實施例中確定基音頻率參數的具體方法的流程示意圖;
[0075]圖5為本發明實施例中確定濁音信息對應的Mel頻率倒譜係數MFCC的方法的流程不意圖;
[0076]圖6為本發明實施例中語音信息識別訓練的方法的流程示意圖;
[0077]圖7為本發明實施例中語音信息識別的方法的流程示意圖;
[0078]圖8為本發明實施例中根據待識別語音的性別信息推薦信息的方法的流程示意圖;
[0079]圖9為本發明實施例中一種語音信息識別的終端設備的示意圖;
[0080]圖10為本發明實施例中包含信息推薦模塊的終端設備的示意圖;
[0081]圖11為本發明實施例中包含訓練模塊的終端設備的示意圖。
【具體實施方式】
[0082]本發明實施例提供了一種語音信息識別方法及終端設備,從待識別語音信息中提取濁音信息,從濁音信息中提取基音頻率參數和MFCC,對基音頻率參數進行處理獲得基音頻率參數匹配值;對MFCC進行處理獲得獲得MFCC參數匹配值;根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。
[0083]人類的語音大致可以分為清音和濁音兩部分,濁音的聲音段以相對高的能量分布為特徵,具有語音基音的周期性,在頻域上有共振峰結構,而且能量大部分集中在低頻段內。清音的振幅比較小,波形隨機變化,沒有規律性,非常類似於白噪聲的時域波形;並且濁音信息一般有相對固定的頻率,即基音頻率,基音頻率與說話人以及發音有很大關係,考慮到濁音中包含很多語音信息,根據語音信號本身的特點,在10?30ms的短時間範圍內,其特性可以看作是一個準穩態過程,即具有短時性,因此根據濁音信號確定的說話人的特徵信息出現差錯的概率較低。
[0084]下面結合說明書附圖對本發明實施例進行進一步說明。
[0085]如圖1所示,為本發明實施例中一種語音信息識別的方法,該方法包括:
[0086]步驟101:從待識別語音信息中提取濁音信息;
[0087]步驟102:從濁音信息中提取基音頻率參數,將基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值;
[0088]步驟103:根 據濁音信息確定濁音信息對應的Mel頻率倒譜係數MFCC,將MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值;
[0089]步驟104:根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息。
[0090]其中,步驟101中,從待識別語音信息中提取濁音信息,具體包括:對待識別語音信息進行預處理,預處理的方法包括但不限於以下方法:分幀,加窗和預加重。語音信號是一個非平穩隨機過程,但在一個短時範圍內(10~30ms)其特性基本保持不變,即語音信號的「短時平穩性」;因此對語音信號的分析處理必須建立在短時平穩的基礎上,需要對語音信號進行分幀處理。此外,語音信號的平均功率譜受到生門激勵和口鼻輻射的影響,高頻段大約在8000Hz以上按6dB/倍程跌落,通過預加重提升語音信號的高頻部分,使信號的頻譜變得平坦。
[0091]待識別語首彳目息包括清首/[目息,池首/[目息和背景聲首/[目息;背景聲首?目息中包括:靜音信息和噪聲信息;對待識別語音信息進行分幀,加窗處理,如式1-1所不,為分幀,加窗處理後的第η幀語音信號值Xn(m)的表達式:
[0092]xn(m) =w (m).x (n+m),(O ≤m ≤N_l) (1-1)
[0093]其中^坤』^一^…』階州為幀長^為幀移長度,「!!!)為可移動的有限長度的窗函數,m為該幀語音信號的採樣點數。
[0094]對分幀,加窗處理後的語音信號進行短時能量處理,分別求出每一幀語音信號的能量;由於語音信號的清音段,濁音段和靜音段的能量不同,濁音段的短時能量最大,清音段的短時能量次之,靜音段的短時能量最小;將能量值小於設定的能量閾值的語音段確定為靜音段,將待識別語音信息中的靜音段去除。如式1-2為語音信號的短時能量值En的計算公式:
【權利要求】
1.一種語音信息識別的方法,其特徵在於,該方法包括: 從待識別語首?目息中提取池首?目息; 從所述濁音信息中提取基音頻率參數,將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值; 根據所述濁音信息確定濁音信息對應的Mel頻率倒譜係數MFCC,將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值; 根據所述基音頻率參數匹配值及所述MFCC參數匹配值確定待識別語音信息的特徵信息。
2.如權利要求1所述的方法,其特徵在於,所述從待識別語音信息中提取濁音信息,具體包括: 對待識別語音信息進行分幀處理,確定每一幀語音信息的短時能量值,若一幀語音信息的短時能量值小於設定的短時能量閾值,則去除該幀語音信息,得到無背景聲音的待識別語首?目息; 確定每一幀無背景聲音的待識別語音信息的信號波形過零率,若一幀語音信息過零率小於設定的過零率閾值,則去除該幀語音信息,得到待識別語音信息的濁音信息。
3.如權利要求1所述的方法,其特徵在於,將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值,具體包括: 將基音頻率參數代入所述基音頻率匹配模型,得到第一匹配概率值,將得到的第一匹配概率值作為基音頻率參數匹配值; 將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值,具體包括: 將所述MFCC代入所述MFCC參數匹配模型,得到第二匹配概率值,將得到的第二匹配概率值作為MFCC參數匹配值。
4.如權利要求1所述的方法,其特徵在於,所述特徵信息為待識別語音信息對應的性另1Ji目息; 所述基音頻率匹配模型包括男性基音頻率匹配模型,女性基音頻率匹配模型; 所述MFCC參數匹配模型包括男性MFCC參數匹配模型,女性MFCC參數匹配模型。
5.如權利要求4所述的方法,其特徵在於,所述將基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值,具體包括: 將所述基音頻率參數分別與男性基音頻率匹配模型和女性頻率基音頻率匹配模型進行匹配,分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值; 所述將MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值,具體包括: 將所述MFCC分別與男性MFCC參數匹配模型和女性MFCC參數匹配模型進行匹配,分別獲得男性MFCC參數匹配值,女性MFCC參數匹配值。
6.如權利要求5所述的方法,其特徵在於,所述根據基音頻率參數匹配值及MFCC參數匹配值確定待識別語音信息的特徵信息,具體包括: 為基音頻率參數匹配值分配基音頻率參數權重值,為MFCC參數匹配值分配MFCC參數權重值,且基音頻率參數權重值與MFCC參數權重值之和等於I ; 將所述男性基音頻率參數匹配值和基音頻率參數權重值的乘積,與男性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到男性特徵參數值;將所述女性基音頻率參數匹配值和基音頻率參數權重值的乘積,與女性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到女性特徵參數值; 判斷男性特徵參數值與女性特徵參數值的大小,若男性特徵參數值大於女性特徵參數值,則確定待識別語音信息對應的性別信息為男性;若男性特徵參數值小於女性特徵參數值,則確定待識別語音信息對應的性別信息為女性。
7. 如權利要求6所述的方法,其特徵在於,該方法還包括: 根據確定的性別信息為用戶推薦該性別對應的推薦信息。
8.如權利要求7所述的方法,其特徵在於,該方法還包括: 記錄用戶的觀影記錄,根據所述用戶的性別信息將所述觀影記錄添加至對應的推薦信息中,並根據影片的實時數據更新推薦信息。
9.一種語音信息識別的終端設備,其特徵在於,所述終端設備包括: 濁音信息提取模塊,用於從待識別語音信息中提取濁音信息; 基頻參數處理模塊,用於從所述濁音信息中提取基音頻率參數,將所述基音頻率參數與基音頻率匹配模型進行匹配獲得基音頻率參數匹配值; MFCC參數處理模塊,用於根據所述濁音信息確定濁音信息對應的Mel頻率倒譜係數MFCC,將所述MFCC與MFCC參數匹配模型進行匹配獲得MFCC參數匹配值; 特徵信息確定模塊,用於根據所述基音頻率參數匹配值及所述MFCC參數匹配值確定待識別語首/[目息的特徵彳目息。
10.如權利要求9所述的終端設備,其特徵在於,所述濁音信息提取模塊,具體用於: 對待識別語音信息進行分幀處理,確定每一幀語音信息的短時能量值,若一幀語音信息的短時能量值小於設定的短時能量閾值,則去除該幀語音信息,得到無背景聲音的待識別語首?目息; 確定每一幀無背景聲音的待識別語音信息的信號波形過零率,若一幀語音信息過零率小於設定的過零率閾值,則去除該幀語音信息,得到待識別語音信息的濁音信息。
11.如權利要求9所述的終端設備,其特徵在於,所述基頻參數處理模塊,具體用於: 將基音頻率參數代入所述基音頻率匹配模型,得到第一匹配概率值,將得到的第一匹配概率值作為基音頻率參數匹配值; 所述MFCC參數處理模塊,具體用於: 將所述MFCC代入所述MFCC參數匹配模型,得到第二匹配概率值,將得到的第二匹配概率值作為MFCC參數匹配值。
12.如權利要求9所述的終端設備,其特徵在於,所述特徵信息為待識別語音信息對應的性別信息; 所述基音頻率匹配模型包括男性基音頻率匹配模型,女性基音頻率匹配模型; 所述MFCC參數匹配模型包括男性MFCC參數匹配模型,女性MFCC參數匹配模型。
13.如權利要求12所述的終端設備,其特徵在於,所述基頻參數處理模塊具體用於: 將所述基音頻率參數分別與男性基音頻率匹配模型和女性基音頻率匹配模型進行匹配,分別獲得男性基音頻率參數匹配值,女性基音頻率參數匹配值; 所述MFCC參數處理模塊具體用於: 將所述MFCC分別與男性MFCC參數匹配模型和女性MFCC參數匹配模型進行匹配,分別獲得男性MFCC參數匹配值,女性MFCC參數匹配值。
14.如權利要求13所述的終端設備,其特徵在於,所述特徵信息確定模塊具體用於: 為基音頻率參數匹配值分配基音頻率參數權重值,為MFCC參數匹配值分配MFCC參數權重值,且基音頻率參數權重值與MFCC參數權重值之和等於I ;將所述男性基音頻率參數匹配值和基音頻率參數權重值的乘積,與男性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到男性特徵參數值;將所述女性基音頻率參數匹配值和基音頻率參數權重值的乘積,與女性MFCC參數匹配值和MFCC參數權重值的乘積相加,得到女性特徵參數值;判斷男性特徵參數值與女性特徵參數值的大小,若男性特徵參數值大於女性特徵參數值,則確定待識別語音信息對應的性別信息為男性;若男性特徵參數值小於女性特徵參數值,則確定待識別語音信息對應的性別信息為女性。
15.如權利要求14所述的終端設備,其特徵在於,所述終端設備還包括信息推薦模塊,用於: 根據確定的性別信息為用戶推薦該性別對應的推薦信息。
16.如權利要求15所述的終端設備,其特徵在於,所述信息推薦模塊,還用於: 記錄用戶的觀影記錄,根據所述用戶的性別信息將所述觀影記錄添加至對應的推薦信息中,並根據影片的實時數據更新推薦信息。
【文檔編號】G10L15/02GK103943104SQ201410151266
【公開日】2014年7月23日 申請日期:2014年4月15日 優先權日:2014年4月15日
【發明者】匡濤, 賈魁, 王勇進, 任曉楠 申請人:海信集團有限公司