一種演唱者音色相似的歌星推薦方法與裝置製造方法

2023-05-15 10:07:56 2

一種演唱者音色相似的歌星推薦方法與裝置製造方法
【專利摘要】一種演唱者音色相似的歌星推薦方法，包括：獲得純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集，用聲音模型算法訓練出對應歌星模型；對於給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。本發明還提供相應的裝置。本發明可應用於KTV場景中，為用戶推薦與其音色相似的歌星，可以增加演唱的樂趣，並提高用戶模仿歌星音色的水平。
【專利說明】一種演唱者音色相似的歌星推薦方法與裝置
【【技術領域】】
[0001]本發明涉及智能語音【技術領域】，具體涉及一種演唱者音色相似的歌星推薦方法與
>J-U ρ?α裝直。
【【背景技術】】
[0002]隨著智能終端的普及，人們對生活智能化服務的要求越來越高，語音智能能化服務成為人們迫切需要。
[0003]現有唱歌評測技術中有對演唱者「唱得準不準」的評定方法，比如音準評分技術，但較少對「唱得像不像」或者「唱得像誰」作出評定。K歌系統的智能化迫切需要一種技術，能根據用戶的聲音匹配出與其音色最接近的歌手，進而向用戶推薦相應歌手的歌曲，從而增加用戶演唱的樂趣，並提高用戶模仿歌星音色的水平。
【
【發明內容】
】
[0004]本發明所要解決的技術問題之一在於提供一種演唱者音色相似的歌星推薦方法，實現為演唱者找出與其音色相似的歌星的功能。
[0005]本發明是採用以下技術方案解決上述技術問題之一的:
[0006]一種演唱者音色相似的歌星推薦方法，包括如下步驟:
[0007]音頻庫處理:獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；
[0008]歌星模型訓練:根據每個歌星所對應的特徵係數集，用聲音模型算法訓練出對應歌星模型；
[0009]音色匹配:對於給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
[0010]進一步，所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
[0011]進一步，所述歌星模型訓練步驟包括:首先將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM;接著根據每個歌星所對應的特徵係數集，利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
[0012]進一步，所述音色匹配步驟中，「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配，找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，將對數似然比最大值所對應的歌星作為推薦歌星。
[0013]進一步，所述聲音特徵係數，為MFCC、LPCC、LSP、PLP中的一種。
[0014]進一步，所述音頻庫處理步驟和音色匹配步驟中的預處理步驟均依次包括:分幀、加窗、去靜音；
[0015]所述去靜音，包括如下步驟:
[0016]計算每幀的短時能量，公式為:
N-1
[0017]En = ^ [ W'(m )χ(η + m)]2

m — O
[0018]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度；
[0019]當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。
[0020]進一步，所述自適應訓練出音頻庫中所有歌星的模型，採用貝葉斯自適應算法，具體包括:
[0021 ] 對於UBM的第i個混合成員，計算分量i的後驗概率:
[0022]廣 W" — —^~

Lj-1wJ PAx^
[0023]其中χ表示特徵係數，w表示權重係數；
[0024]然後計算權重、均值和方差:
TI TI Γ
[0025]ni=Y^p{i\xt)， Ej(X) = -J^P(IlXl)XteM1)
,μ? ?=ιη ?=ι
[0026]接著修正舊UBM中各個高斯分布的參數Wi, μ i，W，
[0027]修正後的新權重:u'.,.=[<?,./廠+.(1-<)H:.];,；
[0028]修正後的新均值:μ.= ?；η￡.(λ-) + (1 - α'；')μ,；
[0029]修正後的新方差:^= α w ^ ) + (丨—< )(< +μ:)_^:
[0030]其中，Y為規則因子,用來保證&的和為I, a.'，a';'，a.'分別為對第i個高斯的權重、均值，方差的修正因子，

η.
[0031]<式中，rP為常數，用來約束修正因子的變化尺度。

/2.十 /

?
[0032]進一步，所述計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，公式為:
[0033]S(X) = ^Xlog ρ{χ, I Λ--.) — 1Og p{x, I ),

i
[0034]其中χ表示特徵係數，T表示幀數，λ star, λ ubm表示歌星模型與UBM模型，P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
[0035]本發明還提供一種演唱者音色相似的歌星推薦裝置，其包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊，
[0036]音頻庫處理模塊:用於獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；
[0037]歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集，採用聲音模型算法訓練出對應歌星模型；
[0038]音色匹配模塊:用於對給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
[0039]進一步，所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
[0040]進一步，所述歌星模型訓練模塊包括:將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM ；
[0041]接著根據每個歌星所對應的特徵係數集，利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
[0042]進一步，所述音色匹配模塊中，「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配，找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，將對數似然比最大值所對應的歌星作為推薦歌星。
[0043]進一步，所述聲音特徵係數，為MFCC、LPCC、LSP、PLP中的一種。
[0044]進一步，所述音頻庫處理模塊和音色匹配模塊中的預處理步驟均依次包括:分幀、加窗、去靜音；
[0045]所述去靜音，包括如下步驟:
[0046]計算每幀的短時能量，公式為:
N-1
[0047]五?= Σ [w(m )x(n + m)}2

m = 0
[0048]上式中，w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度；
[0049]當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。
[0050]進一步，所述自適應訓練出音頻庫中所有歌星的模型，採用貝葉斯自適應算法，具體包括:
[0051 ] 對於UBM的第i個混合成員，計算分量i的後驗概率:

wIPiix,)
[0052]Ρ、1 \χ?)- -Γ~
[0053]其中χ表示特徵係數，w表示權重係數；
[0054]然後計算權重、均值和方差:
[0055]Hi = [ /；(/' I X,) ， E1 ⑴=士Σ 1-V K Ει (χ2)=丄 Σ P^i I Λ )
卜In /-1n t=x
[0056]接著修正舊UBM中各個高斯分布的參數Wi, μ i，σ,；，
[0057]修正後的新權重:& =[α廣/v/7>(卜、.];/ ;
[0058]修正後的新均值:Iii= cr；B￡f(x) + (l-0//.；
[0059]修正後的新方差:(」=Q,; ￡■ ( γ-) + (I — α'.)(^- + jut) — μ);
[0060]其中，Υ為規則因子，用來保證&的和為1，分別為對第i個高斯的權重、均值，方差的修正因子，
[0061]af，式中，rP為常數，用來約束修正因子的變化尺度。
[0062]進一步，所述計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，公式為:
[0063]Si= ^Xlog Pixi I Λ,?,.) - *Og [Αχ, I Kn,,)，

I /-1
[0064]其中χ表示特徵係數，T表示幀數，λ star, λ ubm表示歌星模型與UBM模型，P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
[0065]本發明的優點在於:本發明提出一種演唱者音色相似的歌星推薦方法及裝置，為演唱者找出與其音色相似的歌星作為參考，增加演唱的樂趣。應用於KTV場景中，能夠吸引大量用戶，刺激消費，並提高用戶模仿歌星音色的水平。
【【專利附圖】

【附圖說明】】
[0066]下面參照附圖結合實施例對本發明作進一步的描述。
[0067]圖1是本發明的方法音頻庫處理與歌星模型訓練過程的流程圖。
[0068]圖2是本發明的方法中單個歌星模型訓練流程圖。
[0069]圖3是本發明的方法音色匹配過程流程圖。
[0070]圖4是本發明的方法中音色匹配過程中計算似然比流程圖。
[0071]圖5是本發明的裝置結構示意圖。
【【具體實施方式】】
[0072]第一實施例:
[0073]一種演唱者音色相似的歌星推薦方法，包括如下步驟:
[0074]音頻庫處理:獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；
[0075]歌星模型訓練:根據每個歌星所對應的特徵係數集，用聲音模型算法訓練出對應歌星模型；
[0076]音色匹配:對於給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
[0077]下面對該實施例進行詳細描述。
[0078]—種演唱者音色相似的歌星推薦方法，包括如下步驟:
[0079]S1:音頻庫處理過程(如圖1所示):
[0080]Sll:準備音頻庫，收集一定數量的歌星的若干歌曲，比如300個歌星，每個歌星5首歌曲所對應的立體聲音頻；
[0081]S12:對音頻庫中的所有歌曲去除伴奏得到純人聲頻，其方法可參考專利名稱為《一種立體聲音頻的處理方法與裝置》，專利申請號為:201410263446.3的中國發明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性，對伴奏進行抑制濾波，從而提取人聲。對歌曲去伴奏的目的是減少歌曲中的伴奏成分對於歌星音色模型訓練的影響。
[0082]對音頻庫中的所有歌曲去除伴奏得到純人聲音頻，具體包括:
[0083]將立體聲音頻的左右聲道信號變換到頻域；
[0084]計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，對幅度比值在預設範圍內的頻點列為待衰減的頻點，且計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點也列為待衰減的頻點；所述幅度比值的計算公式為:
[0085]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0086]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅立葉變換的點數，相位差的計算公式為:
[0087]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0088]n = 0,1,2,…，N_1 ;i = 0，1，2，...，FN/2 ;
[0089]接著，篩選出待衰減的頻點，也就是將幅度比值落在一定範圍的頻點，其中頻點i符合
[0090]kn(i)〈a 或匕⑴〉^，0〈α〈0.5，0.5〈β〈1，a 取 0.4，β 取 0.6，
[0091]或將相位差值落在一定範圍的頻點，其中i符合
[0092]pn (i) Ψ，<Φ < O, O < φ < π，這裡 φ 取-0.1，滬取 0.1，列為待衰減的頻點；
[0093]對待衰減的頻點，即伴奏成分進行衰減處理，公式為:
[0094]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中，i 為待衰減的頻點；
[0095]將衰減後的頻域信號逆變換為時域，即可得到去除伴奏後的歌曲音頻。
[0096]在其他實施方式中，也可以通過其他方法得到純人聲音頻，並不局限於上述算法。
[0097]在其他實施方式中，如果步驟Sll中已搜集到所有歌星的純人聲音頻，則略過步驟 S12。
[0098]S13:對去除伴奏後的歌曲進行預處理，包括:分幀、加窗、去靜音；
[0099]分幀，是指將音頻信號分成若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；
[0100]加窗，採用加漢寧窗濾波處理，還可以是其他的加窗方式。
[0101]去靜音，包括:
[0102]計算每幀的短時能量，公式為:
N-1
[0103]En = ^l u,(m )λ.(n + m)]2

m — Q
[0104]上式中，w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度；
[0105]當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。靜音並不包含有效的聲音特徵，因此需要去除。
[0106]S14:對預處理後的音頻提取聲音特徵係數。所述聲音特徵係數可以是MFCC、LPCC, LSP、PLP中的一種；MFCC是指Mel頻率倒譜係數，LPCC是指線性預測倒譜係數，LSP是指線譜對係數，PLP是指感知線性預測係數，這些係數都能很好地表徵聲音的音色特徵，可任選一種。本發明優選提取MFCC或LPCC聲音特徵係數。
[0107]S2:歌星模型訓練過程，如圖1?圖2所示。
[0108]將提取的聲音特徵係數集中在一起訓練出通用背景模型UBM，並根據每個歌星所對應的聲音特徵係數集，利用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。UBM模型其實是一個高混合度的高斯模型，其訓練過程與GMM類似，採用EM迭代算法，這裡不詳述。
[0109]自適應訓練出歌星的模型過程，如圖2所示，採用貝葉斯自適應算法，具體如下:
[0110]對於UBM的第i個混合成員，計算分量i的後驗概率:
[0111]Am 財
LmwJpAx^
[0112]其中χ表示特徵係數，w表示權重係數；
[0113]然後計算權重、均值和方差:
[0114]", = Σ /,(/1 -V,) ，Ej (.V)=丄 Z P(i 1-V, )λ:Ei (.ν?)=丄 Σ /,(/.丨 λ., ).v；
?=ιn t=1η t=x
[0115]接著修正舊UBM中各個高斯分布的參數Wi，Ui,「
[0116]修正後的新權重:IT+{\-17；)u.;.Jy ；
[0117]修正後的新均值:Κμ;= α'；--(χ) + {\-α'!')μ? ；
[0118]修正後的新方差:h= a:Ei(x2) + (l-a； + //:)-μ:；
[0119]其中，Y為規則因子,用來保證&的和為I,分別為對第i個高斯的權重、均值，方差的修正因子，
[0120]< = 二.P= U.,/?,V，式中，rP為常數，用來約束修正因子的變化尺度，一

Ui +
般選16。
[0121]本步驟可訓練出一個通用UBM模型以及所有歌星的音色模型。
[0122]S3:音色匹配過程(如圖3?4所示):
[0123]S31:用戶聲音樣本處理:對於給定的用戶，即演唱者的聲音樣本，同樣進行預處理，並提取聲音特徵係數；
[0124]S32:接著計算提取的聲音特徵係數與歌星模型以及與通用模型UBM的對數似然比(如圖4所示)，將對數似然比最大值所對應的歌星作為推薦歌星。
[0125]對數似然比的計算公式為:

Γ
[0126]S(X) = J] log p(x, I ) - log p(x, I Anlm ),
[0127]其中χ表示特徵係數，λ stm，Aubm表示歌星模型與UBM模型，p表示歌星模型或UBM模型輸出特徵矢量序列的似然度；
[0128]此處採用時間歸一化的對數似然比，

I τ
[0129]SiX) = ~Y^ log p(x, I 人?".) - log p(x, I Aihn)。

Z 1-1
[0130]本步驟可找出與用戶音色接近的歌星作為推薦，從而增加用戶演唱的樂趣。
[0131]在其他實施方式中，也可以使用GMM、HMM等聲音模型作為歌星模型訓練以及音色匹配的方法。
[0132]第二實施例:
[0133]一種演唱者音色相似的歌星推薦裝置，其包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊，
[0134]音頻庫處理模塊:用於獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；
[0135]歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集，採用聲音模型算法訓練出對應歌星模型；
[0136]音色匹配模塊:用於對給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
[0137]下面具體描述該實施例。
[0138]一種演唱者音色相似的歌星推薦裝置，如圖5所示，包括:
[0139]音頻庫處理模塊，用於對音頻庫中的所有歌曲去除伴奏得到純人聲音頻，再對純人聲音頻進行預處理，然後對預處理後的音頻提取聲音特徵係數；
[0140]歌星模型訓練模塊，用於將提取的聲音特徵係數集中在一起訓練出通用背景模型UBM,並根據每個歌星所對應的聲音特徵係數集，利用背景模型UBM自適應訓練出音頻庫中所有歌星的模型；
[0141]音色匹配模塊，用於對給定用戶的聲音樣本進行預處理並提取聲音特徵係數；然後計算提取的聲音特徵係數與歌星模型以及與通用模型UBM的對數似然比，將對數似然比最大值所對應的歌星作為推薦歌星。
[0142]對音頻庫中的所有歌曲去除伴奏得到純人聲音頻的方法，參考專利名稱為《一種立體聲音頻的處理方法與裝置》，專利申請號為:201410263446.3的中國發明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性，對伴奏進行抑制濾波，從而提取人聲。
[0143]具體包括:
[0144]將立體聲音頻的左右聲道信號變換到頻域；
[0145]計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，對幅度比值在預設範圍內的頻點列為待衰減的頻點，且計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點也列為待衰減的頻點；所述幅度比值的計算公式為:
[0146]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0147]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅立葉變換的點數，相位差的計算公式為:
[0148]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0149]n = 0,1,2,…，N_1 ;i = 0，1，2，...，FN/2 ;
[0150]接著，篩選出待衰減的頻點，也就是將幅度比值落在一定範圍的頻點，其中頻點i符合
[0151]kn(i)〈a 或匕⑴〉^，0〈α〈0.5，0.5〈β〈1，a 取 0.4，β 取 0.6，
[0152]或將相位差值落在一定範圍的頻點，其中i符合
[0153]ρηα)〈Φ ^ρΛ?)>φ^^<Φ<0,0<φ<π，這裡 φ 取 _0.L 妒取 0.1，列為待衰減的頻點；
[0154]對待衰減的頻點，即伴奏成分進行衰減處理，公式為:
[0155]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中，i 為待衰減的頻點；
[0156]將衰減後的頻域信號逆變換為時域，即可得到去除伴奏後的歌曲音頻。
[0157]所述聲音特徵係數，為MFCC、LPCC、LSP、PLP中的一種。
[0158]所述音頻庫處理模塊和音色匹配模塊中的預處理，包括:分幀、加窗、去靜音；
[0159]所述分幀，是指將音頻信號分成若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；
[0160]所述加窗，是指加漢寧窗濾波處理。
[0161]所述預處理步驟中的去靜音操作，包括:
[0162]計算每幀的短時能量，公式為:

N -1
[0163]五? 二 I [ W (m ) χ (n + m )]2

m = 0
[0164]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度；
[0165]當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。
[0166]所述歌星模型訓練模塊中的自適應訓練出歌星的模型過程，採用貝葉斯自適應算法，具體包括:
[0167]對於UBM的第i個混合成員，計算分量i的後驗概率:
Ρ(? I M _ wiPi(x,)
[0168]AM λ,.)—

LmwJ P λχ>)
[0169]其中X表示特徵係數，w表示權重係數；
[0170]然後計算權重、均值和方差:
[0171]", = Σ I) ，eI ⑴=丄 Σ I χ丨 K.Ei (χ2)=丄 Σ 1-ν,
t-\n ?-1n.
[0172]接著修正舊UBM中各個高斯分布的參數Wi, Ui, ^
[0173]修正後的新權重:w,= |_0./ Γ + (丨-f jy
[0174]修正後的新均值:1、=⑴+ (卜0.；
[0175]修正後的新方差:=a'； Ej(χ2) + (1- a,' )(d'f + μ]) - μ]；
[0176]其中，Υ為規則因子，用來保證&的和為1，，<分別為對第i個高斯的權重、均值，方差的修正因子，
PHi
[0177]< =^r7W = u』./".V，式中，rp為常數，用來約束修正因子的變化尺度。

11j 十 /
[0178]所述音色匹配模塊中的對數似然比的計算公式為:
[0179]S(X) = Yj log p(x, I /I,,,,,.) - log p(x, i Anhm),

/-1
[0180]其中χ表示特徵係數，λ stm，λ-表示歌星模型與UBM模型，p表示歌星模型或UBM模型輸出特徵矢量序列的似然度；
[0181]此處採用時間歸一化的對數似然比，
[οι82] 5(^) = 7ΣloS P1-' I K,,.) - 1Og I Khm)。

丄 t=\
[0183]本發明提出一種演唱者音色相似的歌星推薦方法及其裝置，為演唱者找出與其音色相似的歌星作為參考，可以增加演唱的樂趣。應用於KTV場景中，能夠吸引大量用戶，刺激消費，並提高用戶模仿歌星音色的水平。
[0184]以上所述僅為本發明的較佳實施用例而已，並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內，所作的任何修改、等同替換以及改進等，均應包含在本發明的保護範圍之內。
【權利要求】
1.一種演唱者音色相似的歌星推薦方法，其特徵在於:包括如下步驟: 音頻庫處理:獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；歌星模型訓練:根據每個歌星所對應的特徵係數集，用聲音模型算法訓練出對應歌星模型；音色匹配:對於給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
2.如權利要求1所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
3.如權利要求1所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述歌星模型訓練步驟包括:首先將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM ;接著根據每個歌星所對應的特徵係數集，利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
4.如權利要求1所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述音色匹配步驟中，「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配，找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，將對數似然比最大值所對應的歌星作為推薦歌星。
5.如權利要求1所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述聲音特徵係數，為MFCC、LPCC、LSP、PLP中的一種。
6.如權利要求1所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述音頻庫處理步驟和音色匹配步驟中的預處理步驟均依次包括:分幀、加窗、去靜音；所述去靜音，包括如下步驟: 計算每幀的短時能量，公式為:
上式中，W表不窗函數，X為聲音信號，η = 0,1L, 2L,..., N為幀長，L為幀移長度；當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。
7.如權利要求3所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述自適應訓練出音頻庫中所有歌星的模型，採用貝葉斯自適應算法，具體包括: 對於UBM的第i個混合成員，計算分量i的後驗概率:
其中X表示特徵係數，W表示權重係數；然後計算權重、均值和方差:
接著修正舊UBM中各個高斯分布的參數Wi, Ui, 4，修正後的新權重:&Γ +(卜；修正後的新均值:& = α；"Ε,(χ)+ {\-α；")μ? ；修正後的新方差:片=a]Ej (χ') + (1 ){0； + μ)) - μ；；其中，Y為規則因子，用來保證?的和為1，<,?分別為對第i個高斯的權重、均值，方差的修正因子， < == w，w，v，式中，rp為常數，用來約束修正因子的變化尺度。
Tl ,十 V
8.如權利要求4所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述對數似然比的計算公式為:
= ^X1g p(x, I Λ--.) - log ρ(χ, I Λ,/--.)，
Ij=i 其中χ表示特徵係數，T表示幀數，λ star, λ ubm表示歌星模型與UBM模型，P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
9.一種演唱者音色相似的歌星推薦裝置，其特徵在於:包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊，音頻庫處理模塊:用於獲得所有歌星的純人聲音頻，再對純人聲音頻進行預處理，然後分別提取每個純人聲音頻的聲音特徵係數集；歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集，採用聲音模型算法訓練出對應歌星模型；音色匹配模塊:用於對給定的用戶的聲音樣本，進行預處理，並提取特徵係數集；然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配，找出音色最相似的歌星。
10.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置，其特徵在於:所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
11.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置，其特徵在於:所述歌星模型訓練模塊包括:將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型麗；接著根據每個歌星所對應的特徵係數集，利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
12.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置，其特徵在於:所述音色匹配模塊中，「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配，找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比，將對數似然比最大值所對應的歌星作為推薦歌星。
13.如權利要求9所述的一種演唱者音色相似的歌星推薦方法，其特徵在於:所述音頻庫處理模塊和音色匹配模塊中的預處理步驟均依次包括:分幀、加窗、去靜音；所述去靜音，包括如下步驟: 計算每幀的短時能量，公式為: Enνν (m ) χ (η + ηι)]2
m = O 上式中，W表不窗函數，X為聲音信號，η = 0,1L, 2L,..., N為巾貞長，L為巾貞移長度；當該幀的短時能量低於某一閾值時，就認為它是靜音幀，直接去除。
14.如權利要求11所述的一種演唱者音色相似的歌星推薦裝置，其特徵在於:所述自適應訓練出音頻庫中所有歌星的模型，採用貝葉斯自適應算法，具體包括: 對於UBM的第i個混合成員，計算分量i的後驗概率:
LmwjPAx^ 其中χ表示特徵係數，w表示權重係數；然後計算權重、均值和方差:
= YjPOlxt)，瓦O)=丄Σ廠GI.ν/KG(-—)=丄ΣP^i Ir,K2
n t=xη ?=χ 接著修正舊UBM中各個高斯分布的參數Wi, μ i，，修正後的新權重: =[a]'η；/T + (\ -a; )η)]ν ；
修正後的新均值://,.= a;'%(x) + (l-a;H)"丨；修正後的新方差:(r- =α；Ξ:(χ2) + (\-α；)(0~ +//；)-//；；其中，Y為規則因子，用來保證&的和為1，<，?分別為對第i個高斯的權重、均值，方差的修正因子， a?=式中，rP為常數，用來約束修正因子的變化尺度。
15.如權利要求12所述的一種演唱者音色相似的歌星推薦裝置，其特徵在於:所述對數似然比的計算公式為:
S(x) = ^E1Og /H vi I λΜΓ) - log p(x, I Aiihiil),
I /-! 其中χ表示特徵係數，T表示幀數，λ star, λ ubm表示歌星模型與UBM模型，P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
【文檔編號】G10L25/54GK104183245SQ201410448290
【公開日】2014年12月3日申請日期:2014年9月4日優先權日:2014年9月4日
【發明者】王子亮, 劉旺, 鄒應雙, 蔡智力申請人:福建星網視易信息系統有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種演唱者音色相似的歌星推薦方法與裝置製造方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法