新四季網

一種演唱者音色相似的歌星推薦方法與裝置製造方法

2023-05-15 10:07:56

一種演唱者音色相似的歌星推薦方法與裝置製造方法
【專利摘要】一種演唱者音色相似的歌星推薦方法,包括:獲得純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集,用聲音模型算法訓練出對應歌星模型;對於給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。本發明還提供相應的裝置。本發明可應用於KTV場景中,為用戶推薦與其音色相似的歌星,可以增加演唱的樂趣,並提高用戶模仿歌星音色的水平。
【專利說明】一種演唱者音色相似的歌星推薦方法與裝置
【【技術領域】】
[0001]本發明涉及智能語音【技術領域】,具體涉及一種演唱者音色相似的歌星推薦方法與
>J-U ρ?α裝直。
【【背景技術】】
[0002]隨著智能終端的普及,人們對生活智能化服務的要求越來越高,語音智能能化服務成為人們迫切需要。
[0003]現有唱歌評測技術中有對演唱者「唱得準不準」的評定方法,比如音準評分技術,但較少對「唱得像不像」或者「唱得像誰」作出評定。K歌系統的智能化迫切需要一種技術,能根據用戶的聲音匹配出與其音色最接近的歌手,進而向用戶推薦相應歌手的歌曲,從而增加用戶演唱的樂趣,並提高用戶模仿歌星音色的水平。

【發明內容】

[0004]本發明所要解決的技術問題之一在於提供一種演唱者音色相似的歌星推薦方法,實現為演唱者找出與其音色相似的歌星的功能。
[0005]本發明是採用以下技術方案解決上述技術問題之一的:
[0006]一種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0007]音頻庫處理:獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集;
[0008]歌星模型訓練:根據每個歌星所對應的特徵係數集,用聲音模型算法訓練出對應歌星模型;
[0009]音色匹配:對於給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0010]進一步,所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
[0011]進一步,所述歌星模型訓練步驟包括:首先將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM;接著根據每個歌星所對應的特徵係數集,利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
[0012]進一步,所述音色匹配步驟中,「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配,找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,將對數似然比最大值所對應的歌星作為推薦歌星。
[0013]進一步,所述聲音特徵係數,為MFCC、LPCC、LSP、PLP中的一種。
[0014]進一步,所述音頻庫處理步驟和音色匹配步驟中的預處理步驟均依次包括:分幀、加窗、去靜音;
[0015]所述去靜音,包括如下步驟:
[0016]計算每幀的短時能量,公式為:
N-1
[0017]En = ^ [ W'(m )χ(η + m)]2

m — O
[0018]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0019]當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。
[0020]進一步,所述自適應訓練出音頻庫中所有歌星的模型,採用貝葉斯自適應算法,具體包括:
[0021 ] 對於UBM的第i個混合成員,計算分量i的後驗概率:
[0022]廣 W" — —^~

Lj-1wJ PAx^
[0023]其中χ表示特徵係數,w表示權重係數;
[0024]然後計算權重、均值和方差:
TI TI Γ
[0025]ni=Y^p{i\xt), Ej(X) = -J^P(IlXl)XteM1)
,μ? ?=ιη ?=ι
[0026]接著修正舊UBM中各個高斯分布的參數Wi, μ i,W,
[0027]修正後的新權重:u'.,.=[<?,./廠+.(1-<)H:.];,;
[0028]修正後的新均值:μ.= ?;η£.(λ-) + (1 - α';')μ,;
[0029]修正後的新方差:^= α w ^ ) + (丨—< )(< +μ:)_^:
[0030]其中,Y為規則因子,用來保證&的和為I, a.',a';',a.'分別為對第i個高斯的權重、均值,方差的修正因子,

η.
[0031]<式中,rP為常數,用來約束修正因子的變化尺度。

/2.十 /

?
[0032]進一步,所述計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,公式為:
[0033]S(X) = ^Xlog ρ{χ, I Λ--.) — 1Og p{x, I ),

i
[0034]其中χ表示特徵係數,T表示幀數,λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
[0035]本發明還提供一種演唱者音色相似的歌星推薦裝置,其包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊,
[0036]音頻庫處理模塊:用於獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集;
[0037]歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集,採用聲音模型算法訓練出對應歌星模型;
[0038]音色匹配模塊:用於對給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0039]進一步,所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
[0040]進一步,所述歌星模型訓練模塊包括:將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM ;
[0041]接著根據每個歌星所對應的特徵係數集,利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
[0042]進一步,所述音色匹配模塊中,「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配,找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,將對數似然比最大值所對應的歌星作為推薦歌星。
[0043]進一步,所述聲音特徵係數,為MFCC、LPCC、LSP、PLP中的一種。
[0044]進一步,所述音頻庫處理模塊和音色匹配模塊中的預處理步驟均依次包括:分幀、加窗、去靜音;
[0045]所述去靜音,包括如下步驟:
[0046]計算每幀的短時能量,公式為:
N-1
[0047]五?= Σ [w(m )x(n + m)}2

m = 0
[0048]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0049]當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。
[0050]進一步,所述自適應訓練出音頻庫中所有歌星的模型,採用貝葉斯自適應算法,具體包括:
[0051 ] 對於UBM的第i個混合成員,計算分量i的後驗概率:

wIPiix,)
[0052]Ρ、1 \χ?)- -Γ~
[0053]其中χ表示特徵係數,w表示權重係數;
[0054]然後計算權重、均值和方差:
[0055]Hi = [ /;(/' I X,) , E1 ⑴=士Σ 1-V K Ει (χ2)=丄 Σ P^i I Λ )
卜In /-1n t=x
[0056]接著修正舊UBM中各個高斯分布的參數Wi, μ i,σ,;,
[0057]修正後的新權重:& =[α廣/v/7>(卜、.];/ ;
[0058]修正後的新均值:Iii= cr;B£f(x) + (l-0//.;
[0059]修正後的新方差:(」=Q,; £■ ( γ-) + (I — α'.)(^- + jut) — μ);
[0060]其中,Υ為規則因子,用來保證&的和為1,分別為對第i個高斯的權重、均值,方差的修正因子,
[0061]af,式中,rP為常數,用來約束修正因子的變化尺度。
[0062]進一步,所述計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,公式為:
[0063]Si= ^Xlog Pixi I Λ,?,.) - *Og [Αχ, I Kn,,),

I /-1
[0064]其中χ表示特徵係數,T表示幀數,λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
[0065]本發明的優點在於:本發明提出一種演唱者音色相似的歌星推薦方法及裝置,為演唱者找出與其音色相似的歌星作為參考,增加演唱的樂趣。應用於KTV場景中,能夠吸引大量用戶,刺激消費,並提高用戶模仿歌星音色的水平。
【【專利附圖】

【附圖說明】】
[0066]下面參照附圖結合實施例對本發明作進一步的描述。
[0067]圖1是本發明的方法音頻庫處理與歌星模型訓練過程的流程圖。
[0068]圖2是本發明的方法中單個歌星模型訓練流程圖。
[0069]圖3是本發明的方法音色匹配過程流程圖。
[0070]圖4是本發明的方法中音色匹配過程中計算似然比流程圖。
[0071]圖5是本發明的裝置結構示意圖。
【【具體實施方式】】
[0072]第一實施例:
[0073]一種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0074]音頻庫處理:獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集;
[0075]歌星模型訓練:根據每個歌星所對應的特徵係數集,用聲音模型算法訓練出對應歌星模型;
[0076]音色匹配:對於給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0077]下面對該實施例進行詳細描述。
[0078]—種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0079]S1:音頻庫處理過程(如圖1所示):
[0080]Sll:準備音頻庫,收集一定數量的歌星的若干歌曲,比如300個歌星,每個歌星5首歌曲所對應的立體聲音頻;
[0081]S12:對音頻庫中的所有歌曲去除伴奏得到純人聲頻,其方法可參考專利名稱為《一種立體聲音頻的處理方法與裝置》,專利申請號為:201410263446.3的中國發明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性,對伴奏進行抑制濾波,從而提取人聲。對歌曲去伴奏的目的是減少歌曲中的伴奏成分對於歌星音色模型訓練的影響。
[0082]對音頻庫中的所有歌曲去除伴奏得到純人聲音頻,具體包括:
[0083]將立體聲音頻的左右聲道信號變換到頻域;
[0084]計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,對幅度比值在預設範圍內的頻點列為待衰減的頻點,且計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內的頻點也列為待衰減的頻點;所述幅度比值的計算公式為:
[0085]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0086]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅立葉變換的點數,相位差的計算公式為:
[0087]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0088]n = 0,1,2,…,N_1 ;i = 0,1,2,...,FN/2 ;
[0089]接著,篩選出待衰減的頻點,也就是將幅度比值落在一定範圍的頻點,其中頻點i符合
[0090]kn(i)〈a 或匕⑴〉^,0〈α〈0.5,0.5〈β〈1,a 取 0.4,β 取 0.6,
[0091]或將相位差值落在一定範圍的頻點,其中i符合
[0092]pn (i) Ψ,<Φ < O, O < φ < π,這裡 φ 取-0.1,滬取 0.1,列為待衰減的頻點;
[0093]對待衰減的頻點,即伴奏成分進行衰減處理,公式為:
[0094]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中,i 為待衰減的頻點;
[0095]將衰減後的頻域信號逆變換為時域,即可得到去除伴奏後的歌曲音頻。
[0096]在其他實施方式中,也可以通過其他方法得到純人聲音頻,並不局限於上述算法。
[0097]在其他實施方式中,如果步驟Sll中已搜集到所有歌星的純人聲音頻,則略過步驟 S12。
[0098]S13:對去除伴奏後的歌曲進行預處理,包括:分幀、加窗、去靜音;
[0099]分幀,是指將音頻信號分成若干幀,每幀包括預設數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點;
[0100]加窗,採用加漢寧窗濾波處理,還可以是其他的加窗方式。
[0101]去靜音,包括:
[0102]計算每幀的短時能量,公式為:
N-1
[0103]En = ^l u,(m )λ.(n + m)]2

m — Q
[0104]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0105]當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。靜音並不包含有效的聲音特徵,因此需要去除。
[0106]S14:對預處理後的音頻提取聲音特徵係數。所述聲音特徵係數可以是MFCC、LPCC, LSP、PLP中的一種;MFCC是指Mel頻率倒譜係數,LPCC是指線性預測倒譜係數,LSP是指線譜對係數,PLP是指感知線性預測係數,這些係數都能很好地表徵聲音的音色特徵,可任選一種。本發明優選提取MFCC或LPCC聲音特徵係數。
[0107]S2:歌星模型訓練過程,如圖1?圖2所示。
[0108]將提取的聲音特徵係數集中在一起訓練出通用背景模型UBM,並根據每個歌星所對應的聲音特徵係數集,利用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。UBM模型其實是一個高混合度的高斯模型,其訓練過程與GMM類似,採用EM迭代算法,這裡不詳述。
[0109]自適應訓練出歌星的模型過程,如圖2所示,採用貝葉斯自適應算法,具體如下:
[0110]對於UBM的第i個混合成員,計算分量i的後驗概率:
[0111]Am 財
LmwJpAx^
[0112]其中χ表示特徵係數,w表示權重係數;
[0113]然後計算權重、均值和方差:
[0114]", = Σ /,(/1 -V,) ,Ej (.V)=丄 Z P(i 1-V, )λ:Ei (.ν?)=丄 Σ /,(/.丨 λ., ).v;
?=ιn t=1η t=x
[0115]接著修正舊UBM中各個高斯分布的參數Wi,Ui,「
[0116]修正後的新權重:IT+{\-17;)u.;.Jy ;
[0117]修正後的新均值:Κμ;= α';--(χ) + {\-α'!')μ? ;
[0118]修正後的新方差:h= a:Ei(x2) + (l-a; + //:)-μ:;
[0119]其中,Y為規則因子,用來保證&的和為I,分別為對第i個高斯的權重、均值,方差的修正因子,
[0120]< = 二.P= U.,/?,V,式中,rP為常數,用來約束修正因子的變化尺度,一

Ui +
般選16。
[0121]本步驟可訓練出一個通用UBM模型以及所有歌星的音色模型。
[0122]S3:音色匹配過程(如圖3?4所示):
[0123]S31:用戶聲音樣本處理:對於給定的用戶,即演唱者的聲音樣本,同樣進行預處理,並提取聲音特徵係數;
[0124]S32:接著計算提取的聲音特徵係數與歌星模型以及與通用模型UBM的對數似然比(如圖4所示),將對數似然比最大值所對應的歌星作為推薦歌星。
[0125]對數似然比的計算公式為:

Γ
[0126]S(X) = J] log p(x, I ) - log p(x, I Anlm ),
[0127]其中χ表示特徵係數,λ stm,Aubm表示歌星模型與UBM模型,p表示歌星模型或UBM模型輸出特徵矢量序列的似然度;
[0128]此處採用時間歸一化的對數似然比,

I τ
[0129]SiX) = ~Y^ log p(x, I 人?".) - log p(x, I Aihn)。

Z 1-1
[0130]本步驟可找出與用戶音色接近的歌星作為推薦,從而增加用戶演唱的樂趣。
[0131]在其他實施方式中,也可以使用GMM、HMM等聲音模型作為歌星模型訓練以及音色匹配的方法。
[0132]第二實施例:
[0133]一種演唱者音色相似的歌星推薦裝置,其包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊,
[0134]音頻庫處理模塊:用於獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集;
[0135]歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集,採用聲音模型算法訓練出對應歌星模型;
[0136]音色匹配模塊:用於對給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0137]下面具體描述該實施例。
[0138]一種演唱者音色相似的歌星推薦裝置,如圖5所示,包括:
[0139]音頻庫處理模塊,用於對音頻庫中的所有歌曲去除伴奏得到純人聲音頻,再對純人聲音頻進行預處理,然後對預處理後的音頻提取聲音特徵係數;
[0140]歌星模型訓練模塊,用於將提取的聲音特徵係數集中在一起訓練出通用背景模型UBM,並根據每個歌星所對應的聲音特徵係數集,利用背景模型UBM自適應訓練出音頻庫中所有歌星的模型;
[0141]音色匹配模塊,用於對給定用戶的聲音樣本進行預處理並提取聲音特徵係數;然後計算提取的聲音特徵係數與歌星模型以及與通用模型UBM的對數似然比,將對數似然比最大值所對應的歌星作為推薦歌星。
[0142]對音頻庫中的所有歌曲去除伴奏得到純人聲音頻的方法,參考專利名稱為《一種立體聲音頻的處理方法與裝置》,專利申請號為:201410263446.3的中國發明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性,對伴奏進行抑制濾波,從而提取人聲。
[0143]具體包括:
[0144]將立體聲音頻的左右聲道信號變換到頻域;
[0145]計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,對幅度比值在預設範圍內的頻點列為待衰減的頻點,且計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內的頻點也列為待衰減的頻點;所述幅度比值的計算公式為:
[0146]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0147]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅立葉變換的點數,相位差的計算公式為:
[0148]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0149]n = 0,1,2,…,N_1 ;i = 0,1,2,...,FN/2 ;
[0150]接著,篩選出待衰減的頻點,也就是將幅度比值落在一定範圍的頻點,其中頻點i符合
[0151]kn(i)〈a 或匕⑴〉^,0〈α〈0.5,0.5〈β〈1,a 取 0.4,β 取 0.6,
[0152]或將相位差值落在一定範圍的頻點,其中i符合
[0153]ρηα)〈Φ ^ρΛ?)>φ^^<Φ<0,0<φ<π,這裡 φ 取 _0.L 妒取 0.1,列為待衰減的頻點;
[0154]對待衰減的頻點,即伴奏成分進行衰減處理,公式為:
[0155]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中,i 為待衰減的頻點;
[0156]將衰減後的頻域信號逆變換為時域,即可得到去除伴奏後的歌曲音頻。
[0157]所述聲音特徵係數,為MFCC、LPCC、LSP、PLP中的一種。
[0158]所述音頻庫處理模塊和音色匹配模塊中的預處理,包括:分幀、加窗、去靜音;
[0159]所述分幀,是指將音頻信號分成若干幀,每幀包括預設數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點;
[0160]所述加窗,是指加漢寧窗濾波處理。
[0161]所述預處理步驟中的去靜音操作,包括:
[0162]計算每幀的短時能量,公式為:

N -1
[0163]五? 二 I [ W (m ) χ (n + m )]2

m = 0
[0164]上式中,w表不窗函數,χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0165]當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。
[0166]所述歌星模型訓練模塊中的自適應訓練出歌星的模型過程,採用貝葉斯自適應算法,具體包括:
[0167]對於UBM的第i個混合成員,計算分量i的後驗概率:
Ρ(? I M _ wiPi(x,)
[0168]AM λ,.)—

LmwJ P λχ>)
[0169]其中X表示特徵係數,w表示權重係數;
[0170]然後計算權重、均值和方差:
[0171]", = Σ I) ,eI ⑴=丄 Σ I χ丨 K.Ei (χ2)=丄 Σ 1-ν,
t-\n ?-1n.
[0172]接著修正舊UBM中各個高斯分布的參數Wi, Ui, ^
[0173]修正後的新權重:w,= |_0./ Γ + (丨-f jy
[0174]修正後的新均值:1、=⑴+ (卜0.;
[0175]修正後的新方差:=a'; Ej(χ2) + (1- a,' )(d'f + μ]) - μ];
[0176]其中,Υ為規則因子,用來保證&的和為1,,<分別為對第i個高斯的權重、均值,方差的修正因子,
PHi
[0177]< =^r7W = u』./".V,式中,rp為常數,用來約束修正因子的變化尺度。

11j 十 /
[0178]所述音色匹配模塊中的對數似然比的計算公式為:
[0179]S(X) = Yj log p(x, I /I,,,,,.) - log p(x, i Anhm),

/-1
[0180]其中χ表示特徵係數,λ stm,λ-表示歌星模型與UBM模型,p表示歌星模型或UBM模型輸出特徵矢量序列的似然度;
[0181]此處採用時間歸一化的對數似然比,
[οι82] 5(^) = 7ΣloS P1-' I K,,.) - 1Og I Khm)。

丄 t=\
[0183]本發明提出一種演唱者音色相似的歌星推薦方法及其裝置,為演唱者找出與其音色相似的歌星作為參考,可以增加演唱的樂趣。應用於KTV場景中,能夠吸引大量用戶,刺激消費,並提高用戶模仿歌星音色的水平。
[0184]以上所述僅為本發明的較佳實施用例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內,所作的任何修改、等同替換以及改進等,均應包含在本發明的保護範圍之內。
【權利要求】
1.一種演唱者音色相似的歌星推薦方法,其特徵在於:包括如下步驟: 音頻庫處理:獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集; 歌星模型訓練:根據每個歌星所對應的特徵係數集,用聲音模型算法訓練出對應歌星模型; 音色匹配:對於給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
2.如權利要求1所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
3.如權利要求1所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述歌星模型訓練步驟包括:首先將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型UBM ;接著根據每個歌星所對應的特徵係數集,利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
4.如權利要求1所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述音色匹配步驟中,「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配,找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,將對數似然比最大值所對應的歌星作為推薦歌星。
5.如權利要求1所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述聲音特徵係數,為MFCC、LPCC、LSP、PLP中的一種。
6.如權利要求1所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述音頻庫處理步驟和音色匹配步驟中的預處理步驟均依次包括:分幀、加窗、去靜音; 所述去靜音,包括如下步驟: 計算每幀的短時能量,公式為:
上式中,W表不窗函數,X為聲音信號,η = 0,1L, 2L,..., N為幀長,L為幀移長度; 當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。
7.如權利要求3所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述自適應訓練出音頻庫中所有歌星的模型,採用貝葉斯自適應算法,具體包括: 對於UBM的第i個混合成員,計算分量i的後驗概率:
其中X表示特徵係數,W表示權重係數; 然後計算權重、均值和方差:
接著修正舊UBM中各個高斯分布的參數Wi, Ui, 4, 修正後的新權重:&Γ +(卜; 修正後的新均值:& = α;"Ε,(χ)+ {\-α;")μ? ; 修正後的新方差:片=a]Ej (χ') + (1 ){0; + μ)) - μ;; 其中,Y為規則因子,用來保證?的和為1,<,?分別為對第i個高斯的權重、均值,方差的修正因子, < == w,w,v,式中,rp為常數,用來約束修正因子的變化尺度。
Tl ,十 V
8.如權利要求4所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述對數似然比的計算公式為:
= ^X1g p(x, I Λ--.) - log ρ(χ, I Λ,/--.),
Ij=i 其中χ表示特徵係數,T表示幀數,λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
9.一種演唱者音色相似的歌星推薦裝置,其特徵在於:包括:音頻庫處理模塊、歌星模型訓練模塊和音色匹配模塊, 音頻庫處理模塊:用於獲得所有歌星的純人聲音頻,再對純人聲音頻進行預處理,然後分別提取每個純人聲音頻的聲音特徵係數集; 歌星模型訓練模塊:用於根據每個歌星所對應的特徵係數集,採用聲音模型算法訓練出對應歌星模型; 音色匹配模塊:用於對給定的用戶的聲音樣本,進行預處理,並提取特徵係數集;然後將用戶聲音樣本的特徵係數集與所有歌星模型進行匹配,找出音色最相似的歌星。
10.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特徵在於:所述歌星的純人聲音頻獲得方式包括:通過歌曲去伴奏方式獲得。
11.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特徵在於:所述歌星模型訓練模塊包括:將音頻庫中提取的所有聲音特徵係數集集中在一起訓練出通用背景模型麗; 接著根據每個歌星所對應的特徵係數集,利用通用背景模型UBM自適應訓練出音頻庫中所有歌星的模型。
12.如權利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特徵在於:所述音色匹配模塊中,「將用戶聲音樣本的特徵係數與所有歌星模型進行匹配,找出音色最相似的歌星」的操作包括:計算用戶聲音樣本的特徵係數集與歌星模型以及與通用模型UBM的對數似然比,將對數似然比最大值所對應的歌星作為推薦歌星。
13.如權利要求9所述的一種演唱者音色相似的歌星推薦方法,其特徵在於:所述音頻庫處理模塊和音色匹配模塊中的預處理步驟均依次包括:分幀、加窗、去靜音; 所述去靜音,包括如下步驟: 計算每幀的短時能量,公式為: Enνν (m ) χ (η + ηι)]2
m = O 上式中,W表不窗函數,X為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度; 當該幀的短時能量低於某一閾值時,就認為它是靜音幀,直接去除。
14.如權利要求11所述的一種演唱者音色相似的歌星推薦裝置,其特徵在於:所述自適應訓練出音頻庫中所有歌星的模型,採用貝葉斯自適應算法,具體包括: 對於UBM的第i個混合成員,計算分量i的後驗概率:
LmwjPAx^ 其中χ表示特徵係數,w表示權重係數; 然後計算權重、均值和方差:
= YjPOlxt),瓦O)=丄Σ廠GI.ν/KG(-—)=丄ΣP^i Ir,K2
n t=xη ?=χ 接著修正舊UBM中各個高斯分布的參數Wi, μ i,, 修正後的新權重: =[a]'η;/T + (\ -a; )η)]ν ;
修正後的新均值://,.= a;'%(x) + (l-a;H)"丨; 修正後的新方差:(r- =α;Ξ:(χ2) + (\-α;)(0~ +//;)-//;; 其中,Y為規則因子,用來保證&的和為1,<,?分別為對第i個高斯的權重、均值,方差的修正因子, a?=式中,rP為常數,用來約束修正因子的變化尺度。
15.如權利要求12所述的一種演唱者音色相似的歌星推薦裝置,其特徵在於:所述對數似然比的計算公式為:
S(x) = ^E1Og /H vi I λΜΓ) - log p(x, I Aiihiil),
I /-! 其中χ表示特徵係數,T表示幀數,λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特徵矢量序列的似然度。
【文檔編號】G10L25/54GK104183245SQ201410448290
【公開日】2014年12月3日 申請日期:2014年9月4日 優先權日:2014年9月4日
【發明者】王子亮, 劉旺, 鄒應雙, 蔡智力 申請人:福建星網視易信息系統有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀