一種基於內容計算的音頻標籤傳播方法
2023-09-27 07:41:25 1
專利名稱:一種基於內容計算的音頻標籤傳播方法
技術領域:
本發明為利用分析音頻內容得到的音頻相似性來自動為音樂數據集中未標註音樂標籤進行標註。
背景技術:
隨著網際網路上數位音樂的爆炸式增長,音樂標籤的重要性越來越突出。音樂標籤一般是對音樂語義進行描述的短文本,其在音樂的檢索、管理與推薦中非常有用。然而,當前面臨的問題是如何高效地獲取準確的音樂標註。現階段能獲取音樂標註的方法可以歸納為1、專家標註;2、分類模型訓練;3、社會化標註。但是這些方法都有其優劣專家標註能獲得準確的標籤,但其標註成本巨大且所獲得的語義信息不夠豐富;分類模型的訓練雖然是自動化方法,但現階段其標註準確率使其還不能進行推廣;而社會化標註能夠獲得較為準確且豐富的標註,並且成本低廉,但其存在大量噪音和長尾效應。如何能在標註成本、效率、準確性與豐富程度,減少長尾效應上尋求平衡,幫助用戶自動獲取到音樂的標註具有重要意義。
發明內容
本發明要解決的問題通過對音樂內容分析相似計算,進行現有標籤的傳播,在較好的標註準確性基礎上自動獲取未標註音樂的標籤,減輕了人工標註的工作。本發明採用的技術方案一種基於內容計算的音頻標籤傳播方法描述如下(1)基於密度的標籤傳播基於內容相似計算出音頻的相似矩陣,構建音樂網絡, 掃描所有未標註音樂,當距離某個未標註音樂α的相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給a。該獨立過程被稱作基於密度的標籤傳播模型。(2)基於概率的標籤傳播對於全體音樂集中的已標註音樂部分集,計算出n*p@n 率,其中p@n即percision at n,為某已標註音樂的η個最近鄰居音樂與其具備相同標籤的平均準確率,η e N,N為自然數,n*p@n表示某音樂的鄰近音樂中與其具有相同標籤的音樂個數期望,並將其近似為全體集的n*p@n,根據所述期望,計算出某個已標註音樂周圍的相似音樂與其具有相同標籤概率,據此傳播標籤;此獨立的過程被稱作基於概率的標籤傳播模型;(3)基於上述步驟(1)和(2)分別進行標籤傳播後,求出傳播結果的交集,並將其作為已標註音樂,利用上述步驟(1)或(2)重新進行一次傳播。所述的步驟( 進一步包括(3a)參數L的取值為,在所有音樂中最近的第m個鄰居距離與最遠的第m個鄰居距離之間min{dim|i e任意未標註音樂} < L < max{dim| i e任意未標註音樂},其中,^代表某未標註音樂i與第m個鄰居的距離。經過實驗,利用兩種模型的混合的傳播方式,在對未標註音樂有相同召回率情況下,比使用任何一種單獨的模型有更高的準確率,基於概率的傳播準確率比基於密度的傳播準確率略差。
圖1為基於標籤密度的傳播模型示意圖;圖2為密度傳播模型中距離閾值N取值對準確率影響曲線;圖3為基於標籤密度與標籤概率模型傳播空間對比;圖4為本發明的總體流程圖;圖5為基於標籤概率傳播模型流程圖;圖6為基於標籤密度傳播模型流程具體實施例方式本發明的具體實施方式
如下(1)輸入數據為一個音頻數據集,其中某些音樂帶有外部標籤,稱其為「已標註音樂」,餘下的為「未標註音樂」。提取出所有音頻的20個MFCC特徵,並利用單高斯方法對每個音頻進行建模。再利用(Kullkick-Leibler Divergence)即KL距離計算出兩兩音頻之間的相似程度。所有音頻的相似程度形成了一個相似矩陣,單元格[i,j]表示音樂i與音樂j之間的相似性。(2)基於密度的傳播模型根據相似矩陣,所有音樂形成了一個關聯的網絡,越相似越接近,如附圖1。接著,掃描所有的未標註音樂,當距離某個未標註音樂α相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給α。也就是α被標註上了標籤τ,該次傳播的標籤稱為「被傳播標籤」。在
該過程中,被傳播標籤不能參與再次傳播。
權利要求
1.一種基於內容計算的音頻標籤傳播方法,其特徵在於步驟如下(1)基於密度的標籤傳播基於內容相似計算出音頻的相似矩陣,構建音樂網絡,掃描所有未標註音樂,當距離某個未標註音樂α的相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給α ;(2)基於概率的標籤傳播對於全體音樂集中的已標註音樂部分集,計算出η*ρ@η率, 其中ρ@η即percision at n,為某已標註音樂的η個最近鄰居音樂與其具備相同標籤的平均準確率,η e N,N為自然數,n*p@n表示某音樂的鄰近音樂中與其具有相同標籤的音樂個數期望,並將其近似為全體集的n*p@n,根據所述期望,計算出某個已標註音樂周圍的相似音樂與其具有相同標籤概率,據此傳播標籤;(3)基於上述步驟(1)和(2)分別進行標籤傳播後,求出傳播結果的交集,並將其作為已標註音樂,利用上述步驟(1)或( 重新進行一次傳播。
2.根據權利要求1所述的基於內容計算的音頻標籤傳播方法,其特徵在於所述的步驟( 進一步包括(3a)參數L的取值為,在所有音樂中最近的第m個鄰居距離與最遠的第m個鄰居距離之間,即min{dim|i e任意未標註音樂} <L<maX{dim|i e任意未標註音樂},其中,dim代表某未標註音樂i與第m個鄰居的距離。
3.根據權利要求1所述的基於內容計算的音頻標籤傳播方法,其特徵在於所述步驟 ⑵還包括Oa)對於每個已標註標籤τ的音樂,可以預測與其最近的m個鄰近音樂的概率,當某鄰近音樂預測的概率高於P1時,將該鄰近音樂標註上標籤τ,當所有已標註音樂均被掃描後,基於概率的標籤傳播過程結束。
全文摘要
一種基於內容計算的音頻標籤傳播方法,基於內容分析計算音頻數據間相似距離;根據相似距離,利用p@n率為每一個已標註音樂的最近鄰為標註音樂計算其與該標註音樂具備相同曲風標籤τ的概率。另外,如果有一為標註音樂α滿足距離L內,最多n個最近鄰居中已標註音樂出現率高於P2,且某標籤出現率高於P3,則將該標籤傳播給α。對於同一個P2值,進行多次迭代直到收斂。求出上述兩種中被傳播標籤的交集,並以此交集補充進原始數據中重新進行上述過程,收斂後獲得最終標籤傳播結果。本發明合併不同標籤傳播模型,在沒有引入其他信息的情況下準確率比單個模型更高。
文檔編號G06F17/30GK102262659SQ201110197940
公開日2011年11月30日 申請日期2011年7月15日 優先權日2011年7月15日
發明者李未, 蔡晶, 郎波 申請人:北京航空航天大學