新四季網

一種基於內容計算的音頻標籤傳播方法

2023-09-27 07:41:25 1

專利名稱:一種基於內容計算的音頻標籤傳播方法
技術領域:
本發明為利用分析音頻內容得到的音頻相似性來自動為音樂數據集中未標註音樂標籤進行標註。
背景技術:
隨著網際網路上數位音樂的爆炸式增長,音樂標籤的重要性越來越突出。音樂標籤一般是對音樂語義進行描述的短文本,其在音樂的檢索、管理與推薦中非常有用。然而,當前面臨的問題是如何高效地獲取準確的音樂標註。現階段能獲取音樂標註的方法可以歸納為1、專家標註;2、分類模型訓練;3、社會化標註。但是這些方法都有其優劣專家標註能獲得準確的標籤,但其標註成本巨大且所獲得的語義信息不夠豐富;分類模型的訓練雖然是自動化方法,但現階段其標註準確率使其還不能進行推廣;而社會化標註能夠獲得較為準確且豐富的標註,並且成本低廉,但其存在大量噪音和長尾效應。如何能在標註成本、效率、準確性與豐富程度,減少長尾效應上尋求平衡,幫助用戶自動獲取到音樂的標註具有重要意義。

發明內容
本發明要解決的問題通過對音樂內容分析相似計算,進行現有標籤的傳播,在較好的標註準確性基礎上自動獲取未標註音樂的標籤,減輕了人工標註的工作。本發明採用的技術方案一種基於內容計算的音頻標籤傳播方法描述如下(1)基於密度的標籤傳播基於內容相似計算出音頻的相似矩陣,構建音樂網絡, 掃描所有未標註音樂,當距離某個未標註音樂α的相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給a。該獨立過程被稱作基於密度的標籤傳播模型。(2)基於概率的標籤傳播對於全體音樂集中的已標註音樂部分集,計算出n*p@n 率,其中p@n即percision at n,為某已標註音樂的η個最近鄰居音樂與其具備相同標籤的平均準確率,η e N,N為自然數,n*p@n表示某音樂的鄰近音樂中與其具有相同標籤的音樂個數期望,並將其近似為全體集的n*p@n,根據所述期望,計算出某個已標註音樂周圍的相似音樂與其具有相同標籤概率,據此傳播標籤;此獨立的過程被稱作基於概率的標籤傳播模型;(3)基於上述步驟(1)和(2)分別進行標籤傳播後,求出傳播結果的交集,並將其作為已標註音樂,利用上述步驟(1)或(2)重新進行一次傳播。所述的步驟( 進一步包括(3a)參數L的取值為,在所有音樂中最近的第m個鄰居距離與最遠的第m個鄰居距離之間min{dim|i e任意未標註音樂} < L < max{dim| i e任意未標註音樂},其中,^代表某未標註音樂i與第m個鄰居的距離。經過實驗,利用兩種模型的混合的傳播方式,在對未標註音樂有相同召回率情況下,比使用任何一種單獨的模型有更高的準確率,基於概率的傳播準確率比基於密度的傳播準確率略差。


圖1為基於標籤密度的傳播模型示意圖;圖2為密度傳播模型中距離閾值N取值對準確率影響曲線;圖3為基於標籤密度與標籤概率模型傳播空間對比;圖4為本發明的總體流程圖;圖5為基於標籤概率傳播模型流程圖;圖6為基於標籤密度傳播模型流程具體實施例方式本發明的具體實施方式
如下(1)輸入數據為一個音頻數據集,其中某些音樂帶有外部標籤,稱其為「已標註音樂」,餘下的為「未標註音樂」。提取出所有音頻的20個MFCC特徵,並利用單高斯方法對每個音頻進行建模。再利用(Kullkick-Leibler Divergence)即KL距離計算出兩兩音頻之間的相似程度。所有音頻的相似程度形成了一個相似矩陣,單元格[i,j]表示音樂i與音樂j之間的相似性。(2)基於密度的傳播模型根據相似矩陣,所有音樂形成了一個關聯的網絡,越相似越接近,如附圖1。接著,掃描所有的未標註音樂,當距離某個未標註音樂α相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給α。也就是α被標註上了標籤τ,該次傳播的標籤稱為「被傳播標籤」。在
該過程中,被傳播標籤不能參與再次傳播。
權利要求
1.一種基於內容計算的音頻標籤傳播方法,其特徵在於步驟如下(1)基於密度的標籤傳播基於內容相似計算出音頻的相似矩陣,構建音樂網絡,掃描所有未標註音樂,當距離某個未標註音樂α的相似距離不超過L,且最多m個最鄰近音樂上標註率達到P1時,如果某個標籤τ的出現率達到P3,則將標籤τ傳播給α ;(2)基於概率的標籤傳播對於全體音樂集中的已標註音樂部分集,計算出η*ρ@η率, 其中ρ@η即percision at n,為某已標註音樂的η個最近鄰居音樂與其具備相同標籤的平均準確率,η e N,N為自然數,n*p@n表示某音樂的鄰近音樂中與其具有相同標籤的音樂個數期望,並將其近似為全體集的n*p@n,根據所述期望,計算出某個已標註音樂周圍的相似音樂與其具有相同標籤概率,據此傳播標籤;(3)基於上述步驟(1)和(2)分別進行標籤傳播後,求出傳播結果的交集,並將其作為已標註音樂,利用上述步驟(1)或( 重新進行一次傳播。
2.根據權利要求1所述的基於內容計算的音頻標籤傳播方法,其特徵在於所述的步驟( 進一步包括(3a)參數L的取值為,在所有音樂中最近的第m個鄰居距離與最遠的第m個鄰居距離之間,即min{dim|i e任意未標註音樂} <L<maX{dim|i e任意未標註音樂},其中,dim代表某未標註音樂i與第m個鄰居的距離。
3.根據權利要求1所述的基於內容計算的音頻標籤傳播方法,其特徵在於所述步驟 ⑵還包括Oa)對於每個已標註標籤τ的音樂,可以預測與其最近的m個鄰近音樂的概率,當某鄰近音樂預測的概率高於P1時,將該鄰近音樂標註上標籤τ,當所有已標註音樂均被掃描後,基於概率的標籤傳播過程結束。
全文摘要
一種基於內容計算的音頻標籤傳播方法,基於內容分析計算音頻數據間相似距離;根據相似距離,利用p@n率為每一個已標註音樂的最近鄰為標註音樂計算其與該標註音樂具備相同曲風標籤τ的概率。另外,如果有一為標註音樂α滿足距離L內,最多n個最近鄰居中已標註音樂出現率高於P2,且某標籤出現率高於P3,則將該標籤傳播給α。對於同一個P2值,進行多次迭代直到收斂。求出上述兩種中被傳播標籤的交集,並以此交集補充進原始數據中重新進行上述過程,收斂後獲得最終標籤傳播結果。本發明合併不同標籤傳播模型,在沒有引入其他信息的情況下準確率比單個模型更高。
文檔編號G06F17/30GK102262659SQ201110197940
公開日2011年11月30日 申請日期2011年7月15日 優先權日2011年7月15日
發明者李未, 蔡晶, 郎波 申請人:北京航空航天大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀