一種音樂分類方法及裝置與流程
2023-05-28 16:27:21 2

本發明涉及數據處理技術領域,具體涉及一種音樂分類方法及裝置。
背景技術:
音樂分類是基於音樂的聲學特徵採用經機器學習得到的分類器對沒有標記的音樂進行分類與標記。提取待分類音樂的音色特徵和節奏特徵等聲學特徵,完成對音樂的情感分類和流派分類。
現有的音樂分類方法中情感和流派的分類都是分開處理。在針對情感分類的音樂分類方法中,一種方法是訓練數據集中不含有流派信息(或即使有流派信息也不考慮),訓練情感分類模型,通過訓練後的情感分類模型進行情感分類;另一種方法是訓練數據集中包含流派信息,針對每一個流派訓練情感分類模型,用於分類流派明確的音樂,但如果待分類音樂流派不明,就無法通過這種方法完成音樂分類。
現有的技術方案對音樂流派與情感建立的分類模型過於簡單,沒有考慮流派與情感類別的相互關係,造成音樂分類結果準確性差。
技術實現要素:
本發明實施例提供一種音樂分類方法,用於解決現有的音樂分類方法中分類結果準確性差的問題。
本發明實施例提供了一種音樂分類方法,包括:
根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;
選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;
根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,將所述第一預估情感預測結果填入流派情感預測表,並根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,並將所述第二預估流派預測結果填入所述流派情感預測表;
根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。
可選地,所述根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,包括:
根據所述通用流派分類器獲取待分類音樂的隸屬流派的第一排序結果;
根據所述第一排序結果獲取待分類音樂的第一預估流派預測結果;
其中,將所述第一排序結果轉換為所述第一預估流派預測結果的公式為:
pg(i)=(1-αg)i-1αg
其中,pg(i)為所述待分類音樂隸屬於排序為i的流派的估計概率,αg為所述通用流派分類器採用測試集得到的流派分類準確率。
可選地,所述根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,包括:
根據所述各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的隸屬情感的第二排序結果;
根據所述第二排序結果獲取所述待分類音樂的第一預估情感預測結果;
其中,將所述第二排序結果轉換為所述第一預估情感預測結果的公式為:
其中,pe(j)為所述待分類音樂隸屬於排序為j的情感的估計概率,為流派i情感分類器採用測試集得到的情感分類準確率。
可選地,所述根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,包括:
根據所述通用情感分類器獲取所述待分類音樂的隸屬情感的第三排序結果;
根據所述第三排序結果獲取待分類音樂的第二預估情感預測結果;
其中,將所述第三排序結果轉換為所述第二預估情感預測結果的公式為:
pe(j)=(1-αe)j-1αe
其中,pe(j)為所述待分類音樂隸屬於排序為j的情感的估計概率,αe為所所述通用情感分類器採用測試集得到的情感分類準確率。
可選地,所述根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,包括:
根據所述各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的隸屬流派的第四排序結果;
根據所述第四排序結果獲取所述待分類音樂的第二預估流派預測結果;
其中,將所述第四排序結果轉換為所述第二預估流派預測結果的公式為:
其中,pg(i)為所述待分類音樂隸屬於排序為i的流派的估計概率,為情感j流派分類器採用測試集得到的流派分類準確率。
可選地,所述根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤,包括:
根據如下公式獲取所述待分類音樂的各個流派標籤的第一權重值:
對所述待分類音樂的各個流派標籤的第一權重值進行排序,將排在前面第一預設個數的流派標籤確定為所述待分類音樂的流派標籤;
根據如下公式獲取所述待分類音樂的各個情感標籤的第二權重值:
對所述待分類音樂的各個情感標籤的第二權重值進行排序,將排在前面第二預設個數的流派標籤確定為所述待分類音樂的情感標籤;
其中,gf[i]為第i個流派標籤的第一權重值;ef[j]為第j個情感標籤的第二權重值;m為待分類音樂中流派標籤的種類;n為待分類音樂中情感標籤的種類;ge[i,j]為所述流派情感預測表中第i行第j列元素的值。
可選地,所述第一預設個數為1,所述第二預設個數為1。
可選地,所述通用流派分類器、所述通用情感分類器、所述針對不同情感的流派分類器和所述針對不同流派的情感分類器是基於最大期望算法訓練得到的。
本發明實施例提供了一種音樂分類裝置,包括:
通用分類器訓練單元,用於根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;
流派情感分類器訓練單元,用於選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;
流派情感預測表獲取單元,用於根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,將所述第一預估情感預測結果填入流派情感預測表,並根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,並將所述第二預估流派預測結果填入所述流派情感預測表;
標籤獲取單元,用於根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。
本發明實施例提供的音樂分類方法及裝置,根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;根據所述通用流派分類器、各個不同流派的情感分類器、通用情感分類器、各個不同情感的流派分類器獲取流派情感預測表;根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。本發明實施例在進行分類的過程中,充分考慮流派與情感類別的相互關係,根據流派情感預測表對待分類音樂進行綜合評估,提高了音樂分類的準確性。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明一個實施例的音樂分類方法的流程示意圖;
圖2是本發明一個實施例的音樂分類方法的原理圖;
圖3是本發明一個實施例的音樂分類裝置的結構示意圖。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整的描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本發明實施例的音樂分類方法基於監督學習的分類方法,將待分類音樂分成m類流派和n類情感,m和n的數值根據具體的分類任務確定。訓練集包括一定數量的已經具有情感與流派標籤的音樂數據。本發明實施例基於訓練集訓練一系列分類器。
圖1是本發明一個實施例的音樂分類方法的流程示意圖。如圖1所示,該實施例的方法包括:
s11:根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;
需要說明的是,本發明實施例對分類器不做特殊規定,所選擇的分類器的輸出應為待分類音樂屬於某一個流派的排序rank或估計概率;或者所選擇的分類器的輸出為待分類音樂屬於某一個情感的排序rank或估計概率。如果分類的輸出為rank,在進行實際預測時,將被按一定規則轉化為估計概率。
本發明實施例採用訓練集音樂的聲學特徵與流派標籤訓練一個通用流派分類器,並採用測試集進行評估得到分類準確率αg;然後採用訓練集音樂聲學特徵與情感標籤訓練一個通用情感分類器,並採用測試集進行評估得到分類準確率αe。
s12:選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;
需要說明的是,本發明實施例選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,採用情感標籤為j的訓練數據得到的流派分類器,命名為情感j流派分類器,並採用測試集進行評估得到分類準確率
本發明實施例選取訓練集中的不同流派的音樂數據,訓練針對不同流派的情感分類器,採用流派i的訓練數據得到的情感分類器,命名為流派i情感分類器,並採用測試集進行評估得到分類準確率
s13:根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,將所述第一預估情感預測結果填入流派情感預測表,並根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,並將所述第二預估流派預測結果填入所述流派情感預測表;
可理解的是,本發明實施例採用通用流派分類器對待分類音樂進行分類和採用通用情感分類器對待分類音樂進行分類並不限制執行的先後順序,可以先通用流派分類後通用情感分類,可以先通用情感分類再通用流派分類,二者也可以並行進行。
本發明實施例對待分類音樂首先經過通用流派分類器和通用情感分類器的分類,得到待分類音樂隸屬於不同情感和流派的概率估計。然後採用各個不同情感的流派分類器分流派和各個不同流派的情感分類器,獲取待分類音樂屬於不同情感和流派的概率。並將結果填入流派情感預測表。
s14:根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。
本發明實施例對流派情感預測表進行綜合評估後,給出最終分類結果,獲得待分類音樂的流派標籤和情感標籤。
本發明實施例提供的音樂分類方法,在進行分類的過程中,充分考慮流派與情感類別的相互關係,根據流派情感預測表對待分類音樂進行綜合評估,提高了音樂分類的準確性。
在本發明實施例的一種可選的實施方式中,所述根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,包括:
根據所述通用流派分類器獲取待分類音樂的隸屬流派的第一排序結果;
根據所述第一排序結果獲取待分類音樂的第一預估流派預測結果;
其中,將所述第一排序結果轉換為所述第一預估流派預測結果的公式為:
pg(i)=(1-αg)i-1αg
其中,pg(i)為所述待分類音樂隸屬於排序為i的流派的估計概率,αg為所述通用流派分類器採用測試集得到的流派分類準確率。
類似地,所述根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,包括:
根據所述各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的隸屬情感的第二排序結果;
根據所述第二排序結果獲取所述待分類音樂的第一預估情感預測結果;
其中,將所述第二排序結果轉換為所述第一預估情感預測結果的公式為:
其中,pe(j)為所述待分類音樂隸屬於排序為j的情感的估計概率,為流派i情感分類器採用測試集得到的情感分類準確率。
類似地,所述根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,包括:
根據所述通用情感分類器獲取所述待分類音樂的隸屬情感的第三排序結果;
根據所述第三排序結果獲取待分類音樂的第二預估情感預測結果;
其中,將所述第三排序結果轉換為所述第二預估情感預測結果的公式為:
pe(j)=(1-αe)j-1αe
其中,pe(j)為所述待分類音樂隸屬於排序為j的情感的估計概率,αe為所所述通用情感分類器採用測試集得到的情感分類準確率。
類似地,所述根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,包括:
根據所述各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的隸屬流派的第四排序結果;
根據所述第四排序結果獲取所述待分類音樂的第二預估流派預測結果;
其中,將所述第四排序結果轉換為所述第二預估流派預測結果的公式為:
其中,pg(i)為所述待分類音樂隸屬於排序為i的流派的估計概率,為情感j流派分類器採用測試集得到的流派分類準確率。
可理解的是,本發明實施例設計了由基於排序的分類結果到基於概率估計的分類結果的變換機制,本發明實施例既可以採用基於概率估計的分類模型也可以採用基於排序的分類模型,提高了本發明實施例的適應性。
進一步地,所述根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤,包括:
根據如下公式獲取所述待分類音樂的各個流派標籤的第一權重值:
對所述待分類音樂的各個流派標籤的第一權重值進行排序,將排在前面第一預設個數的流派標籤確定為所述待分類音樂的流派標籤;
根據如下公式獲取所述待分類音樂的各個情感標籤的第二權重值:
對所述待分類音樂的各個情感標籤的第二權重值進行排序,將排在前面第二預設個數的流派標籤確定為所述待分類音樂的情感標籤;
其中,gf[i]為第i個流派標籤的第一權重值;ef[j]為第j個情感標籤的第二權重值;m為待分類音樂中流派標籤的種類;n為待分類音樂中情感標籤的種類;ge[i,j]為所述流派情感預測表中第i行第j列元素的值。
以下結合圖2說明詳細說明本發明實施例的音樂分類方法的過程。
如圖2所示,gmm為選用的高斯混合分類模型(可根據實際需要選擇其他分類模型),gmmg為通用流派分類器,gmme為通用情感分類器。gmmgie為用於流派i的情感分類器,gmmeig為用於情感i類的流派分類器。
本發明實施例首先對訓練集的音樂數據進行聲學特徵提取,提取的聲學特徵可以包括但不限於表1中的聲學特徵:
表1音樂數據的聲學特徵
本發明實施例採用高斯混合模型分別進行通用情感分類器和通用流派分類器的訓練,訓練得到兩個高斯混合分類器:通用情感分類器gmme和通用流派分類器gmmg。
以訓練通用情感分類器為例,假定其混合成分數為k,對每一類情感的訓練數據x={x1,x2,x3,….,xn},可以採用最大期望em算法訓練其高斯混合模型,訓練步驟如下:
初始化參數θc={wi,μi,∑i,i=1,...,k}
循環下面步驟,直到收斂:
(e步)計算
(m步)求取如下似然函數最大化的參數θ
總共得到n個具有k組高斯分布參數的gmm混合模型參數,記為通用情感分類器gmme。
後續的分類器的訓練採用em算法,再次不再贅述。
本發明實施例採用上述的類似方法,訓練得到通用流派分類器gmmg;
對每類流派i,訓練流派i歌曲的情感分類模型得到gmmgie;
對每類情感j,訓練情感j歌曲的流派分類模型得到gmmejg;
同時在訓練階段獲取各個分類器的準確率評估結果αe,αg,等。
在各分類器訓練完畢後,本發明實施例對待分類音樂進行分類的過程如下:
初始化流派情感預測表ge[i,j]初值為0;
對待分類音樂x使用通用情感分類器gmme進行情感預測,得到屬於不同情感的排序,並將該排序轉化為隸屬於不同情感的概率p(ej|x),即第二預估情感預測結果;
採用基於情感的流派分類器gmmejg(j=1,…,n)進行流派預測,得到屬於不同流派的排序,並將該排序轉化為隸屬於不同流派的概率p(gi|x,ej);將第二預估流派預測結果填入流派情感預測表:
ge[i,j]=ge[i,j]+p(gi|x,ei)*p(ej/x);
對待分類音樂x使用通用流派分類器gmmg進行流派預測,得到屬於不同流派的排序,並將該排序轉化為隸屬於不同流派的概率p(gi|x),即第一預估流派預測結果;
採用基於流派的情感分類器gmmgie(i=1,…,m)進行情感預測,得到屬於不同情感的排序,將該排序轉化為隸屬於不同流派的概率p(ej|x,gi),將第一預估情感預測結果填入流派情感預測表:
ge[i,j]=ge[i,j]+p(ej|x,gi)*p(gi|x);
進一步地,所述第一預設個數為1,所述第二預設個數為1。
本發明實施例對待分類音樂可為多標籤分類,在預測結果中取靠前的或者超過某一閾值的部分標籤。本發明實施例對待分類音樂也可以為單一標籤分類,即取最大gf[i]對應的標號的標籤為待分類音樂的流派標籤,取最大ef[j]對應的標號的標籤為待分類音樂的情感標籤。
本發明實施例的訓練與分類的具體實現還取決於計算機系統,在多核或集群計算機系統上,上述基於不同情感的流派分類器的訓練、基於不同流派的情感分類器的訓練、流派與情感分類器的訓練。預測的可並行情況與訓練類似,在此不再一一說明。
圖3是本發明一個實施例的音樂分類裝置的結構示意圖。如圖3所示,本發明實施例的裝置包括通用分類器訓練單元31:
通用分類器訓練單元31,用於根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;
流派情感分類器訓練單元32,用於選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;
流派情感預測表獲取單元33,用於根據所述通用流派分類器獲取待分類音樂的第一預估流派預測結果,根據各個不同流派的情感分類器和所述第一預估流派預測結果獲取所述待分類音樂的第一預估情感預測結果,將所述第一預估情感預測結果填入流派情感預測表,並根據所述通用情感分類器獲取所述待分類音樂的第二預估情感預測結果,根據各個不同情感的流派分類器和所述第二預估情感預測結果獲取所述待分類音樂的第二預估流派預測結果,並將所述第二預估流派預測結果填入所述流派情感預測表;
標籤獲取單元34,用於根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。
本發明實施例的音樂分類裝置可以用於執行上述方法實施例,其原理和技術效果類似,此處不再贅述。
本發明實施例提供的音樂分類方法及裝置,根據訓練集的音樂數據的聲學特徵和流派標籤訓練通用流派分類器,並根據訓練集的音樂數據的聲學特徵和情感標籤訓練通用情感分類器;選取訓練集中的不同情感的音樂數據,訓練針對不同情感的流派分類器,並選取訓練集中不同流派的音樂數據,訓練針對不同流派的情感分類器;根據所述通用流派分類器、各個不同流派的情感分類器、通用情感分類器、各個不同情感的流派分類器獲取流派情感預測表;根據所述流派情感預測表獲取所述待分類音樂的流派標籤和情感標籤。本發明實施例在進行分類的過程中,充分考慮流派與情感類別的相互關係,根據流派情感預測表對待分類音樂進行綜合評估,提高了音樂分類的準確性。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限於磁碟存儲器、cd-rom、光學存儲器等)上實施的電腦程式產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
需要說明的是術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
本發明的說明書中,說明了大量具體細節。然而能夠理解的是,本發明的實施例可以在沒有這些具體細節的情況下實踐。在一些實例中,並未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。類似地,應當理解,為了精簡本發明公開並幫助理解各個發明方面中的一個或多個,在上面對本發明的示例性實施例的描述中,本發明的各個特徵有時被一起分組到單個實施例、圖、或者對其的描述中。然而,並不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發明要求比在每個權利要求中所明確記載的特徵更多的特徵。更確切地說,如權利要求書所反映的那樣,發明方面在於少於前面公開的單個實施例的所有特徵。因此,遵循具體實施方式的權利要求書由此明確地併入該具體實施方式,其中每個權利要求本身都作為本發明的單獨實施例。
以上實施例僅用於說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。