新四季網

基於音頻頻譜特徵分析的演唱音色明亮度客觀評測方法

2023-10-10 01:24:14 11

專利名稱:基於音頻頻譜特徵分析的演唱音色明亮度客觀評測方法
技術領域:
本發明涉及一種度量演唱音色明亮度的客觀方法,更具體地說,本發明涉及一種基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法。
背景技術:
音色明亮度是指一種用於評價唱歌者演唱水平的主觀指標, 一般定義為對唱歌者歌聲的一種明亮、高昂、溫暖的主觀感知。主觀評價人感覺唱歌者的歌聲越明亮、高昂,則認為唱歌者的演唱音色明亮度越高,反之,則認為演唱音色明亮度越低。這裡的主觀評價人, 一般指的是聲樂專家,比如聲樂老師和資深音樂家。而唱歌者可以是專業的歌手、聲樂系學生,也可以是普通人。
目前,演唱評價基本還是處於完全依靠專家主觀評價的階段,並沒有成熟的客觀評價系統能夠對演唱水平或演唱水平的某個方面進行度量和評價。演唱音色明亮程度的評價也完全依賴專家的主觀感知,目前還沒有客觀度量的方法或者輔助主觀評價的客觀指標。雖然國外一些研究調査發現音色明亮度的評價和頻譜能量分布、共振峰位置、能量等有關,但是並沒有具體的、定義明確的客觀度量方法出現。例如,文獻1提出音色明亮度與頻譜能量分布有關,但是並沒有給出具體的計算方法。另外,演唱水平的評價與旋律音高的準確性相關,演唱者音高的提取,我們採用了參考文獻2中提出的方法,該方法通過求取每幀數據頻譜諧波和最大值對應的基頻作為每幀的音高值。這裡,需要說明的是,該方法得到的音高值僅僅作為計算音色的一個基本參數值,與本專利的獨特性無關。
另外,主觀演唱評價方法不可避免的具有以下幾個缺點第一,不可重複性。因為各種各樣因素的影響,對於同樣一個演唱片段,兩次主觀評價之間或多或少的都會出現差異,而這種差異在理想情況下是不應該存在的。第二,主觀偏向性。因為每個評價人都有各自不同的喜好,所以對於同一個演唱片段,每個評價人都有各自不同的評價,都有各自的偏向性。第三,費用昂貴,可獲得性差。對於一般的普通人來說(不是專業的聲樂學校的學生),要獲得聲樂專家的主觀評價,是很困難的或費用高昂的。
參考文獻1: E. Ekholm, G. Papagiannis, and F. Chagnon, "Relating ObjectiveMeasurements to Expert Evaluation of Voice Quality in Western Classical Singing:Critical Perceptual Parameters," Journal of Voice, vol.12, no.2, pp. 182—196, 1998.
參考文獻2: C. Cao, M. Li,丄Liu, and Y. Yan, "Singing Melody Extraction inPolyphonic Music by Harmonic Tracking," Proc.她International Conference on MusicInformation Retrieval (ISMIR), pp. 373—374, 2007.

發明內容
因此,鑑於上述現狀,本發明的目的在於提供一種基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法,通過對演唱片段的頻譜特徵分析,給出可以量化的客觀評測參數指標。
為實現上述發明目的,本發明提供的基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法,包括如下步驟-
1) 選取需要度量音色明亮度的演唱片段音頻信號;
2) 對上述所選取的演唱片段音頻信號進行"演唱/間隙"判斷;
3) 對上述步驟2)中得到的演唱片段,計算得到三種頻譜特徵測度2K-3KHz能量和、頻譜能量總和以及頻率加權的譜能量和;
4) 根據上述步驟3)中得到的頻譜特徵,計算得到最終的音色明亮度的客觀度量參數指標平均2K-3KHz能量比、平均譜重心,然後利用求出的參數指標對演唱音色的明亮度進行評測。
其中,上述步驟4)中,在利用求出的參數指標對演唱音色的明亮度進行評測時,可以單獨基於所述平均2K-3KHz能量比或者平均譜重心進行評價,也可以將所述平均2K-3KHz能量比和平均譜重心相結合來進行評價。
另外,所述步驟2)中的判斷方法包括基於能量的語音活動檢測算法以及基於基頻檢測算法的voice/nonvoice判斷機制。
與現有的主觀評價的方法相比,本發明提及的兩種客觀度量方法具有以下優點穩定性、客觀性、便利性。由於是基於音頻信號頻譜特徵的客觀評價方法,只要輸入的演唱音頻信號一致,則度量結果保持不變,不受其他人為因素影響。同時,計算機算法的便利程度較聲樂專家主觀評價的方式有很大改進,只需將錄製的演唱片段輸入,算法即可以給出客觀度量參數。


圖1是本發明的音色明亮度客觀評測方法的流程圖。
具體實施例方式
下面結合附圖及具體實施方式
對本發明的基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法做進一步詳細描述。
圖1是本發明的音色明亮度客觀評測方法的流程圖。
如圖1所示,本發明提供的基於音頻頻譜特徵分析的演唱音色明亮度客觀評測方法,包括如下步驟
1) 選取需要度量音色明亮度的演唱片段音頻信號該步驟l)中,首先輸入演唱片段的音頻數據。
在本發明的基於演唱頻譜特徵分析的音色明亮度的客觀評測方法中,音頻數據
的格式可以採用16K 16Bit Windows PCM格式等任何一種採樣率來進行處理。作為一個實施例,我們採用16K採樣率的音頻數據格式,每個採樣點用16Bit數來表示。
2) 對上述所選取的演唱片段音頻信號進行"演唱/間隙"判斷
在該"演唱/間隙"判斷步驟中,可以採用多種方法,例如基於能量的語音活動檢測(VAD: Voice Activity Detection)算法等。這裡,以採用基於基頻檢測算法的voice/nonvoice判斷機制為例進行說明。具體地說,使用基於諧波和的基頻提取算法,該方法通過計算歸一化諧波和譜對信號基頻/。序列進行估計,每個濁音幀輸出一個基頻估計值。基頻的具體計算方法與參考文獻2中描述基本一致,通過求取每幀數據頻譜諧波和最大值對應的基頻獲得。將具有有效基頻值的幀視為"演唱"部分,而將其餘部分視為"間隙"部分。
3) 對上述步驟2)中得到的演唱片段,計算得到三種頻譜特徵測度2K-3KHz能量和、頻譜能量總和以及頻率加權的譜能量和
通過步驟2)確定了演唱部分位置之後,接著進行頻譜特徵(2K-3KHz能量和、頻譜能量總和、頻率加權的譜能量和)的測度計算。
第一個特徵2K-3KHz能量和。2K-3KHz能量和指的是每個"演唱"幀中
62KHz 3KHz部分頻譜能量的總和,其計算方法為-
3《
其中S(/)為該幀的快速傅立葉變換(FFT)能量譜。
第二個特徵頻譜能量總和,即整個頻譜的能量總和,其計算公式為-
第三個特徵頻率加權的譜能量和,即用頻率值來對頻譜能量值進行加權,其 計算方法為
4)根據上述步驟3)中得到的頻譜特徵,計算得到最終的音色明亮度的客觀度 量參數指標平均2K-3KHz能量比以及平均譜重心。
在獲得了 "2K-3KHz能量和"、"頻譜能量總和"之後,計算出平均2K-3KHz能
量比作為演唱音色明亮度的客觀度量指標。
平均2K-3KHz能量比的計算
對於任何演唱幀,其2K-3KHz能量比的計算公式為
' 一五r —
平均2K-3KHz能量比》就是該演唱音頻信號中所有演唱幀2K-3KHz能量比《 的算術平均值。在本發明中,平均2K-3KHz能量比即可作為演唱音色明亮度的一個 客觀度量,取值範圍為0 1,平均2K-3KHz能量比越大,說明演唱片段音色明亮度 越高,反之,平均2K-3KHz能量比越小,說明音色明亮度越低。
或者,也可以在獲得了 "頻譜能量總和"、"頻率加權的譜能量和"之後,計算 出平均譜重心來作為演唱音色明亮度的客觀度量指標。
平均譜重心的計算對於任何演唱幀,其譜重心的計算公式為-
formula see original document page 8
平均譜重心5即是該演唱音頻信號中所有演唱幀譜重心c;的算術平均值。在本 發明中,平均譜重心也可作為演唱音色明亮度的另一個客觀度量,取值範圍為 0~8000,平均譜重心越大,說明演唱片段音色明亮度越高,反之,平均譜重心越小, 說明音色明亮度越低。
另外,本發明的基於演唱片段頻譜特徵分析的音色明亮度客觀評測方法,還可 以將上述兩個度量指標結合起來對音色明亮度進行評測。即將兩種測度進行加權平 均後的值作為指標。至於加權的方式和具體數值我們不做具體限定,可以是線性加 權,也可以是指數加權。
8
權利要求
1、一種基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法,包括如下步驟1)選取需要度量音色明亮度的演唱片段音頻信號;2)對上述所選取的演唱片段音頻信號進行「演唱/間隙」判斷;3)對上述步驟2)中得到的演唱片段,計算得到三種頻譜特徵測度2K-3KHz能量和、頻譜能量總和以及頻率加權的譜能量和;4)根據上述步驟3)中得到的頻譜特徵,計算得到最終的音色明亮度的客觀度量參數指標平均2K-3KHz能量比、平均譜重心,然後利用求出的參數指標對演唱音色的明亮度進行評測。
2、 如權利要求1所述的基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方 法,其特徵在於,所述步驟4)中,在利用求出的參數指標對演唱音色的明亮度進行 評測時,單獨基於所述平均2K-3KHz能量比或者平均譜重心進行評價,或者將所述 平均2K-3KHz能量比和平均譜重心相結合進行評價。
3、 如權利要求1或2所述的基於音頻頻譜特徵分析的演唱音色明亮度的客觀評 測方法,其特徵在於,所述步驟2)中的判斷方法包括基於能量的語音活動檢測算 法以及基於基頻檢測算法的voice/nonvoice判斷機制。
4、 如權利要求1或2所述的基於音頻頻譜特徵分析的演唱音色明亮度的客觀評 測方法,其特徵在於,所述步驟3)中各頻譜特徵測度的計算方法分別為1) 2K-3KHz能量和計算公式為五2緒=化,其中,S(/)為該幀的快速傅立葉變換能量譜;2) 頻譜能量總和計算公式為五r = ;3) 頻率加權的譜能量和用頻率值對頻譜能量值進行加權,其計算方法為,,4 = ;所述步驟4)中根據上述頻譜特徵計算得到的最終的音色明亮度的客觀度量參數指標為1) 平均2K-3KHz能量比5:對於任何演唱幀,其2K-3KHz能量比的計算公式為,〃 J"柳"/'_五r —所述平均2K-3KHz能量比萬是該演唱音頻信號中所有演唱幀2K-3KHz能量比 i ,的算術平均值,該平均2K-3KHz能量比Z作為演唱音色明亮度的一個客觀度量時,取值範圍為0-l,平均2K-3KHz能量比》越大,則演唱片段音色明亮度越高;2) 平均譜重心5:對於任何演唱幀,其譜重心的計算公式為,'一 (平均譜重心5是該演唱音頻信號中所有演唱幀譜重心c,的算術平均值,該平均譜重心5作為演唱音色明亮度的另一個客觀度量時,取值範圍為0~8000,平均譜重 心5越大,則演唱片段音色明亮度越高;3) 當將上述平均2K-3KHz能量比5和平均譜重心5兩個度量指標結合起來對 音色明亮度進行評測時,將這兩種測度進行加權平均後的值作為指標,所述加權的 方式採用線性加權或者指數加權。
全文摘要
本發明提供一種基於音頻頻譜特徵分析的演唱音色明亮度的客觀評測方法,包括如下步驟1)選取需要度量音色明亮度的演唱片段音頻信號;2)對所選取的演唱片段音頻信號進行「演唱/間隙」判斷;3)對步驟2)得到的演唱片段,計算得到三種頻譜特徵測度2K-3KHz能量和、頻譜能量總和以及頻率加權的譜能量和;4)根據步驟3)得到的頻譜特徵,計算得到最終的客觀度量參數指標平均2K-3KHz能量比、平均譜重心,利用求出的參數指標對演唱音色的明亮度進行評測。本發明的評測方法,通過對演唱片段的頻譜特徵分析,利用計算機算法給出可以量化的客觀評測參數指標,不受其他人為因素影響,並且具有穩定性、客觀性以及便利性等優點。
文檔編號G10L11/00GK101650941SQ200810224790
公開日2010年2月17日 申請日期2008年12月26日 優先權日2008年12月26日
發明者建 劉, 川 曹, 明 李, 潘接林, 顏永紅 申請人:中國科學院聲學研究所;北京中科信利技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀