新四季網

一種立體聲音頻的處理方法和裝置製造方法

2023-06-27 19:56:56 4

一種立體聲音頻的處理方法和裝置製造方法
【專利摘要】本發明披露了一種立體聲音頻的處理方法,包括步驟:分別將左聲道和右聲道的時域信號變換為頻域信號;計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設範圍內的頻點列為待衰減的頻點,和/或計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差值,將相位差值在預設範圍內的頻點列為待衰減的頻點;對待衰減的頻點進行衰減;將經上述衰減處理的頻域信號逆變換為時域信號。本發明還披露了實現該方法的一種裝置;利用左右聲道之間伴奏與人聲的特定差異性,對伴奏進行抑制,從而增強人聲,或對人聲進行抑制從而提取伴奏。所得到的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
【專利說明】一種立體聲音頻的處理方法和裝置

【技術領域】
[0001] 本發明涉及音頻處理領域,更具體地涉及一種立體聲音頻的處理方法和裝置。

【背景技術】
[0002] 從立體聲中將人聲和伴奏分離的技術在音頻處理領域有重要而廣泛的應用,例如 歌詞的自動識別和校正,就需要以先期的人聲分離作為基礎來進行。歌詞自動識別通常要 求輸入處理系統的是單獨的人聲,有伴奏幹擾的情況下很難完成,但因為大多數歌曲都同 時包含歌聲與樂器伴奏,直接進行是不實際的。
[0003] 現有技術中涉及從歌曲中提取伴奏、提取人聲或分離伴奏和人聲的方法往往利用 的是多數立體聲歌曲中人聲在左右兩個聲道中基本相同的特點,例如,採用將兩個聲道中 的信號直接對減的方法來消除人聲。從歌曲中提取人聲的研究還相對較少。其中,利用立體 聲歌曲左右聲道信號之間的相關性來提取人聲或伴奏是立體聲音頻研究的一個重要方向。
[0004] 一種現有的基於立體聲相關聲道提取人聲的技術是對左右聲道相應頻點對的均 值信號加權人聲增益,人聲增益與當前頻點對的歸一化互相關值成正比例取值;將加權人 聲增益後的左聲道和右聲道的均值信號由頻域轉換為時域提取出人聲。該方法僅僅利用互 相關這一特性來區分伴奏與人聲,雖然可以一定程度地抑制伴奏,但結果會殘餘伴奏。
[0005] 因此,如何較大程度地抑制伴奏或人聲部分,成為本領域人員迫切解決的一個技 術問題。


【發明內容】

[0006] 為此,需要提供一種準確有效地提取音場中不同區域的音頻信號的方法和技術。
[0007] 為實現上述目的,發明人提供的技術方案如下:
[0008] -種立體聲音頻的處理方法,包括步驟:
[0009] 分別將左聲道和右聲道的時域信號變換為頻域信號;
[0010] 利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的 幅度比值,將幅度比值在預設範圍內的頻點列為待衰減的頻點;
[0011] 對待衰減的頻點進行衰減處理;
[0012] 將處理後的頻域信號逆變換為時域信號。
[0013] 進一步地,所述的立體聲音頻的處理方法還包括步驟:利用變換得到的頻域信號 計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內 的頻點也列為待衰減的頻點。
[0014] 發明人還提供了另一種立體聲音頻的處理方法,包括步驟:
[0015] 分別將左聲道和右聲道的時域信號變換為頻域信號;
[0016] 利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的 相位差,將相位差差值在預設範圍內的頻點列為待衰減的頻點。對待衰減的頻點進行衰減 處理;
[0017] 再將處理後的頻域信號逆變換為時域信號。
[0018] 進一步地,所述的立體聲音頻的處理方法還包括步驟:利用變換得到的頻域信號 計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設範圍內 的頻點也列為待衰減的頻點;
[0019] 在應用上述方法的各實施例中,當只選擇一個條件(幅度比值或相位差)時,可以 遍歷所有頻點,當滿足該條件時,直接對該頻點進行衰減處理;當選擇多個條件(幅度比值 與相位差)時,可以先篩選出所有符合條件的頻點,然後一併對這些頻點進行衰減處理,t匕 如,先按不同的條件篩選出各自的頻點集合,然後將這些集合取併集,從而得到所有待衰減 的點;再比如,先以某個條件篩選出符合條件的頻點集合,然後以其他條件篩選,如果有新 的符合條件的頻點,再加入之前那個頻點集合,從而得到所有待衰減的點。
[0020] 進一步地,所述的立體聲音頻的處理方法中,所述左聲道頻域信號與右聲道頻 域信號相應頻點對的幅度比值計算公式如下:k n(i) = abs(fft_frameRn(i))/abs(fft_ framLn(i))*(2/:n);其中fft_frameRji)與€代_^^1111^;〇分別表示右聲道與左聲道的頻 譜;
[0021] 公式中η = 0, 1,2,…,N-1 ;N表示巾貞數;
[0022] i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
[0023] 並將幅度比值在預設範圍內的頻點列為待衰減的頻點。
[0024] 進一步地,所述的立體聲音頻的處理方法中,計算左右聲道相應頻點對的相位差 的公式為:
[0025] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i));其中 fft_frameRn(i) 與fft_framLn(i)分別表示右聲道與左聲道的頻譜;
[0026] 公式中η = 0, 1,2,…,N-1 ;N表示巾貞數;
[0027] i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
[0028] 並將相位差差值在預設範圍內的頻點也列為待衰減的頻點。
[0029] 進一步地,所述的立體聲音頻的處理方法中,對待衰減的頻點作衰減處理公式為: fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;公式中,i 為待衰減的頻點。
[0030] 進一步地,所述的立體聲音頻的處理方法中,在步驟"分別將左聲道和右聲道的時 域信號變換為頻域信號"之前還包括步驟:
[0031] 對左聲道和右聲道的時域信號進行歸一化處理;
[0032] 將左聲道和右聲道的時域信號分別劃分為若干幀,每幀包括預設數量的聲音採樣 點,並且相鄰幀之間有預設數量的重合採樣點。
[0033] 進一步地,所述的立體聲音頻的處理方法中,在步驟"將左聲道和右聲道的時域信 號分別劃分為若干幀"之後以及步驟"分別將左聲道和右聲道的時域信號變換為頻域信號" 之前還包括步驟:
[0034] 對每幀進行加漢寧窗濾波處理。
[0035] -種立體聲音頻的處理裝置,包括變換單元、計算單元、抑制單元以及逆變換單 元;
[0036] 所述變換單元用於將左聲道和右聲道的時域信號變換為頻域信號;
[0037] 所述計算單元用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比 值,將幅度比值在預設範圍內的頻點列為待衰減的頻點;或用於計算左聲道頻域信號與右 聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內的頻點列為待衰減的頻 佔.
[0038] 所述抑制單元用於對待衰減的頻點進行衰減處理;
[0039] 所述逆變換單元用於將頻域信號逆變換為時域信號。
[0040] 進一步地,所述的立體聲音頻的處理裝置中,計算單元既用於計算左聲道頻域信 號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設範圍內的頻點列為待衰減 的頻點,也用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差 值在預設範圍內的頻點也列為待衰減的頻點。
[0041] 進一步地,所述的立體聲音頻的處理裝置中,計算單元計算所述左聲道頻域信號 與右聲道頻域信號相應頻點對的幅度比值計算公式如下:k n(i) = abs(fft_frameRn(i))/ abs (fft_framLn(i)) * (2/π );
[0042] 公式中η = 0, 1,2,…,N-l ;N表示巾貞數;
[0043] i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數;
[0044] 進一步地,所述的立體聲音頻的處理裝置中,計算單元計算左右聲道相應頻點對 的相位差的公式為:
[0045] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i));
[0046] 公式中n = 0, 1,2, ···,N-l ;N表示巾貞數;
[0047] i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數;
[0048] 進一步地,所述的立體聲音頻的處理裝置中,抑制單元對待衰減的頻點進行衰減 處理,公式為:fft_frameR n(i) = 0或fft_frameLn(i) = 0 ;公式中,i表示待衰減的頻點。
[0049] 進一步地,所述的立體聲音頻的處理裝置還包括歸一化單元和分巾貞單元;
[0050] 所述歸一化單兀用於對左聲道和右聲道的時域信號進行歸一化處理;
[0051] 所述分幀單元用於將左聲道和右聲道的時域信號分別劃分為若干幀,每幀包括預 設數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點;
[0052] 進一步地,所述的立體聲音頻的處理裝置還包括濾波單元,用於對每幀進行加漢 寧窗濾波處理。
[0053] 本發明利用左右聲道之間伴奏與人聲的特定差異性,對伴奏(人聲)進行抑制,從 而提取人聲(伴奏),所得到的處理結果能夠為對歌曲中人聲(伴奏)信息的分析奠定良好 的基礎。

【專利附圖】

【附圖說明】
[0054] 圖1為本發明第一實施方式所述立體聲音頻的處理方法的流程圖;
[0055] 圖2為立體聲歌曲《wonderful world》的時域波形;
[0056] 圖3為立體聲歌曲《wonderful world》經本發明第一實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;
[0057] 圖4為立體聲歌曲《wonderful world》經本發明第二實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;
[0058] 圖5為立體聲歌曲《wonderful world》經本發明第三實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;
[0059] 圖6為立體聲歌曲《wonderful world》經本發明第四實施方式所述立體聲音頻的 處理方法提取伴奏所得時域波形;
[0060] 圖7為本發明第三實施方式中一種立體聲音頻的處理裝置的功能模塊示意圖。
[0061] 附圖標記說明:
[0062] 1-變換單元
[0063] 2-計算單元
[0064] 3-抑制單元
[0065] 4-逆變換單元
[0066] 5-歸一化單元
[0067] 6-分幀單元
[0068] 7-濾波單元

【具體實施方式】
[0069] 為詳細說明本發明的技術內容、構造特徵、所實現目的及效果,以下結合實施方式 並配合附圖詳予說明。
[0070] 請參閱圖1,為本發明第一實施方式中一種立體聲音頻的處理方法的流程圖;所 述方法包括步驟:
[0071] S1、對左聲道和右聲道的時域信號進行歸一化處理;
[0072] S2、將經歸一化處理的左聲道和右聲道的時域信號分別劃分為若干巾貞,每巾貞包括 預設數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點;
[0073] S3、對每幀進行加漢寧窗濾波處理;
[0074] S4、將經濾波處理後的每幀時域信號變換為頻域信號;
[0075] S5、計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,對幅度比值 在預設範圍內的頻點列為待衰減的頻點,並將待衰減的頻點進行衰減處理;
[0076] S6、將經衰減處理的頻域信號逆變換為時域信號;
[0077] S7、連接經逆變換的每幀時域信號。
[0078] 以下以一具體案例對本方法流程進行詳細闡述:
[0079] 對一首立體聲歌曲音頻進行處理,首先分別對該立體聲歌曲音頻的左聲道和右聲 道信號進行歸一化處理,所述歸一化處理的方式是找出信號絕對值的最大值,將原信號除 以該最大值,處理結果是使信號的正負幅值位於-1與+1之間。
[0080] 隨後,分別將歸一化後的左聲道信號和右聲道信號劃分為N個巾貞,每巾貞包括8192 個聲音採樣點,並且相鄰幀之間有2048個重合的採樣點。這樣的劃分方式目的是使幀與幀 之間具有平滑過渡的效果。
[0081] 接下來,對劃分後的每個幀進行加漢寧窗濾波處理。本步驟的加漢寧窗濾波處理 能夠有效減少後續時域到頻域的變換過程中可能造成的頻譜洩露。
[0082] 然後,對經加窗濾波處理的每幀音頻信號進行8192個點的快速傅立葉變換(Fast Fourier Transform, FFT),得到表徵右聲道的頻譜:fft_frameRn(i)以及表徵左聲道的頻 譜:fft_frameL n(i)。其中,i = 0, 1,2, · · ·,4096 ;n = 0, 1,2, · · ·,N-1。4096 表示傅立葉 變換的點數的一半,N表示幀數。本實施方式利用傅立葉變換的對稱性特徵,為節省計算量, 只需要計算傅立葉變換點數的一半。
[0083] 繼而進行的是伴奏抑制步驟。
[0084] 本實施方式中的抑制為基於幅度比值的抑制,可以用於伴奏抑制,包括步驟:計算 左聲道頻域信號與右聲道頻域信號所有幀相應頻點對的幅度比值,對幅度比值在預設範圍 內的頻點進行衰減處理。
[0085] 具體做法如下:
[0086] 遍歷所有的巾貞(η = 0, 1,…,N-1);每巾貞再遍歷所有的頻率點(i = 0, 1, 2,, 4096);
[0087] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值,公式為kn(i)= abs(fft_frameRn(i))/abs(fft_frameLn(i))*(2/3i),並對比值落在預設範圍的頻點進行 抑制,上述比值落在預設範圍的頻點即為待衰減的頻點,衰減的公式為fft_frameR n(i) = 0 或fft_frameLji) = 0,公式中,i為待衰減的頻點。
[0088] 幅度比值一般在(0, 1)的範圍內,對於人聲信號,該比值在0. 5左右;對於伴奏信 號,該比值一般遠離〇. 5而接近0或接近1。本實施方式的目的是抑制伴奏提取人聲,頻點 i 符合、⑴ β,0 < α < 〇· 5,0· 5 < β < 1 ; α 取 〇· 4,β 取 0· 6。在 不同的實施例中,α、β的取值可以根據實際情況調整。
[0089] 在另外一些用於抑制人聲提取伴奏的實施例中,本步驟實質上為上述步驟相對應 的抑制步驟,即在上述步驟中被抑制的頻點範圍不進行抑制處理,而對上述步驟中沒有進 行抑制的頻點進行抑制處理,這樣被抑制的頻點事實上對應的是人聲頻點,保留下的頻點 對應的是伴奏頻點;相對應的,對公式的參數取值進行調整,公式中頻點(即待衰減的頻 點)i 符合 a < kji) < β,0 < α < 〇· 5, 0· 5 < β < 1。α 取 〇· 4, β 取 0· 6。
[0090] 經過基於幅度比值伴奏抑制(或人聲抑制)之後,將所有幀的頻域信號逆變換為 時域信號,最後連接起來,即可得到純淨的人聲(或伴奏)信號。
[0091] 請參閱圖3,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;與圖2中的該歌曲原始波形對比,可以看出經伴奏抑制 後的時域波形在一定程度上消除了伴奏成分,具體表現為各圖橫坐標約為3s?5s,7s? 8. 5s,10s?12s等處(實際上為歌曲中基本上只有伴奏而沒有人聲的段落)振幅得到一定 的衰減,說明伴奏得到了 一定的抑制。
[0092] 在本發明第二實施方式中,抑制步驟的處理方式與第一實施方式不同;
[0093] 本實施方式中的抑制為基於相位差的抑制,可以用於伴奏抑制,包括步驟:計算左 聲道頻域信號與右聲道頻域信號相應頻點對的相位差,對相位差在預設範圍內的頻點進行 衰減處理。
[0094] 具體做法如下:
[0095] 遍歷所有的巾貞(η = 0, 1,. . .,N-1);每巾貞再遍歷所有的頻率點(i = 0, 1, -,4096);
[0096] 計算左右聲道中所有對應巾貞中相應頻點對的相位差,公式為pn(i) = angel (fft_ frameLn(i))-angel (fft_frameRn(i)),並對相位差差值落在預設範圍的頻點(即待衰減的 頻點)進行抑制,公式為fft_frameR n(i) = 0或fft_frameLn(i) = 0,公式中,i為待衰減 的頻點。
[0097] 相位差值一般位於(-1,1)的範圍;對於人聲信號,該差值接近0 ;對於伴奏信號, 該差值遠離〇而接近-1或1。本實施方式的目的是抑制伴奏提取人聲,頻點i符合ρηα) 爐,-疋<#<0,0<爐<疋,這裡(]5取-〇.1,-取〇.1。在不同的實施例 中,Φ,-的取值可以根據實際情況調整。
[0098] 在另外一些用於抑制人聲提取伴奏的實施例中,本步驟實質上為人聲抑制步驟; 公式中頻點i符合參 </^/)<供,-疋<參<0, 0<爐<7^小取-〇.1,-取〇.1。對於立體聲音 頻而言,一般人聲位於聲場中央,伴奏位於聲場外圍,這樣處理獲得的音頻實際上是去除聲 場中央位置聲音,而保留聲場外圍聲音。
[0099] 請參閱圖4,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;與圖2中的該歌曲原始波形對比,可以看出經提取伴奏 後的時域波形在一定程度上消除了人聲成分,具體表現為各圖橫坐標時間點3s?5s,7s? 8. 5s,10s?12s等處(實際上為歌曲中基本上只有伴奏而沒有人聲的段落)振幅得到一定 衰減,說明伴奏得到了 一定的抑制。
[0100] 在本發明第三實施方式可以用於伴奏抑制,其中,伴奏抑制步驟之外其他步驟的 處理方式與第一實施方式類似;在伴奏抑制步驟中,結合了幅度比值抑制與相位差抑制,其 伴奏抑制步驟的具體做法為:
[0101] 遍歷所有的巾貞(η = 0, 1,…,N-1);每巾貞再遍歷所有的頻率點(i = 0, 1, 2,, 4096);
[0102] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值,公式為kn(i)= absafi^frameRjiD/absafi^frameLji))5^/!!);並對比值落在一定範圍(頻點 i 符 合kji) β,0 < α < 〇·5,0·5 < β < 1 ;α 取0.4, β 取0.6)的頻點 標記為1,表示待衰減的頻點;未落入指定範圍的頻點標記為〇,並將標記值保存至緩存: flagA (i),i = 0, 1,· · · 4096。
[0103] 計算左右聲道中所有對應幀中相應頻點對的相位差,公式為pn(i) = angel (fft_ frameLji))-angel(fft_frameRn(i));並對相位差差值落在一定範圍(i符合pn(i) #-$<#<〇,〇<穸<瓦,這裡Φ取-0. 1,#取0. 1)的頻點標記為1,表 示待衰減的頻點;未落入該範圍的頻點標記為〇,並將標記值保存至緩存:flagB(i), i = 0, 1,…4096。
[0104] 然後,對標記緩存 flagA 與 flagB 作或運算,即 flag(i) = flagA(i) □ flagB(i), i =0, 1. . . 4096 ;然後對所有標記為1的頻點進行抑制,公式為:
[0105] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;其中 i 滿足 flag(i) = = 1,i = 0, 1,2. . . 4096。
[0106] 上述幅度比值計算與相位差計算都是基於原音頻時域信號轉變的頻域信號。對於 原始頻域信號的所有頻點,只要滿足幅度比值的條件與相位差條件中任意一個,就對其進 行抑制。這樣,由於有兩個條件進行篩選,可以減少被遺漏的頻點,使音頻處理的效果更接 近預期。並且,幅度比值抑制與相位差抑制二者可以同時進行,也可以先後進行,先後進行 的話,順序可以調換。
[0107] 請參閱圖5,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的 處理方法提取人聲所得時域波形;與圖2中的該歌曲原始波形對比,可以看出經提取伴奏 後的時域波形在相當程度上消除了人聲成分,具體表現為各圖橫坐標時間點3s?5s,7s? 8. 5s,10s?12s等處(實際上為歌曲中基本上只有伴奏而沒有人聲的段落)振幅得到明顯 衰減,說明伴奏得到了明顯抑制。
[0108] 本實施方式實際上是第一實施方式與第二實施方式中伴奏抑制步驟採取的基於 對左聲道和右聲道所有對應幀中相應頻點對的幅度比值與基於對左聲道和右聲道所有對 應幀中相應頻點對的相位差這兩種處理方法的結合,具有彼此補強增益的作用,因而圖5 與圖3或圖4相比,各圖橫坐標時間點3s?5s,7s?8. 5s,10s?12s等處(實際上為歌 曲中只有伴奏而沒有人聲的段落)振幅得到的衰減更明顯,說明伴奏得到了更為徹底的抑 制。
[0109] 相對於現有技術,例如包括下述步驟的方法:分別將左聲道信號和右聲道信號由 時域信號轉換為頻域信號;依次計算左聲道信號和右聲道信號的相應頻點對的歸一化互相 關值;對左聲道信號和右聲道信號相應頻點對的均值信號加權人聲增益;其中,所述人聲 增益與當前頻點對的歸一化互相關值成正比例取值;將加權人聲增益後的左聲道和右聲道 的均值信號由頻域信號轉換為時域信號,提取出人聲。相比之下,採用上述本發明的方法伴 奏抑制效果更徹底。
[0110] 在本發明第四實施方式中,可以用於人聲抑制,具體的,在人聲抑制時結合了幅度 比值抑制與相位差抑制;本實施方式中對應於第三實施方式中伴奏抑制步驟的是人聲抑制 步驟,做法是去除聲場中央的聲音,而保留聲場周圍的聲音,具體為:
[0111] 遍歷所有的巾貞(η = 0, 1,…,N-1);每巾貞再遍歷所有的頻率點(i = 0, 1, 2,, 4096 ;n = 0, 1, 2,. . . , N-l);
[0112] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值,公式為kn(i)= abs (fft_frameRn(i))/abs (fft_frameLn(i))*(2/ π );並對比值落在預設範圍的頻點標 記為1,表示待衰減的頻點;未落入指定範圍的頻點標記為〇,並將標記值保存至緩存: 打 &8六(1),1=0,1,...4096。本實施例中,比值範圍為:〇<、(1)<@,0<〇<0.5,0.5 < β < 1。α 取 〇· 4, β 取 0· 6。
[0113] 計算左右聲道中所有對應幀中相應頻點對的相位差,公式為pn(i) = angel (fft_ frameLn(i))-angel (fft_frameRn(i));並對相位差差值落在預設範圍的頻點標記為1,表 示待衰減的頻點;未落入該範圍的頻點標記為〇,並將標記值保存至緩存:flagB(i), i = 〇,1,...4〇96。本實施例中,差值範圍:#<凡(/) <0 -疋<0<〇,〇<爐<牙這裡(1)取-〇.1, f 爐取0· 1。
[0114] 然後,對標記緩存 flagA 與 flagB 作或運算,即 flag(i) = flagA(i) □ flagB(i), i =0, 1. . . 4096 ;然後對所有標記為1的頻點進行抑制,公式為:
[0115] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;
[0116] 其中 i 滿足 flag (i) ==1, i=0, 1,2··· 4096。
[0117] 事實上,本實施方式中進行人聲抑制同樣是基於幅度比值和基於相位差兩種抑制 方案的結合,所以與第三實施方式類似地,也可以單獨採取本實施方式中基於幅度比值進 行人聲抑制或基於相位差進行人聲抑制的方案。
[0118] 請參閱圖6,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的處 理方法提取伴奏所得時域波形。
[0119] 由於人聲往往在聲場中央,在左右聲道差異較小;而樂器的伴奏信號往往左右聲 道差異較大。具體地,伴奏在左右兩個聲道中對應的頻點幅值相差較大,而人聲在左右兩個 聲道中對應的頻點幅值相差較小;同時伴奏在左右兩個聲道中的對應頻點相位差值較大, 而人聲在左右兩個聲道中對應的頻點相位差值較小。本發明上述幾種實施方式的原理就是 利用左右聲道之間伴奏與人聲的這種差異性,對伴奏或人聲進行抑制,從而提取人聲或伴 奏,所得到的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
[0120] 請參閱圖7,為本發明另一實施方式中一種立體聲音頻的處理裝置的功能模塊示 意圖。所述裝置包括變換單元1、計算單元2、抑制單元3以及逆變換單元4 ;
[0121] 所述變換單元1用於將左聲道和右聲道的時域信號變換為頻域信號;
[0122] 所述計算單元2用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度 比值,將幅度比值在預設範圍內的頻點列為待衰減的頻點;或用於計算左聲道頻域信號與 右聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內的頻點列為待衰減的頻 佔.
[0123] 所述抑制單元3用於對待衰減的頻點進行衰減處理;
[0124] 所述逆變換單元4用於將經抑制單元處理的頻域信號逆變換為時域信號。
[0125] 進一步地,所述的立體聲音頻的處理裝置中,計算單元2既用於計算左聲道頻域 信號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設範圍內的頻點列為待衰 減的頻點,也用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差 差值在預設範圍內的頻點也列為待衰減的頻點;
[0126] 抑制單元3對待衰減的頻點振幅強度進行衰減處理。
[0127] 進一步地,所述的立體聲音頻的處理裝置中,計算單元2計算所述左聲道頻 域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下屯⑴=abs(fft_ frameRn(i))/abs (fft_framLn(i)) * (2/ π);
[0128] 公式中η = 0, 1,2,…,N-l ;N表示巾貞數;
[0129] i = 0, 1,2, ...,FN/2 ;FN表示傅立葉變換的點數;
[0130] 進一步地,所述的立體聲音頻的處理裝置中,計算單元2計算所述左右聲道相應 頻點對的相位差的公式為:
[0131] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i));
[0132] 公式中n = 0, 1,2, ···,N-l ;N表示巾貞數;
[0133] i = 0, 1,2, ...,FN/2 ;FN表示傅立葉變換的點數;
[0134] 進一步地,所述的立體聲音頻的處理裝置中,所述抑制單元3對待衰減的頻點進 行衰減處理,公式為:fft_frameR n(i) =0或fft_frameLn(i) =0;公式中,i表示待衰減的 頻點。
[0135] 進一步地,所述的立體聲音頻的處理裝置還包括歸一化單元5和分巾貞單元6 ;
[0136] 所述歸一化單兀5用於對左聲道和右聲道的時域信號進行歸一化處理;
[0137] 所述分巾貞單兀6用於將左聲道和右聲道的時域信號分別劃分為若干巾貞,每巾貞包括 預設數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點;
[0138] 進一步地,所述的立體聲音頻的處理裝置還包括濾波單元7,用於對每幀進行加漢 寧窗濾波處理。
[0139] 以下以一具體案例對所述提取音頻信號的裝置的工作原理進行詳細闡述:
[0140] 對一首立體聲歌曲音頻進行提取人聲操作,首先由歸一化單元5分別對該立體聲 歌曲音頻的左聲道和右聲道信號進行歸一化處理,所述歸一化處理的方式是找出信號絕對 值的最大值,將原信號除以該最大值,處理結果是使信號的正負幅值位於-1與+1之間。
[0141] 隨後,分巾貞單兀6分別將歸一化後的左聲道信號和右聲道信號劃分為N個巾貞,每中貞 包括8192個聲音採樣點,並且相鄰幀之間有2048個重合的採樣點。這樣的劃分方式目的 是使幀與幀之間具有平滑過渡的效果。
[0142] 接下來,濾波單元7對劃分後的每個幀進行加漢寧窗濾波處理。本步驟的加漢寧 窗濾波處理能夠有效減少後續時域到頻域的變換過程中可能造成的頻譜洩露。
[0143] 然後,變換單元1對經加窗濾波處理的每幀音頻信號進行從時域到頻域的快速 傅立葉變換(Fast Fourier Transform, FFT),得到表徵左聲道的頻譜:fft_frameRn(i), i =0, 1, 2· · · 4096, η = 0, 1, 2· · · N-1 以及表徵右聲道的頻譜:fft_frameLn(i), i = 0,1,2. ..4096,n = 0,l,2. ..N-1。其中,4096表示傅立葉變換的點數,N表示幀數。本實施 方式中考慮到傅立葉變換的對稱性特徵,為節省計算量,只需要計算8192個聲音採樣點的 一半即可。
[0144] 計算單元2遍歷所有的巾貞(η = 0, 1,. . .,N-1);每巾貞再遍歷所有的頻率點(i = 0, 1,2, ...,4096);計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值,公式為:
[0145] kn(i) = abs (fft_frameRn(i))/abs (fft_frameLn(i)) * (2/π );
[0146] 公式中 n = 0, 1,2,…,N-1 ;i = 0, 1,2, ...,4096。
[0147] 進一步地,計算單元2計算左右聲道中所有對應巾貞中相應頻點對的相位差,公式 pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i));
[0148] 公式中 n = 0, 1,2,…,N-1 ;i = 0, 1,2, ...,4096。
[0149] 接著,篩選出待衰減的頻點,也就是將幅度比值落在一定範圍的頻點(頻點i符 合、⑴ β,0 < α < 〇·5,0·5 < β < 1 ;α 取0.4, β 取0.6)或將相 位差值落在一定範圍的頻點(i符合Pn(i) < Φ或具,,這裡Φ 取-0. 1,f取0. 1)列為待衰減的頻點。
[0150] 然後,抑制單元3對待衰減的頻點進行衰減處理,公式為:
[0151] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;公式中,i 為待衰減的頻點。
[0152] 此外,抑制單元3也可以按預設的比例衰減或衰減至預設的幅度進行衰減處理。
[0153] 在用於提取伴奏抑制人聲時,計算幅度比值和相位差差值時與上述步驟相同,篩 選待衰減的頻點時,將幅度比值落在一定範圍的頻點(i符合a <kn(i) < β,0< α < 0. 5, 0. 5 < β < 1。α取〇. 4, β取0. 6)或將相位差值落在一定範圍的頻點(i符合 #<凡〇')<妗-瓦<#<〇,〇<f<露 β α取0.4, β取0.6)列為待衰減的頻點。對待衰減的頻 點進行衰減的處理也與上述步驟相同。
[0154] 最後,由逆變換單元4將所有幀的頻域信號逆變換為時域信號,並連接起來,即可 得到純淨的人聲(伴奏)信號。
[0155] 由於人聲往往在聲場中央,在左右聲道差異較小;而樂器的伴奏信號往往在左右 聲道差異較大。具體地,伴奏在左右兩個聲道中對應的頻點幅值相差較大,而人聲在左右 兩個聲道中對應的頻點幅值相差較小;同時伴奏在左右兩個聲道中的對應頻點相位差值較 大,而人聲在左右兩個聲道中對應的頻點相位差值較小。本實施方式的原理就是利用左右 聲道之間伴奏與人聲的這種差異性,對伴奏或人聲進行抑制,從而提取人聲或伴奏,所得到 的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
[0156] 上述實施例涉及的方法中的全部或部分步驟可以通過程序來指令相關的硬體來 完成,所述的程序可以存儲於計算機設備可讀取的存儲介質中,用於執行上述各實施例方 法所述的全部或部分步驟。所述計算機設備,例如:個人計算機、伺服器、網絡設備、智能 移動終端、智能家居設備、穿戴式智能設備、車載智能設備等;所述的存儲介質,例如:RAM、 ROM、磁碟、磁帶、光碟、快閃記憶體、U盤、移動硬碟、存儲卡、記憶棒、網絡伺服器存儲、網絡雲存儲 等。
[0157] 以上所述僅為本發明的實施例,並非因此限制本發明的專利保護範圍,凡是利用 本發明說明書及附圖內容所作的等效結構或等效流程變換,或直接或間接運用在其他相關 的【技術領域】,均同理包括在本發明的專利保護範圍內。
【權利要求】
1. 一種立體聲音頻的處理方法,其特徵在於,包括步驟: 分別將左聲道和右聲道的時域信號變換為頻域信號; 利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度 比值,將幅度比值在預設範圍內的頻點列為待衰減的頻點;和/或利用變換得到的頻域信 號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設範圍 內的頻點列為待衰減的頻點; 對待衰減的頻點進行衰減處理; 再將處理後的頻域信號逆變換為時域信號。
2. 如權利要求1所述的立體聲音頻的處理方法,其特徵在於, 計算左右聲道相應頻點對的相位差的公式為: pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i)), 其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜; 公式中η = 0, 1,2,…,N-1 ;N表示巾貞數; i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
3. 如權利要求1所述的立體聲音頻的處理方法,其特徵在於,所述左聲道頻域信號 與右聲道頻域信號相應頻點對的幅度比值計算公式如下:k n(i) = abs(fft_frameRn(i))/ abs(fft_framLn(i))*(2/:n),其中 fft_frameRn(i)與 fft_framLn(i)分別表示右聲道與左 聲道的頻譜; 公式中η = 0, 1,2,…,N-1 ;N表示巾貞數; i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
4. 如權利要求1所述的立體聲音頻的處理方法,其特徵在於,在步驟"分別將左聲道和 右聲道的時域信號變換為頻域信號"之前還包括步驟: 對左聲道和右聲道的時域信號進行歸一化處理; 將左聲道和右聲道的時域信號分別劃分為若干幀,每幀包括預設數量的聲音採樣點, 並且相鄰幀之間有預設數量的重合採樣點; 對每幀進行加漢寧窗濾波處理。
5. -種立體聲音頻的處理裝置,其特徵在於,包括變換單元、計算單元、抑制單元以及 逆變換單元; 所述變換單元用於將左聲道和右聲道的時域信號變換為頻域信號; 所述計算單元用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,將 幅度比值在預設範圍內的頻點列為待衰減的頻點;和/或用於計算左聲道頻域信號與右聲 道頻域信號相應頻點對的相位差,將相位差差值在預設範圍內的頻點列為待衰減的頻點; 所述抑制單元用於對計算單元計算所得待衰減的頻點進行衰減處理; 所述逆變換單元用於將頻域信號逆變換為時域信號。
6. 如權利要求5所述的立體聲音頻的處理裝置,其特徵在於,計算單元用於計算左右 聲道相應頻點對的相位差的公式為: pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i)); 其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜; 公式中η = 0, 1,2,…,N-1 ;N表示巾貞數; i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
7. 如權利要求5所述的立體聲音頻的處理裝置,其特徵在於,所述計算單元用於計算 左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下: kn(i) = abs(fTt_frameRn(i))/abs(fTt_framLn(i))*(2/:n), 其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜; 公式中η = 0, 1, 2,…,N-1 ;N表示巾貞數; i = 0, 1,2,…,FN/2 ;FN表示傅立葉變換的點數。
8. 如權利要求5所述的立體聲音頻的處理裝置,其特徵在於,還包括歸一化單元、分幀 單元和濾波單元; 所述歸一化單元,用於對左聲道和右聲道的時域信號進行歸一化處理; 所述分幀單元,用於將左聲道和右聲道的時域信號分別劃分為若干幀,每幀包括預設 數量的聲音採樣點,並且相鄰幀之間有預設數量的重合採樣點; 所述濾波單元,用於對每幀進行加漢寧窗濾波處理。
【文檔編號】H04S3/00GK104053120SQ201410263446
【公開日】2014年9月17日 申請日期:2014年6月13日 優先權日:2014年6月13日
【發明者】王子亮 申請人:福建星網視易信息系統有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀