一種立體聲音頻的處理方法和裝置製造方法

2023-06-27 19:56:56 6

一種立體聲音頻的處理方法和裝置製造方法
【專利摘要】本發明披露了一種立體聲音頻的處理方法，包括步驟：分別將左聲道和右聲道的時域信號變換為頻域信號；計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點，和/或計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差值，將相位差值在預設範圍內的頻點列為待衰減的頻點；對待衰減的頻點進行衰減；將經上述衰減處理的頻域信號逆變換為時域信號。本發明還披露了實現該方法的一種裝置；利用左右聲道之間伴奏與人聲的特定差異性，對伴奏進行抑制，從而增強人聲，或對人聲進行抑制從而提取伴奏。所得到的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
【專利說明】一種立體聲音頻的處理方法和裝置

【技術領域】
[0001] 本發明涉及音頻處理領域，更具體地涉及一種立體聲音頻的處理方法和裝置。

【背景技術】
[0002] 從立體聲中將人聲和伴奏分離的技術在音頻處理領域有重要而廣泛的應用，例如歌詞的自動識別和校正，就需要以先期的人聲分離作為基礎來進行。歌詞自動識別通常要求輸入處理系統的是單獨的人聲，有伴奏幹擾的情況下很難完成，但因為大多數歌曲都同時包含歌聲與樂器伴奏，直接進行是不實際的。
[0003] 現有技術中涉及從歌曲中提取伴奏、提取人聲或分離伴奏和人聲的方法往往利用的是多數立體聲歌曲中人聲在左右兩個聲道中基本相同的特點，例如，採用將兩個聲道中的信號直接對減的方法來消除人聲。從歌曲中提取人聲的研究還相對較少。其中，利用立體聲歌曲左右聲道信號之間的相關性來提取人聲或伴奏是立體聲音頻研究的一個重要方向。
[0004] 一種現有的基於立體聲相關聲道提取人聲的技術是對左右聲道相應頻點對的均值信號加權人聲增益，人聲增益與當前頻點對的歸一化互相關值成正比例取值；將加權人聲增益後的左聲道和右聲道的均值信號由頻域轉換為時域提取出人聲。該方法僅僅利用互相關這一特性來區分伴奏與人聲，雖然可以一定程度地抑制伴奏，但結果會殘餘伴奏。
[0005] 因此，如何較大程度地抑制伴奏或人聲部分，成為本領域人員迫切解決的一個技術問題。

【發明內容】

[0006] 為此，需要提供一種準確有效地提取音場中不同區域的音頻信號的方法和技術。
[0007] 為實現上述目的，發明人提供的技術方案如下：
[0008] -種立體聲音頻的處理方法，包括步驟：
[0009] 分別將左聲道和右聲道的時域信號變換為頻域信號；
[0010] 利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點；
[0011] 對待衰減的頻點進行衰減處理；
[0012] 將處理後的頻域信號逆變換為時域信號。
[0013] 進一步地，所述的立體聲音頻的處理方法還包括步驟：利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點也列為待衰減的頻點。
[0014] 發明人還提供了另一種立體聲音頻的處理方法，包括步驟：
[0015] 分別將左聲道和右聲道的時域信號變換為頻域信號；
[0016] 利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點列為待衰減的頻點。對待衰減的頻點進行衰減處理；
[0017] 再將處理後的頻域信號逆變換為時域信號。
[0018] 進一步地，所述的立體聲音頻的處理方法還包括步驟：利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點也列為待衰減的頻點；
[0019] 在應用上述方法的各實施例中，當只選擇一個條件（幅度比值或相位差）時，可以遍歷所有頻點，當滿足該條件時，直接對該頻點進行衰減處理；當選擇多個條件（幅度比值與相位差）時，可以先篩選出所有符合條件的頻點，然後一併對這些頻點進行衰減處理，t匕如，先按不同的條件篩選出各自的頻點集合，然後將這些集合取併集，從而得到所有待衰減的點；再比如，先以某個條件篩選出符合條件的頻點集合，然後以其他條件篩選，如果有新的符合條件的頻點，再加入之前那個頻點集合，從而得到所有待衰減的點。
[0020] 進一步地，所述的立體聲音頻的處理方法中，所述左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下：k n(i) = abs(fft_frameRn(i))/abs(fft_ framLn(i))*(2/：n);其中fft_frameRji)與€代_^^1111^;〇分別表示右聲道與左聲道的頻譜；
[0021] 公式中η = 0, 1，2,…，N-1 ;N表示巾貞數；
[0022] i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
[0023] 並將幅度比值在預設範圍內的頻點列為待衰減的頻點。
[0024] 進一步地，所述的立體聲音頻的處理方法中，計算左右聲道相應頻點對的相位差的公式為：
[0025] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i));其中 fft_frameRn(i) 與fft_framLn(i)分別表示右聲道與左聲道的頻譜；
[0026] 公式中η = 0, 1，2,…，N-1 ;N表示巾貞數；
[0027] i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
[0028] 並將相位差差值在預設範圍內的頻點也列為待衰減的頻點。
[0029] 進一步地，所述的立體聲音頻的處理方法中，對待衰減的頻點作衰減處理公式為： fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;公式中，i 為待衰減的頻點。
[0030] 進一步地，所述的立體聲音頻的處理方法中，在步驟"分別將左聲道和右聲道的時域信號變換為頻域信號"之前還包括步驟：
[0031] 對左聲道和右聲道的時域信號進行歸一化處理；
[0032] 將左聲道和右聲道的時域信號分別劃分為若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點。
[0033] 進一步地，所述的立體聲音頻的處理方法中，在步驟"將左聲道和右聲道的時域信號分別劃分為若干幀"之後以及步驟"分別將左聲道和右聲道的時域信號變換為頻域信號" 之前還包括步驟：
[0034] 對每幀進行加漢寧窗濾波處理。
[0035] -種立體聲音頻的處理裝置，包括變換單元、計算單元、抑制單元以及逆變換單元；
[0036] 所述變換單元用於將左聲道和右聲道的時域信號變換為頻域信號；
[0037] 所述計算單元用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點；或用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點列為待衰減的頻佔.
[0038] 所述抑制單元用於對待衰減的頻點進行衰減處理；
[0039] 所述逆變換單元用於將頻域信號逆變換為時域信號。
[0040] 進一步地，所述的立體聲音頻的處理裝置中，計算單元既用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點，也用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點也列為待衰減的頻點。
[0041] 進一步地，所述的立體聲音頻的處理裝置中，計算單元計算所述左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下：k n(i) = abs(fft_frameRn(i))/ abs (fft_framLn(i)) * (2/π )；
[0042] 公式中η = 0, 1，2,…，N-l ;N表示巾貞數；
[0043] i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數；
[0044] 進一步地，所述的立體聲音頻的處理裝置中，計算單元計算左右聲道相應頻點對的相位差的公式為：
[0045] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i))；
[0046] 公式中n = 0, 1，2, ···，N-l ;N表示巾貞數；
[0047] i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數；
[0048] 進一步地，所述的立體聲音頻的處理裝置中，抑制單元對待衰減的頻點進行衰減處理，公式為：fft_frameR n(i) = 0或fft_frameLn(i) = 0 ;公式中，i表示待衰減的頻點。
[0049] 進一步地，所述的立體聲音頻的處理裝置還包括歸一化單元和分巾貞單元；
[0050] 所述歸一化單兀用於對左聲道和右聲道的時域信號進行歸一化處理；
[0051] 所述分幀單元用於將左聲道和右聲道的時域信號分別劃分為若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；
[0052] 進一步地，所述的立體聲音頻的處理裝置還包括濾波單元，用於對每幀進行加漢寧窗濾波處理。
[0053] 本發明利用左右聲道之間伴奏與人聲的特定差異性，對伴奏（人聲）進行抑制，從而提取人聲（伴奏），所得到的處理結果能夠為對歌曲中人聲（伴奏）信息的分析奠定良好的基礎。

【專利附圖】

【附圖說明】
[0054] 圖1為本發明第一實施方式所述立體聲音頻的處理方法的流程圖；
[0055] 圖2為立體聲歌曲《wonderful world》的時域波形；
[0056] 圖3為立體聲歌曲《wonderful world》經本發明第一實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；
[0057] 圖4為立體聲歌曲《wonderful world》經本發明第二實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；
[0058] 圖5為立體聲歌曲《wonderful world》經本發明第三實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；
[0059] 圖6為立體聲歌曲《wonderful world》經本發明第四實施方式所述立體聲音頻的處理方法提取伴奏所得時域波形；
[0060] 圖7為本發明第三實施方式中一種立體聲音頻的處理裝置的功能模塊示意圖。
[0061] 附圖標記說明：
[0062] 1-變換單元
[0063] 2-計算單元
[0064] 3-抑制單元
[0065] 4-逆變換單元
[0066] 5-歸一化單元
[0067] 6-分幀單元
[0068] 7-濾波單元

【具體實施方式】
[0069] 為詳細說明本發明的技術內容、構造特徵、所實現目的及效果，以下結合實施方式並配合附圖詳予說明。
[0070] 請參閱圖1，為本發明第一實施方式中一種立體聲音頻的處理方法的流程圖；所述方法包括步驟：
[0071] S1、對左聲道和右聲道的時域信號進行歸一化處理；
[0072] S2、將經歸一化處理的左聲道和右聲道的時域信號分別劃分為若干巾貞，每巾貞包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；
[0073] S3、對每幀進行加漢寧窗濾波處理；
[0074] S4、將經濾波處理後的每幀時域信號變換為頻域信號；
[0075] S5、計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，對幅度比值在預設範圍內的頻點列為待衰減的頻點，並將待衰減的頻點進行衰減處理；
[0076] S6、將經衰減處理的頻域信號逆變換為時域信號；
[0077] S7、連接經逆變換的每幀時域信號。
[0078] 以下以一具體案例對本方法流程進行詳細闡述：
[0079] 對一首立體聲歌曲音頻進行處理，首先分別對該立體聲歌曲音頻的左聲道和右聲道信號進行歸一化處理，所述歸一化處理的方式是找出信號絕對值的最大值，將原信號除以該最大值，處理結果是使信號的正負幅值位於-1與+1之間。
[0080] 隨後，分別將歸一化後的左聲道信號和右聲道信號劃分為N個巾貞，每巾貞包括8192 個聲音採樣點，並且相鄰幀之間有2048個重合的採樣點。這樣的劃分方式目的是使幀與幀之間具有平滑過渡的效果。
[0081] 接下來，對劃分後的每個幀進行加漢寧窗濾波處理。本步驟的加漢寧窗濾波處理能夠有效減少後續時域到頻域的變換過程中可能造成的頻譜洩露。
[0082] 然後，對經加窗濾波處理的每幀音頻信號進行8192個點的快速傅立葉變換（Fast Fourier Transform, FFT)，得到表徵右聲道的頻譜：fft_frameRn(i)以及表徵左聲道的頻譜：fft_frameL n(i)。其中，i = 0, 1，2, · · ·，4096 ;n = 0, 1，2, · · ·，N-1。4096 表示傅立葉變換的點數的一半，N表示幀數。本實施方式利用傅立葉變換的對稱性特徵，為節省計算量，只需要計算傅立葉變換點數的一半。
[0083] 繼而進行的是伴奏抑制步驟。
[0084] 本實施方式中的抑制為基於幅度比值的抑制，可以用於伴奏抑制，包括步驟：計算左聲道頻域信號與右聲道頻域信號所有幀相應頻點對的幅度比值，對幅度比值在預設範圍內的頻點進行衰減處理。
[0085] 具體做法如下：
[0086] 遍歷所有的巾貞（η = 0, 1，…，N-1);每巾貞再遍歷所有的頻率點（i = 0, 1, 2,, 4096)；
[0087] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值，公式為kn(i)= abs(fft_frameRn(i))/abs(fft_frameLn(i))*(2/3i)，並對比值落在預設範圍的頻點進行抑制，上述比值落在預設範圍的頻點即為待衰減的頻點，衰減的公式為fft_frameR n(i) = 0 或fft_frameLji) = 0,公式中，i為待衰減的頻點。
[0088] 幅度比值一般在（0, 1)的範圍內，對於人聲信號，該比值在0. 5左右；對於伴奏信號，該比值一般遠離〇. 5而接近0或接近1。本實施方式的目的是抑制伴奏提取人聲，頻點 i 符合、⑴ β，0 < α < 〇· 5,0· 5 < β < 1 ; α 取〇· 4，β 取 0· 6。在不同的實施例中，α、β的取值可以根據實際情況調整。
[0089] 在另外一些用於抑制人聲提取伴奏的實施例中，本步驟實質上為上述步驟相對應的抑制步驟，即在上述步驟中被抑制的頻點範圍不進行抑制處理，而對上述步驟中沒有進行抑制的頻點進行抑制處理，這樣被抑制的頻點事實上對應的是人聲頻點，保留下的頻點對應的是伴奏頻點；相對應的，對公式的參數取值進行調整，公式中頻點（即待衰減的頻點）i 符合 a < kji) < β，0 < α < 〇· 5, 0· 5 < β < 1。α 取〇· 4, β 取 0· 6。
[0090] 經過基於幅度比值伴奏抑制（或人聲抑制）之後，將所有幀的頻域信號逆變換為時域信號，最後連接起來，即可得到純淨的人聲（或伴奏）信號。
[0091] 請參閱圖3,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；與圖2中的該歌曲原始波形對比，可以看出經伴奏抑制後的時域波形在一定程度上消除了伴奏成分，具體表現為各圖橫坐標約為3s?5s，7s? 8. 5s，10s?12s等處（實際上為歌曲中基本上只有伴奏而沒有人聲的段落）振幅得到一定的衰減，說明伴奏得到了一定的抑制。
[0092] 在本發明第二實施方式中，抑制步驟的處理方式與第一實施方式不同；
[0093] 本實施方式中的抑制為基於相位差的抑制，可以用於伴奏抑制，包括步驟：計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，對相位差在預設範圍內的頻點進行衰減處理。
[0094] 具體做法如下：
[0095] 遍歷所有的巾貞（η = 0, 1，. . .，N-1);每巾貞再遍歷所有的頻率點（i = 0, 1, -,4096)；
[0096] 計算左右聲道中所有對應巾貞中相應頻點對的相位差，公式為pn(i) = angel (fft_ frameLn(i))-angel (fft_frameRn(i))，並對相位差差值落在預設範圍的頻點（即待衰減的頻點）進行抑制，公式為fft_frameR n(i) = 0或fft_frameLn(i) = 0,公式中，i為待衰減的頻點。
[0097] 相位差值一般位於（-1，1)的範圍；對於人聲信號，該差值接近0 ;對於伴奏信號，該差值遠離〇而接近-1或1。本實施方式的目的是抑制伴奏提取人聲，頻點i符合ρηα) 爐，-疋<#<0,0<爐<疋，這裡（]5取-〇.1，-取〇.1。在不同的實施例中，Φ，-的取值可以根據實際情況調整。
[0098] 在另外一些用於抑制人聲提取伴奏的實施例中，本步驟實質上為人聲抑制步驟；公式中頻點i符合參 </^/)<供，-疋<參<0, 0<爐<7^小取-〇.1，-取〇.1。對於立體聲音頻而言，一般人聲位於聲場中央，伴奏位於聲場外圍，這樣處理獲得的音頻實際上是去除聲場中央位置聲音，而保留聲場外圍聲音。
[0099] 請參閱圖4,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；與圖2中的該歌曲原始波形對比，可以看出經提取伴奏後的時域波形在一定程度上消除了人聲成分，具體表現為各圖橫坐標時間點3s?5s，7s? 8. 5s，10s?12s等處（實際上為歌曲中基本上只有伴奏而沒有人聲的段落）振幅得到一定衰減，說明伴奏得到了一定的抑制。
[0100] 在本發明第三實施方式可以用於伴奏抑制，其中，伴奏抑制步驟之外其他步驟的處理方式與第一實施方式類似；在伴奏抑制步驟中，結合了幅度比值抑制與相位差抑制，其伴奏抑制步驟的具體做法為：
[0101] 遍歷所有的巾貞（η = 0, 1，…，N-1);每巾貞再遍歷所有的頻率點（i = 0, 1, 2,, 4096)；
[0102] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值，公式為kn(i)= absafi^frameRjiD/absafi^frameLji))5^/!!);並對比值落在一定範圍（頻點 i 符合kji) β，0 < α < 〇·5,0·5 < β < 1 ;α 取0.4, β 取0.6)的頻點標記為1，表示待衰減的頻點；未落入指定範圍的頻點標記為〇,並將標記值保存至緩存： flagA (i)，i = 0, 1，· · · 4096。
[0103] 計算左右聲道中所有對應幀中相應頻點對的相位差，公式為pn(i) = angel (fft_ frameLji))-angel(fft_frameRn(i));並對相位差差值落在一定範圍（i符合pn(i) #-$<#<〇,〇<穸<瓦，這裡Φ取-0. 1，#取0. 1)的頻點標記為1，表示待衰減的頻點；未落入該範圍的頻點標記為〇,並將標記值保存至緩存：flagB(i), i = 0, 1，…4096。
[0104] 然後，對標記緩存 flagA 與 flagB 作或運算，即 flag(i) = flagA(i) □ flagB(i), i =0, 1. . . 4096 ;然後對所有標記為1的頻點進行抑制，公式為：
[0105] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;其中 i 滿足 flag(i) = = 1，i = 0, 1，2. . . 4096。
[0106] 上述幅度比值計算與相位差計算都是基於原音頻時域信號轉變的頻域信號。對於原始頻域信號的所有頻點，只要滿足幅度比值的條件與相位差條件中任意一個，就對其進行抑制。這樣，由於有兩個條件進行篩選，可以減少被遺漏的頻點，使音頻處理的效果更接近預期。並且，幅度比值抑制與相位差抑制二者可以同時進行，也可以先後進行，先後進行的話，順序可以調換。
[0107] 請參閱圖5,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的處理方法提取人聲所得時域波形；與圖2中的該歌曲原始波形對比，可以看出經提取伴奏後的時域波形在相當程度上消除了人聲成分，具體表現為各圖橫坐標時間點3s?5s，7s? 8. 5s，10s?12s等處（實際上為歌曲中基本上只有伴奏而沒有人聲的段落）振幅得到明顯衰減，說明伴奏得到了明顯抑制。
[0108] 本實施方式實際上是第一實施方式與第二實施方式中伴奏抑制步驟採取的基於對左聲道和右聲道所有對應幀中相應頻點對的幅度比值與基於對左聲道和右聲道所有對應幀中相應頻點對的相位差這兩種處理方法的結合，具有彼此補強增益的作用，因而圖5 與圖3或圖4相比，各圖橫坐標時間點3s?5s，7s?8. 5s，10s?12s等處（實際上為歌曲中只有伴奏而沒有人聲的段落）振幅得到的衰減更明顯，說明伴奏得到了更為徹底的抑制。
[0109] 相對於現有技術，例如包括下述步驟的方法：分別將左聲道信號和右聲道信號由時域信號轉換為頻域信號；依次計算左聲道信號和右聲道信號的相應頻點對的歸一化互相關值；對左聲道信號和右聲道信號相應頻點對的均值信號加權人聲增益；其中，所述人聲增益與當前頻點對的歸一化互相關值成正比例取值；將加權人聲增益後的左聲道和右聲道的均值信號由頻域信號轉換為時域信號，提取出人聲。相比之下，採用上述本發明的方法伴奏抑制效果更徹底。
[0110] 在本發明第四實施方式中，可以用於人聲抑制，具體的，在人聲抑制時結合了幅度比值抑制與相位差抑制；本實施方式中對應於第三實施方式中伴奏抑制步驟的是人聲抑制步驟，做法是去除聲場中央的聲音，而保留聲場周圍的聲音，具體為：
[0111] 遍歷所有的巾貞（η = 0, 1，…，N-1);每巾貞再遍歷所有的頻率點（i = 0, 1, 2,, 4096 ；n = 0, 1, 2,. . . , N-l)；
[0112] 計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值，公式為kn(i)= abs (fft_frameRn(i))/abs (fft_frameLn(i))*(2/ π );並對比值落在預設範圍的頻點標記為1，表示待衰減的頻點；未落入指定範圍的頻點標記為〇,並將標記值保存至緩存：打 &8六(1)，1=0，1，...4096。本實施例中，比值範圍為：〇<、(1)<@，0<〇<0.5,0.5 < β < 1。α 取〇· 4, β 取 0· 6。
[0113] 計算左右聲道中所有對應幀中相應頻點對的相位差，公式為pn(i) = angel (fft_ frameLn(i))-angel (fft_frameRn(i));並對相位差差值落在預設範圍的頻點標記為1,表示待衰減的頻點；未落入該範圍的頻點標記為〇,並將標記值保存至緩存：flagB(i), i = 〇，1，...4〇96。本實施例中，差值範圍：#<凡(/) <0 -疋<0<〇,〇<爐<牙這裡（1)取-〇.1, f 爐取0· 1。
[0114] 然後，對標記緩存 flagA 與 flagB 作或運算，即 flag(i) = flagA(i) □ flagB(i), i =0, 1. . . 4096 ;然後對所有標記為1的頻點進行抑制，公式為：
[0115] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;
[0116] 其中 i 滿足 flag (i) ==1, i=0, 1,2··· 4096。
[0117] 事實上，本實施方式中進行人聲抑制同樣是基於幅度比值和基於相位差兩種抑制方案的結合，所以與第三實施方式類似地，也可以單獨採取本實施方式中基於幅度比值進行人聲抑制或基於相位差進行人聲抑制的方案。
[0118] 請參閱圖6,為立體聲歌曲《wonderful world》經本實施方式所述立體聲音頻的處理方法提取伴奏所得時域波形。
[0119] 由於人聲往往在聲場中央，在左右聲道差異較小；而樂器的伴奏信號往往左右聲道差異較大。具體地，伴奏在左右兩個聲道中對應的頻點幅值相差較大，而人聲在左右兩個聲道中對應的頻點幅值相差較小；同時伴奏在左右兩個聲道中的對應頻點相位差值較大，而人聲在左右兩個聲道中對應的頻點相位差值較小。本發明上述幾種實施方式的原理就是利用左右聲道之間伴奏與人聲的這種差異性，對伴奏或人聲進行抑制，從而提取人聲或伴奏，所得到的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
[0120] 請參閱圖7,為本發明另一實施方式中一種立體聲音頻的處理裝置的功能模塊示意圖。所述裝置包括變換單元1、計算單元2、抑制單元3以及逆變換單元4 ;
[0121] 所述變換單元1用於將左聲道和右聲道的時域信號變換為頻域信號；
[0122] 所述計算單元2用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點；或用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點列為待衰減的頻佔.
[0123] 所述抑制單元3用於對待衰減的頻點進行衰減處理；
[0124] 所述逆變換單元4用於將經抑制單元處理的頻域信號逆變換為時域信號。
[0125] 進一步地，所述的立體聲音頻的處理裝置中，計算單元2既用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點，也用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點也列為待衰減的頻點；
[0126] 抑制單元3對待衰減的頻點振幅強度進行衰減處理。
[0127] 進一步地，所述的立體聲音頻的處理裝置中，計算單元2計算所述左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下屯⑴=abs(fft_ frameRn(i))/abs (fft_framLn(i)) * (2/ π)；
[0128] 公式中η = 0, 1，2,…，N-l ;N表示巾貞數；
[0129] i = 0, 1，2, ...，FN/2 ;FN表示傅立葉變換的點數；
[0130] 進一步地，所述的立體聲音頻的處理裝置中，計算單元2計算所述左右聲道相應頻點對的相位差的公式為：
[0131] pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i))；
[0132] 公式中n = 0, 1，2, ···，N-l ;N表示巾貞數；
[0133] i = 0, 1，2, ...，FN/2 ;FN表示傅立葉變換的點數；
[0134] 進一步地，所述的立體聲音頻的處理裝置中，所述抑制單元3對待衰減的頻點進行衰減處理，公式為：fft_frameR n(i) =0或fft_frameLn(i) =0;公式中，i表示待衰減的頻點。
[0135] 進一步地,所述的立體聲音頻的處理裝置還包括歸一化單元5和分巾貞單元6 ;
[0136] 所述歸一化單兀5用於對左聲道和右聲道的時域信號進行歸一化處理；
[0137] 所述分巾貞單兀6用於將左聲道和右聲道的時域信號分別劃分為若干巾貞，每巾貞包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；
[0138] 進一步地，所述的立體聲音頻的處理裝置還包括濾波單元7,用於對每幀進行加漢寧窗濾波處理。
[0139] 以下以一具體案例對所述提取音頻信號的裝置的工作原理進行詳細闡述：
[0140] 對一首立體聲歌曲音頻進行提取人聲操作，首先由歸一化單元5分別對該立體聲歌曲音頻的左聲道和右聲道信號進行歸一化處理，所述歸一化處理的方式是找出信號絕對值的最大值，將原信號除以該最大值，處理結果是使信號的正負幅值位於-1與+1之間。
[0141] 隨後，分巾貞單兀6分別將歸一化後的左聲道信號和右聲道信號劃分為N個巾貞，每中貞包括8192個聲音採樣點，並且相鄰幀之間有2048個重合的採樣點。這樣的劃分方式目的是使幀與幀之間具有平滑過渡的效果。
[0142] 接下來，濾波單元7對劃分後的每個幀進行加漢寧窗濾波處理。本步驟的加漢寧窗濾波處理能夠有效減少後續時域到頻域的變換過程中可能造成的頻譜洩露。
[0143] 然後，變換單元1對經加窗濾波處理的每幀音頻信號進行從時域到頻域的快速傅立葉變換（Fast Fourier Transform, FFT)，得到表徵左聲道的頻譜：fft_frameRn(i), i =0, 1, 2· · · 4096, η = 0, 1, 2· · · N-1 以及表徵右聲道的頻譜：fft_frameLn(i), i = 0，1，2. ..4096，n = 0，l，2. ..N-1。其中，4096表示傅立葉變換的點數，N表示幀數。本實施方式中考慮到傅立葉變換的對稱性特徵，為節省計算量，只需要計算8192個聲音採樣點的一半即可。
[0144] 計算單元2遍歷所有的巾貞（η = 0, 1，. . .，N-1);每巾貞再遍歷所有的頻率點（i = 0, 1，2, ...，4096);計算左聲道和右聲道所有對應幀中相應頻點對的幅度比值，公式為：
[0145] kn(i) = abs (fft_frameRn(i))/abs (fft_frameLn(i)) * (2/π )；
[0146] 公式中 n = 0, 1，2,…，N-1 ;i = 0, 1，2, ...，4096。
[0147] 進一步地，計算單元2計算左右聲道中所有對應巾貞中相應頻點對的相位差，公式 pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i))；
[0148] 公式中 n = 0, 1，2,…，N-1 ;i = 0, 1，2, ...，4096。
[0149] 接著，篩選出待衰減的頻點，也就是將幅度比值落在一定範圍的頻點（頻點i符合、⑴ β，0 < α < 〇·5,0·5 < β < 1 ;α 取0.4, β 取0.6)或將相位差值落在一定範圍的頻點（i符合Pn(i) < Φ或具,，這裡Φ 取-0. 1，f取0. 1)列為待衰減的頻點。
[0150] 然後，抑制單元3對待衰減的頻點進行衰減處理，公式為：
[0151] fft_frameRn(i) = 0 或 fft_frameLn(i) = 0 ;公式中，i 為待衰減的頻點。
[0152] 此外，抑制單元3也可以按預設的比例衰減或衰減至預設的幅度進行衰減處理。
[0153] 在用於提取伴奏抑制人聲時，計算幅度比值和相位差差值時與上述步驟相同，篩選待衰減的頻點時，將幅度比值落在一定範圍的頻點（i符合a <kn(i) < β，0< α < 0. 5, 0. 5 < β < 1。α取〇. 4, β取0. 6)或將相位差值落在一定範圍的頻點（i符合 #<凡〇')<妗-瓦<#<〇,〇<f<露 β α取0.4, β取0.6)列為待衰減的頻點。對待衰減的頻點進行衰減的處理也與上述步驟相同。
[0154] 最後，由逆變換單元4將所有幀的頻域信號逆變換為時域信號，並連接起來，即可得到純淨的人聲（伴奏）信號。
[0155] 由於人聲往往在聲場中央，在左右聲道差異較小；而樂器的伴奏信號往往在左右聲道差異較大。具體地，伴奏在左右兩個聲道中對應的頻點幅值相差較大，而人聲在左右兩個聲道中對應的頻點幅值相差較小；同時伴奏在左右兩個聲道中的對應頻點相位差值較大，而人聲在左右兩個聲道中對應的頻點相位差值較小。本實施方式的原理就是利用左右聲道之間伴奏與人聲的這種差異性，對伴奏或人聲進行抑制，從而提取人聲或伴奏，所得到的處理結果能夠為對歌曲中人聲或伴奏信息的分析奠定良好的基礎。
[0156] 上述實施例涉及的方法中的全部或部分步驟可以通過程序來指令相關的硬體來完成，所述的程序可以存儲於計算機設備可讀取的存儲介質中，用於執行上述各實施例方法所述的全部或部分步驟。所述計算機設備，例如：個人計算機、伺服器、網絡設備、智能移動終端、智能家居設備、穿戴式智能設備、車載智能設備等；所述的存儲介質，例如：RAM、 ROM、磁碟、磁帶、光碟、快閃記憶體、U盤、移動硬碟、存儲卡、記憶棒、網絡伺服器存儲、網絡雲存儲等。
[0157] 以上所述僅為本發明的實施例，並非因此限制本發明的專利保護範圍，凡是利用本發明說明書及附圖內容所作的等效結構或等效流程變換，或直接或間接運用在其他相關的【技術領域】，均同理包括在本發明的專利保護範圍內。
【權利要求】
1. 一種立體聲音頻的處理方法，其特徵在於，包括步驟：分別將左聲道和右聲道的時域信號變換為頻域信號；利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點；和/或利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點列為待衰減的頻點；對待衰減的頻點進行衰減處理；再將處理後的頻域信號逆變換為時域信號。
2. 如權利要求1所述的立體聲音頻的處理方法，其特徵在於，計算左右聲道相應頻點對的相位差的公式為： pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i)), 其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜；公式中η = 0, 1，2,…，N-1 ;N表示巾貞數； i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
3. 如權利要求1所述的立體聲音頻的處理方法，其特徵在於，所述左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下：k n(i) = abs(fft_frameRn(i))/ abs(fft_framLn(i))*(2/：n)，其中 fft_frameRn(i)與 fft_framLn(i)分別表示右聲道與左聲道的頻譜；公式中η = 0, 1，2,…，N-1 ;N表示巾貞數； i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
4. 如權利要求1所述的立體聲音頻的處理方法，其特徵在於，在步驟"分別將左聲道和右聲道的時域信號變換為頻域信號"之前還包括步驟：對左聲道和右聲道的時域信號進行歸一化處理；將左聲道和右聲道的時域信號分別劃分為若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；對每幀進行加漢寧窗濾波處理。
5. -種立體聲音頻的處理裝置，其特徵在於，包括變換單元、計算單元、抑制單元以及逆變換單元；所述變換單元用於將左聲道和右聲道的時域信號變換為頻域信號；所述計算單元用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值，將幅度比值在預設範圍內的頻點列為待衰減的頻點；和/或用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差，將相位差差值在預設範圍內的頻點列為待衰減的頻點；所述抑制單元用於對計算單元計算所得待衰減的頻點進行衰減處理；所述逆變換單元用於將頻域信號逆變換為時域信號。
6. 如權利要求5所述的立體聲音頻的處理裝置，其特徵在於，計算單元用於計算左右聲道相應頻點對的相位差的公式為： pn(i) = angel (fft_frameLn(i))-angel (fft_frameRn(i))；其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜；公式中η = 0, 1，2,…，N-1 ;N表示巾貞數； i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
7. 如權利要求5所述的立體聲音頻的處理裝置，其特徵在於，所述計算單元用於計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下： kn(i) = abs(fTt_frameRn(i))/abs(fTt_framLn(i))*(2/：n), 其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜；公式中η = 0, 1, 2,…，N-1 ;N表示巾貞數； i = 0, 1，2,…，FN/2 ;FN表示傅立葉變換的點數。
8. 如權利要求5所述的立體聲音頻的處理裝置，其特徵在於，還包括歸一化單元、分幀單元和濾波單元；所述歸一化單元，用於對左聲道和右聲道的時域信號進行歸一化處理；所述分幀單元，用於將左聲道和右聲道的時域信號分別劃分為若干幀，每幀包括預設數量的聲音採樣點，並且相鄰幀之間有預設數量的重合採樣點；所述濾波單元，用於對每幀進行加漢寧窗濾波處理。
【文檔編號】H04S3/00GK104053120SQ201410263446
【公開日】2014年9月17日申請日期:2014年6月13日優先權日:2014年6月13日
【發明者】王子亮申請人:福建星網視易信息系統有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種立體聲音頻的處理方法和裝置製造方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法