校正相差的聲音處理裝置和方法

2023-04-28 10:28:31 6

專利名稱：校正相差的聲音處理裝置和方法
技術領域：
本發明涉及一種將多個聲音接收單元接收的聲音轉換為處理過的聲音信號的聲音處理裝置。更進一步，本發明涉及一種校正所述聲音信號之間的相差的聲音處理裝置、方法以及存儲電腦程式的計算機可讀存儲介質。
背景技術：
已經對使用多個麥克風的、用於例如識別聲音來源方向的各種聲音處理裝置進行了研究並投入實際使用。下面將描述這些裝置中的一種。圖11是
示出聲音處理裝置外形的透視圖。在圖11中，內置有聲音處理裝置1000的手機外殼的形狀是長方體，使用手機的聲音處理裝置1000具有外殼(casing) 1001。用於接收講話者發出的語音的第一麥克風1002安置在外殼1001的前面。此外，第二麥克風1003安置在外殼1001的底部。
從各個方向接收聲音並且對與第一麥克風1002和第二麥克風1003接收的聲音之間的時差對應的相差進行處理，聲音處理裝置1000基於相差識別聲音傳來的方向。然後，聲音處理裝置1000通過執行處理而實現期望的方向性特徵，所述處理例如是根據聲音傳來的方向來抑制由第一麥克風1002 接收的聲音。
如圖11所示的聲音處理裝置1000要求麥克風具有相同的特徵，例如，相同的靈敏度。圖12是示出聲音處理裝置1000的方向性測量結果的雷達圖。圖12的雷達圖示出，在聲音處理裝置1000的第一麥克風1002接收到的聲音在聲音傳來的每個方向被抑制之後的聲音的信號功率(dB)。這裡，圖 12中使用了指示方向的方位角(azimuth)，也即，當聲音從在聲音處理裝置1000中設置的第一麥克風1002所在的外殼1001的前面傳來時，方位角定義為0°。當聲音來自右面時，方位角定義為90。，當聲音來自後面時，方位角定義為180°,以及當聲音來自左面時，方位角定義為270。。在圖12中每個方向以環繞雷達圖的"度數(degree)"來顯示，其中實線指示在第一
麥克風1002的靈敏度和第二麥克風1003的靈敏度相同時每個方向中信號功率的狀態1;虛線指示在第一麥克風1002的靈敏度高於第二麥克風1003的靈敏度時信號功率的狀態2;交替的長短點劃線指示在第二麥克風1003的靈敏度高於第一麥克風1002的靈敏度時信號功率的狀態3。當期望的是第一麥克風1002的靈敏度和第二麥克風1003的靈敏度相同情況下的狀態1的方向性時，在狀態2和狀態3的90°、 270°和180。方向上的方向性彼此有很大不同。也即，根據麥克風的靈敏度，方向性變化的尺度很大。
麥克風之間個體的差別影響著聲音處理裝置的特徵，如圖12所示。但是，通常生產的麥克風在預定規格內會具有個體的不同，例如靈敏度差別。為了調整麥克風以使它們的特徵相同，提出了解決該問題的方法，例如，日本公開專利申請No. 2002-99297和2004-343700，其中使用在與多個麥克風相同距離的位置處產生的訓練(teacher)信號。

發明內容
但是，所提出的方法應該應用到在聲音處理裝置中設置的每對麥克風中。也即，為每個聲音處理裝置設置每對麥克風。因此增加了生產聲音處理裝置的費用。此外，封裝之後，所提出的方法難以應對特徵的改變，例如隨著產品壽命而產生的磨損，因此麥克風的特徵將彼此不同。
因此，本發明的一個目標是以低生產成本提供一種裝置，能夠校正包含在裝置中的多個麥克風的靈敏度變化，以及能夠校正隨產品壽命而產生的磨損所引起的特徵改變。
根據本發明的實施例，提供能夠從多個麥克風接收伴隨時間的聲音信號的裝置，將時域中的聲音信號的每一個轉換(transform)為頻域中每個對應的信號，並且導出頻域中兩個信號的頻譜比(spectral ratio)，以及基於所述頻譜比來導出用於校正兩個信號之間相差的相位校正值。在該實施例中，多個信號是兩個或更多個，且麥克風可以包括在該裝置中。
因此，本發明的聲音處理裝置和方法能夠校正包含在該裝置中的多個麥克風的靈敏度變化，以及能夠校正隨產品壽命而產生的磨損所引起的特徵改變。

圖1是示出根據第一實施例的聲音處理裝置的示例性外形的透視圖；圖2是示出根據第一實施例的聲音處理裝置的示例性硬體配置的方框圖3是示出根據第一實施例的聲音處理裝置的示例性功能的功能性方框圖4示出了由於麥克風之間的靈敏度差別引起的聲音波形之間的差
別；
圖5是示出麥克風等效電路的電路圖6示出了基於運動方程式的輸出電壓的變化；
圖7是示出由根據第一實施例的聲音處理裝置執行的示例性處理的操作(operation)圖8A和圖8B是示出使用根據第一實施例的聲音處理裝置校正靈敏度差別的示例性結果的雷達圖9是示出根據本發明第二實施例的聲音處理裝置的示例性功能的功能性方框圖IO是示出由根據第二實施例的聲音處理裝置執行的示例性處理的操作圖11示出了傳統聲音處理裝置的示例性外形的透視圖；以及
圖12示出了如圖11所示的聲音處理裝置的方向性(directivity)的
測量結果的雷達圖。
具體實施例方式
以下將參考附圖來詳細描述本發明的實施例。第一實施例
圖1是示出根據本發明第一實施例的聲音處理裝置1的示例性外形的透視圖。在圖1中，附圖標記l表示聲音處理裝置l，其具有長方體外殼IO，本發明的聲音處理裝置l使用計算機，例如用於手機中的計算機，其也設置於外殼10中。聲音處理裝置1包含在長方體外殼10中。使用麥克風(例如電容式麥克風)的第一聲音接收單元14a被設置在外殼10的前面，用於接
收講話者發出的聲音。此外，第二聲音接收單元14b (例如電容式麥克風) 設置在外殼10的底部。第二聲音接收單元14b優選的是與第一聲音接收單元14a相同種類的麥克風。聲音從各個方向到達聲音處理裝置1，並且聲音處理裝置1基於相差來判定聲音傳來的方向，所述相差對應於聲音到達第一和第二聲音接收單元14a和14b之間的時差。根據聲音傳來的方向，通過執行例如抑制由第一聲音接收單元14a接收的聲音的處理，聲音處理裝置1實現期望的方向性(directivity)。在以下描述中，當不需要對第一聲音接收單元14a和第二聲音接收單元14b進行區分時，將這些單元都稱為聲音接收單元14。
圖2是示出根據本發明第一實施例的聲音處理裝置1的示例性硬體配置的方框圖。在圖2中，聲音處理裝置1包括可用於例如手機等設備中的計算機。聲音處理裝置l包括控制整個裝置的控制單元11 (例如 CPU，中央處理單元)；用於存儲程序(例如電腦程式100)和數據的存儲單元12 (例如ROM和RAM)，所述數據可以是各種設定值；以及通信單元13，其優選地包括作為通信接口的天線以及連接到它的多個設備。聲音處理裝置1進一步包括聲音接收單元14 (例如麥克風)，用以接收外部聲音並將所述外部聲音轉換為模擬聲音信號；輸出聲音的聲音輸出單元15，例如揚聲器；以及對聲音信號進行轉換的聲音轉換單元 16。此外，聲音處理裝置l包括操作單元17，其接受例如文字數字字符以及各種命令的輸入鍵的操作，以及顯示單元18 (例如液晶顯示器)，用以顯示各種類型的信息。這裡，聲音處理裝置1包括兩個聲音接收單元14a和14b。但是，本發明不限於此，還可以具有三個或更多個聲音接收單元14。通過執行包含在控制單元11中的電腦程式100中的各種處理，計算機(例如手機)操作為本實施例的聲音處理裝置1。
圖3是示出根據第一實施例的聲音處理裝置1的示例性功能的功能性方框圖。聲音處理裝置1包括接收模擬聲音的第一聲音接收單元14a和第二聲音接收單元14b;將模擬聲音信號轉換為數位訊號的A/D轉換器161; 以及作為LPF (低通濾波器)的抗混疊濾波器160，其在將模擬信號轉換為數位訊號期間防止發生混疊錯誤。第一聲音接收單元14a和第二聲音接收單元14b都包括用於放大模擬聲音信號的放大器(未示出)。抗混疊濾波器160和A/D轉換器161是在聲音轉換單元16中執行的功能。除了可以包括在聲音處理裝置1的聲音轉換單元16中，抗混疊濾波器160 和A/D轉換器161可以與聲音接收單元14 一起在外部聲音捕獲設備中實現。
聲音處理裝置1還包括幀產生單元120，其產生具有預定時間長度的幀，作為聲音信號的處理單元；FFT (快速傅立葉變換)執行單元121，其通過FFT處理將聲音信號轉換為頻域信號；計算單元122，其計算被轉換到頻域的聲音信號的功率譜比；導出(deriving)單元123，其基於頻譜比導出由第二聲音接收單元14b接收的聲音的聲音信號的相位校正值；校正單元124，其基於校正值而校正由第二聲音接收單元14b接收的聲音的聲音信號的相位；以及聲音處理單元125，其執行例如對第一聲音接收單元14a接收的聲音進行抑制的處理。這裡，幀產生單元120、 FFT 執行單元121、計算單元122、導出單元123、校正單元124以及聲音處理單元125都可以是作為軟體的功能，所述軟體通過執行存儲單元12中的各種電腦程式而實現。但是，這些功能也可以通過使用專用硬體例如集成電路的各種處理晶片而實現。
接著，將描述根據第一實施例的聲音處理裝置1的操作。在聲音處理單元125基於由第一聲音接收單元14a和第二聲音接收單元14b接收的聲音來執行上述處理之前，聲音處理裝置1執行相位校正，以便減少個別差別，例如第一聲音接收單元14a和第二聲音接收單元14b之間的靈敏度差別。首先，將描述第一聲音接收單元14a和第二聲音接收單元 14b之間的靈敏度差別施加(exerted on)到相位上的影響。
即使從相同的聲音源接收聲音，具有不同靈敏度的相同類型麥克風中的每個麥克風輸出波形不同的信號。為展示這一點，從多個麥克風輸出的脈衝響應的每個都顯示在圖4中，其中用於本實施例的一對相同類型的麥克風彼此具有不同的靈敏度，並且每個麥克風的輸入(incident) 聲音是脈衝。圖4的水平軸代表採樣值，垂直軸代表輸出信號的振幅值，其中採樣值指示了麥克風在96kHz周期採樣的輸出信號形式的採樣階數 (order)。當在96 kHz周期採樣輸出信號時，採樣值100對應於約1.04 ms。實線表示從具有較高靈敏度的麥克風輸出的波形，虛線表示從具有
較低靈敏度的麥克風輸出的波形。當與從低靈敏度麥克風輸出的波形比較時，從高靈敏度麥克風輸出的波形在振幅上變化大而在時間上變化慢。然而，也就是說，與具有較高靈敏度的麥克風輸出的信號波形相比，從
具有較低靈敏度的麥克風輸出的信號波形在相位上前移(advance)。
為了確認圖4中的結果，進行下面的理論考慮。參考麥克風電路系統的等效機械電路(mechanical circuit)，將描述靈敏度差別和相位前移之間的關係。首先，用於聲音接收單元14的電容式麥克風的等效電路可被顯示為圖5中的圖表，其中相對於輸出終端Toutl和Tout2，具有電容值C的電容器與具有電阻值R的電阻器並聯。一旦電容式麥克風由外界聲音壓力振動之後，輸出終端Toutl和Tout2之間出現的輸出電壓的變化等效於具有在電阻R作用下的彈性係數k (=1/C)的阻尼振蕩。這裡，假定圖5的等效電路能夠表示為示出運動方程式的下述方程式(1)。 i + 2i i + w2 =o,o = VI7^) 方程式(1)
其中x是輸出電壓，R是電阻，co是角頻率，k是虛擬彈簧的彈性係數，以及m是該虛擬彈簧的重量(weight)。
對方程式(1)求解x得到以下方程式(2)。
;c = ," + ^e"^) 方程式(2)
其中A和B是常數。
方程式(2)能夠變形為下述方程式(3)。
x =e_wsin( ;2-力) 方程式(3)
圖6示出了由求解運動方程式(1)得到的方程式(3)表示的作為輸出電壓x隨時間的變化。實線顯示的是在電阻R的值較小的情況下理論上x隨時間的變化，其中R=0.04且"2=0.026，虛線表示的是在R的值較大情況下隨時間的變化，其中11=0.05且"2=0.026。方程式(3)和圖6顯示了由虛線表示的輸出電壓的變化的最大振幅小於實線表示的，最大振幅由術語e^表示。更進一步，虛線表示的整個波形比實線的波形前移，也即，虛線表示的波形比實線表示的波形在相位上前移。假定來自麥克風的輸出電壓的振幅越大，麥克風的靈敏度越大，相對於從具有較高靈敏度的麥克風輸出的聲音信號，較低靈敏度麥克風的聲音信號會導致相位的前移。該結果與圖4中脈衝響應的實驗結果相一致。假定高
電阻R情況下的輸出電壓x具有更大振幅和前移的相位。在假定輸出電
壓x的振幅對應於麥克風靈敏度的情況下，當使用具有不同靈敏度的多
個麥克風時，相比於由具有較高靈敏度的麥克風捕獲的聲音信號的相位，
由具有較低靈敏度的麥克風捕獲的聲音信號的相位會前移。這與圖4中脈衝響應的實驗結果相一致。
麥克風之間的靈敏度差別可以通過上述的聲音信號的振幅來識別。由於靈敏度差別影響相位，因此本發明的聲音處理裝置1基於相應于振幅的功率譜的值來校正相位，從而減少聲音接收單元14之間的靈敏度差別的影響。
參考圖7的操作圖，將描述由根據第一實施例的聲音處理裝置1執行的示例性的一個處理。在操作S101中，從相應的聲音接收單元14輸出的每一個模擬聲音信號通過抗混疊濾波器160濾波，然後分別由A/D 轉換器161轉換為數位訊號，這些處理都是由控制單元11控制的。
基於控制單元11的控制下，聲音處理裝置1通過幀產生單元120將每一個數位化的聲音信號分為多個幀，每個幀具有預定的時間長度，其中每個幀用作為一個待處理的單元。預定時間長度例如是，約20到40 的範圍，如S102所示。此外，在幀處理期間，每個幀可以以例如約10 到20 ms的範圍進行移動。
基於控制單元11的控制下，在由FFT執行單元121執行的處理中，聲音處理裝置1通過FFT (快速傅立葉變化)處理將以幀為單位的聲音信號轉換為用作頻域信號的頻譜，如S103所示。在操作S103中，將聲音信號轉換為相位譜和振幅譜。在以下處理中將使用功率譜，其是振幅譜的平方。但是，在下述處理中也可以使用振幅譜來代替功率譜。
聲音處理裝置1計算功率譜的功率譜比。一個功率譜是基於由第二聲音接收單元14b接收的聲音。另一個功率譜是基於由第一聲音接收單元14a接收的聲音。基於控制單元ll的控制，所述功率譜在由計算單元 122執行的處理中獲得，如S104所示。在操作S104中，利用下述方程式(4)計算出為每個頻率設置(set)的每個功率譜的所述比率(ratio)。
mtio=S2(co)/Sl((D) 方程式(4)
其中，co是角頻率，Sl(co)是基於來自第一聲音接收單元14a的聲音
信號的功率譜，以及S2(co)是基於來自第二聲音接收單元14b的聲音信號
的功率譜。
基於控制單元11的控制下，在由導出單元123執行的處理中，基於方程式(4)中示出的功率譜比，聲音處理裝置1計算第二聲音接收單元 14b的頻域中的聲音信號相對於第一聲音接收單元14a的頻域中的聲音信號的相位校正值，如S105所示。在操作S105中，使用下述方程式(5) 計算校正值。
Pcomp(co)-[aF(S"co)/S2((o"]co + (3 方程式(5)
其中，Pcomp(co)是相位校正值，ot和P是常數，以及F(S"co)/S2(coW是作
為變量的S"O)/S2(C0)的函數。
下面描述如何確定方程式(5)中的常數a和P。首先，用於調整 (adjustment)的單元包括兩組麥克風，也即，設定具有最高靈敏度的麥克風組和具有最低靈敏度的麥克風組。此外，在用作聲音接收單元14的相同種類(類型)的那些麥克風中，還準備了具有相同或實質上相同靈敏度的麥克風組。隨後，在與每組麥克風中每個麥克風相等距離的位置再現(reproduce)白噪聲，並且確定每組麥克風的相差譜，即從每個麥克風輸出的信號的每個相位譜之間的差別((A(w)-^(w))。最後，常數a 和卩以這樣的方式確定，即使得具有不同靈敏度的麥克風組的相差譜適合於 (fit)具有相同或實質相同靈敏度的麥克風組。確定的常數a和p的每個數據存儲於聲音處理裝置1的存儲單元12中。操作S105中的處理可以使用與用於調整的那些麥克風(如聲音接收單元14)相同類型的麥克風來執行。例如，方程式(5)中的函數F從諸如常用對數、自然對數等對數函數、以及從適當的S型(sigmoid)函數中選出。
基於控制單元11的控制下，在由校正單元124執行的處理中，聲音處理裝置1將在操作S105中計算出的相位校正值加到第二聲音接收單元 14b的頻域中的聲音信號的相位上，從而校正第二聲音接收單元14b的聲音信號，如S106所示。在操作S106中，使用下述方程式(6)校正所述聲音信號。
formula see original document page 11(6)
其中^(w)是基於由第二聲音接收單元14b接收的聲音的相位譜，
是經校正的相位譜。
基於控制單元11的控制下，聲音處理裝置1執行各種聲音處理，例
如在聲音處理單元125執行的處理中，基於第一聲音接收單元Ma的聲音信號以及第二聲音接收單元14b的相位被校正的聲音信號，來抑制由第一聲音接收單元14a接收的聲音，如S107所示。
在操作S105中使用的方程式(5)能夠根據聲音處理裝置1的形狀和/或聲音處理的細節而適應性改變。例如，下述的方程式(7)能夠用於取代方程式(5)。
formula see original document page 12方程式(7)
方程式(5)適用於校正當第一聲音接收單元14a和第二聲音接收單
元14b如圖1所示在聲音處理裝置1中垂直安排時的正常操作下的相位譜。另一方面，方程式(7)適用於校正在第一聲音接收單元14a和第二聲音接收單元14b是水平安排在聲音處理裝置1的前面時的相位譜。艮口，期望根據適當的位置來調查需所使用的方程式。
上述對校正的解釋是針對根據第二聲音接收單元14b的聲音信號的相位。此外，也可以通過將方程式(5)和(7)中的函數F中的S2(o))/S,(co) 換成S"co)/S2(co)，來校正第一聲音接收單元14a的聲音信號的相位。可選擇地，對於相同的對象(object)，下述方程式(8)可用於替換方程式(6)以校正第一聲音接收單元14a的聲音信號的相位。
formula see original document page 12方程式(8)
其中^(w)是基於由第一聲音接收單元14a接收的聲音的相位譜，是校正後的相位譜。
接下來，將描述使用聲音處理裝置l校正靈敏度差別的結果。圖8A 和圖8B是示出使用聲音處理裝置1校正靈敏度差別的示例性結果的雷達圖。通過基於由第一聲音接收單元14a和第二聲音接收單元14b接收的各自聲音之間的相差來識別聲音傳來的方向，以及通過根據在聲音處理單元125中執行的聲音處理中聲音傳來的方向，來執行例如對由第一聲音接收單元14a接收的聲音進行抑制的處理，圖8A和圖8B示出達到的方向性。圖8A和圖8B示出的雷達圖中的方向性是由信號功率(dB)指示的，所述信號功率是對由第一聲音接收單元14a從聲音傳來的每個方向接收的聲音執行聲音處理之後的信號功率。這裡，當聲音從外殼io的
前面(在此第一聲音接收單元14a設置在聲音處理裝置1中)傳來時，方位角定義為0°，當聲音來自右面時方位角定義為90°，當聲音來自後面時方位角定義為180°，當聲音來自左面時方位角定義為270°。圖8A 示出當第一聲音接收單元14a和第二聲音接收單元14b之間的靈敏度差別未校正時的方向性。實線指示第一聲音接收單元14a和第二聲音接收單元14b的靈敏度相同時的狀態l;虛線指示第一聲音接收單元14a的靈敏度高於第二聲音接收單元14b的靈敏度時的狀態2;交替的長短點劃線指示第二聲音接收單元14b的靈敏度高於第一聲音接收單元和14a的靈敏度時的狀態3。圖8B示出由本發明的聲音處理裝置1校正靈敏度差別時的方向性。實線指示第一聲音接收單元14a和第二聲音接收單元14b 的靈敏度相同時的狀態1;虛線指示第一聲音接收單元14a的靈敏度高於第二聲音接收單元14b的靈敏度時的狀態2;交替的長短點劃線指示第二聲音接收單元14b的靈敏度高於第一聲音接收單元和14a的靈敏度時的狀態3。
如圖8A所示，相比第一聲音接收單元14a的靈敏度和第二聲音接收單元14b的靈敏度相同的狀態l，側面和後面的方向性在第一聲音接收單元14a的靈敏度和第二聲音接收單元14b的靈敏度彼此不同的狀態2和3 下改變。相反，如圖8B所示，由於在狀態2和3中靈敏度差別的影響消除或減小，因此在所有方向上，狀態2和3中的方向性相似於狀態1中的方向性。
在第一實施例中，聲音處理裝置包括兩個聲音接收單元。但是，本發明不限於此，並且聲音處理裝置能夠具有三個或更多聲音接收單元。當聲音處理裝置包括三個或更多聲音接收單元時，通過將多個聲音接收單元之一的聲音信號定義為參考信號，並通過執行功率譜比的計算、相位校正值的計算以及對其它聲音接收單元的聲音信號的相位校正，能夠減小靈敏度差別。
第二實施例
例如，在第二實施例中，考慮到減小處理負載以及防止聲音質量的突然變化，改變根據第一實施例的聲音處理裝置。由於根據第二實施例
的聲音處理裝置的外形和示例性硬體配置與根據第一實施例的那些相同，因此，參考根據第一實施例的相應部分並且將對它們的描述省略。在以下描述中，相同附圖標記用於與第一實施例中實質相同的組件。
圖9是示出根據第二實施例的聲音處理裝置1的示例功能的功能性方框圖。本發明的聲音處理裝置1包括第一聲音接收單元14a、第二聲音接收單元14b、抗混疊濾波器160以及執行模擬-數字轉換的A/D轉換器 161。第一聲音接收單元14a和第二聲音接收單元14b包括用以放大模擬聲音信號的放大器(未示出)。
聲音處理裝置1還包括幀產生單元120、 FFT執行單元121、用於計算功率譜比的計算單元122、用於計算相位校正值的導出單元123、校正單元124以及聲音處理單元125。此外，聲音處理裝置1包括用以選擇頻率的頻率選擇單元126以及平滑單元(smoothing unit) 127，所述頻率用於由計算單元122執行的對功率譜比的計算，所述平滑單元127平滑由導出單元123計算的校正值隨時間的變化。幀產生單元120、 FFT執行單元121、計算單元122、導出單元123、校正單元124、聲音處理單元125、頻率選擇單元126以及平滑單元127都可以是作為通過執行存儲單元12 中的各種電腦程式而實現的軟體的功能。但是，這些功能也可以通過使用專用硬體例如集成電路的各種處理晶片而實現。
接下來，將描述根據第二實施例的聲音處理裝置1執行的處理。圖 IO示出了由根據第二實施例的聲音處理裝置1執行的示例性處理的操作圖。基於由相應的聲音接收單元14接收的聲音，通過用於執行計算機程序100的控制單元11的控制，聲音處理裝置1產生模擬聲音信號，如S200 所示，使用抗混疊濾波器160濾波所述信號，並且使用A/D轉換器161 將所述信號轉換為數位訊號。
在基於控制單元11的控制由幀產生單元120執行的處理中，聲音處理裝置1將來自被轉換為數位訊號的每一個聲音信號的每個聲音信號分為具有預定時間長度的多個幀，所述幀用作為處理單元，如S202所示，並且在基於控制單元11的控制由FFT執行單元121執行的處理中，聲音處理裝置1通過FFT處理將以幀為單位的聲音信號轉換為用作頻域信號的頻譜，如S203所示。在基於控制單元11的控制由頻率選擇單元126執行的處理中，聲音處理裝置1在從例如1000到3000Hz的頻率範圍中選擇SNRs(信號噪聲比)高於或等於預定值的頻率，該頻率範圍不受抗混疊濾波器160的影響，如S204所示。
在基於控制單元11的控制由計算單元122執行的處理中，聲音處理裝置1計算在操作S204中選擇的頻率的功率譜比，如S205所示，計算功率譜比的平均值，如S206所示，並且在基於控制單元11的控制由導出單元123執行的處理中，聲音處理裝置1基於功率譜比的平均值，計算第二聲音接收單元14b的頻域聲音信號相對於第一聲音接收單元14a 的頻域聲音信號的相位校正值，如S207所示。操作S205到S207的處理是由下述方程式(9)或(10)表示的。formula see original document page 15方程式(9)
其中Pcomp是相位校正值，ot和p是常數，N是選擇的頻率的數量， F是函數，Sl(co)是基於第一聲音接收單元14a的聲音信號的功率譜，以及S2(co)是基於第二聲音接收單元14b的聲音信號的功率譜。
formula see original document page 15 方程式(io)
其中Pcomp是相位校正值，oc和p是常數，N是選擇的頻率的數量， F是函數，Sl(co)是基於第一聲音接收單元14a的聲音信號的功率譜，以及S2(co)是基於第二聲音接收單元14b的聲音信號的功率譜。
方程式(9)和(10)表示的相位校正值是基於在選定頻率的功率譜比的平均值而計算的代表值，並且不依靠選擇頻率來改變。在第二實施例中，由於校正值是基於在N個選定頻率的頻譜而計算的，所以可以減少處理負載(processing load)。由於隨後處理與校正值的時間性變化(time change)有關，因此將索引相位校正值Pcomp作為校正值Pcomp(t)，其是時間(幀)t的函數。
在基於控制單元11的控制由平滑單元127執行的處理中，聲音處理裝置1平滑校正值隨時間的變化(temporal variation)，如S208所示。在操作S208中，使用下述方程式(11)執行平滑處理。
formula see original document page 16 方程式(11)
其中^是從o到i的常數。
在操作S208中，使用方程式(11)所示的一個先前校正值Pcomp(t-l) 來平滑時間性變化(time change)。因此，能夠再現自然的聲音，同時防止校正值的突然變化。這裡，常數Y可以是例如0.9。更進一步，當選定頻率的數量低於預定值時，例如是5，可以暫時將常數Y設定為1，從而停止對校正值的更新。這樣，由於不使用具有在SNR低時所獲得的低精確度的校正值，因此能夠提高可靠性。此外，為了防止由例如噪聲引起的不期望的過度校正，需要為校正值設置上限和下限。能夠使用 sigmoid函數來代替使用方程式(ll)，從而平滑校正值的時間性變化(time change)。
基於控制單元11的控制下，在由校正單元124執行的處理中，聲音處理裝置1將操作S208中計算的相位校正值加到第二聲音接收單元14b 的頻域聲音信號的相位，以校正第二聲音接收單元14b的聲音信號，如 S209所示。在操作S209中，使用在整個頻率範圍上的特定(specific) 校正值校正聲音信號。
基於控制單元11的控制下，在由聲音處理單元125執行的處理中，聲音處理裝置1執行各種聲音處理，例如基於第一聲音接收單元14a的聲音信號以及第二聲音接收單元14b的相位被校正的聲音信號，來抑制由第一聲音接收單元14a接收的聲音，如S210所示。
第一和第二實施例僅是本發明眾多實施例中的部分。可以理解的是硬體和軟體的配置可以設置成適當的配置，並且可以結合與上述基本處理不同的各種處理。
權利要求
1. 一種聲音處理裝置，用於處理接收到的聲音，該裝置包括多個聲音接收單元，所述多個聲音接收單元的每一個聲音接收單元輸出與接收到的聲音對應的聲音信號；轉換單元，用於將時域中的聲音信號轉換為頻域中的轉換後信號；計算單元，用於獲得兩個所述轉換後信號之間的頻譜比；導出單元，用於基於所述頻譜比導出相位校正值，基於與兩個所述轉換後信號中的一個轉換後信號對應的一個聲音信號，以對應於兩個所述轉換後信號中另一個轉換後信號的另一個聲音信號為基礎，所述相位校正值能夠校正所述另一個聲音信號的相位；以及校正單元，用於校正所述聲音信號的相位。
2. 如權利要求1所述的聲音處理裝置，其中所述計算單元能夠獲得兩個所述轉換後信號之間的功率譜比。
3. 如權利要求2所述的聲音處理裝置，其中用下面的方程式的形式表示所述相位校正值其中"是角頻率，Pcomp(o)是所述相位校正值，Si(")是兩個所述轉換後信號中一個轉換後信號的功率譜，S2(")是兩個所述轉換後信號中另一個轉換後信號的功率譜，Ot和P是常數，以及F《S2((0)/SKC0》是S2(C0)/S"(D)的函數。
4. 如權利要求2所述的聲音處理裝置，其中用下面的方程式的形式表示所述相位校正值Pcomp(co) = [aF(S"co)/S2(co川co + p其中"是角頻率，Pcomp(co)是所述相位校正值，S"co)是兩個所述轉換後信號中一個轉換後信號的功率譜，S2(")是兩個所述轉換後信號中的另一個轉換後信號的功率譜，a和(3是常數，以及F^(co)/S2((o》是S"co)/S2(co)的函數。
5. 如權利要求3所述的聲音處理裝置，其中所述函數是對數函數，並且所述校正單元執行加法運算，將所述相位校正值加到兩個所述轉換後信號中另一個轉換後信號的相位上。
6. 如權利要求4所述的聲音處理裝置，其中所述函數是對數函數，並且所述校正單元執行加法運算，將所述相位校正值加到兩個所述轉換後信號中另一個轉換後信號的相位上。
7. 如權利要求1所述的聲音處理裝置，其中所述計算單元能夠獲得兩個所述轉換後信號的振幅譜之間的比率。
8. 如權利要求1所述的聲音處理裝置，進一步包括平滑單元，用於平滑所述相位校正值隨時間的變化，其中基於由所述平滑單元平滑後的所述相位校正值，所述校正單元校正所述聲音信號的相位。
9. 一種校正接收到的聲音信號之間相差的方法，該方法包括如下操作-分別將時域中的每個聲音信號轉換為頻域中的轉換後信號，每個所述聲音信號對應於各自的接收到的聲音信號；執行計算以獲得兩個所述轉換後信號之間的頻譜比；通過使用所述頻譜比導出相位校正值，所述相位校正值基於兩個所述轉換後信號中一個轉換後信號導出；以及校正兩個所述轉換後信號中另一個轉換後信號的相位。
全文摘要
本發明公開一種校正相差的聲音處理裝置和方法，該聲音處理裝置處理接收的聲音。包括在該裝置中的多個聲音接收單元，分別輸出對應於接收的信號的聲音信號，然後將時域中的聲音信號轉換為頻域中的分別的轉換後信號，以及計算兩個轉換後信號之間的頻譜比，以導出用以校正聲音信號的相位的相位校正值。因此，本發明的聲音處理裝置和方法能夠校正包含在該裝置中的多個麥克風的靈敏度變化，以及能夠校正隨產品壽命而產生的磨損所引起的特徵改變。
文檔編號H04R1/40GK101378607SQ200810212648
公開日2009年3月4日申請日期2008年8月27日優先權日2007年8月27日
發明者早川昭二申請人:富士通株式會社

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

校正相差的聲音處理裝置和方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法