新四季網

校正相差的聲音處理裝置和方法

2023-04-28 10:28:31 2

專利名稱:校正相差的聲音處理裝置和方法
技術領域:
本發明涉及一種將多個聲音接收單元接收的聲音轉換為處理過的聲音 信號的聲音處理裝置。更進一步,本發明涉及一種校正所述聲音信號之間的 相差的聲音處理裝置、方法以及存儲電腦程式的計算機可讀存儲介質。
背景技術:
已經對使用多個麥克風的、用於例如識別聲音來源方向的各種聲音處理 裝置進行了研究並投入實際使用。下面將描述這些裝置中的一種。圖11是
示出聲音處理裝置外形的透視圖。在圖11中,內置有聲音處理裝置1000的 手機外殼的形狀是長方體,使用手機的聲音處理裝置1000具有外殼(casing) 1001。用於接收講話者發出的語音的第一麥克風1002安置在外殼1001的前 面。此外,第二麥克風1003安置在外殼1001的底部。
從各個方向接收聲音並且對與第一麥克風1002和第二麥克風1003接收 的聲音之間的時差對應的相差進行處理,聲音處理裝置1000基於相差識別 聲音傳來的方向。然後,聲音處理裝置1000通過執行處理而實現期望的方 向性特徵,所述處理例如是根據聲音傳來的方向來抑制由第一麥克風1002 接收的聲音。
如圖11所示的聲音處理裝置1000要求麥克風具有相同的特徵,例如, 相同的靈敏度。圖12是示出聲音處理裝置1000的方向性測量結果的雷達圖。 圖12的雷達圖示出,在聲音處理裝置1000的第一麥克風1002接收到的聲 音在聲音傳來的每個方向被抑制之後的聲音的信號功率(dB)。這裡,圖 12中使用了指示方向的方位角(azimuth),也即,當聲音從在聲音處理裝 置1000中設置的第一麥克風1002所在的外殼1001的前面傳來時,方位角 定義為0°。當聲音來自右面時,方位角定義為90。,當聲音來自後面時,方 位角定義為180°,以及當聲音來自左面時,方位角定義為270。。在圖12中 每個方向以環繞雷達圖的"度數(degree)"來顯示,其中實線指示在第一
麥克風1002的靈敏度和第二麥克風1003的靈敏度相同時每個方向中信號功 率的狀態1;虛線指示在第一麥克風1002的靈敏度高於第二麥克風1003的 靈敏度時信號功率的狀態2;交替的長短點劃線指示在第二麥克風1003的靈 敏度高於第一麥克風1002的靈敏度時信號功率的狀態3。當期望的是第一麥 克風1002的靈敏度和第二麥克風1003的靈敏度相同情況下的狀態1的方向 性時,在狀態2和狀態3的90°、 270°和180。方向上的方向性彼此有很大不 同。也即,根據麥克風的靈敏度,方向性變化的尺度很大。
麥克風之間個體的差別影響著聲音處理裝置的特徵,如圖12所示。但 是,通常生產的麥克風在預定規格內會具有個體的不同,例如靈敏度差別。 為了調整麥克風以使它們的特徵相同,提出了解決該問題的方法,例如,日 本公開專利申請No. 2002-99297和2004-343700,其中使用在與多個麥克風 相同距離的位置處產生的訓練(teacher)信號。

發明內容
但是,所提出的方法應該應用到在聲音處理裝置中設置的每對麥克風 中。也即,為每個聲音處理裝置設置每對麥克風。因此增加了生產聲音處理 裝置的費用。此外,封裝之後,所提出的方法難以應對特徵的改變,例如隨 著產品壽命而產生的磨損,因此麥克風的特徵將彼此不同。
因此,本發明的一個目標是以低生產成本提供一種裝置,能夠校正包含 在裝置中的多個麥克風的靈敏度變化,以及能夠校正隨產品壽命而產生的磨 損所引起的特徵改變。
根據本發明的實施例,提供能夠從多個麥克風接收伴隨時間的聲音信號 的裝置,將時域中的聲音信號的每一個轉換(transform)為頻域中每個對應 的信號,並且導出頻域中兩個信號的頻譜比(spectral ratio),以及基於所述 頻譜比來導出用於校正兩個信號之間相差的相位校正值。在該實施例中,多 個信號是兩個或更多個,且麥克風可以包括在該裝置中。
因此,本發明的聲音處理裝置和方法能夠校正包含在該裝置中的多個麥 克風的靈敏度變化,以及能夠校正隨產品壽命而產生的磨損所引起的特徵改 變。


圖1是示出根據第一實施例的聲音處理裝置的示例性外形的透視圖; 圖2是示出根據第一實施例的聲音處理裝置的示例性硬體配置的方 框圖3是示出根據第一實施例的聲音處理裝置的示例性功能的功能性 方框圖4示出了由於麥克風之間的靈敏度差別引起的聲音波形之間的差
別;
圖5是示出麥克風等效電路的電路圖6示出了基於運動方程式的輸出電壓的變化;
圖7是示出由根據第一實施例的聲音處理裝置執行的示例性處理的 操作(operation)圖8A和圖8B是示出使用根據第一實施例的聲音處理裝置校正靈敏 度差別的示例性結果的雷達圖9是示出根據本發明第二實施例的聲音處理裝置的示例性功能的 功能性方框圖IO是示出由根據第二實施例的聲音處理裝置執行的示例性處理的 操作圖11示出了傳統聲音處理裝置的示例性外形的透視圖;以及
圖12示出了如圖11所示的聲音處理裝置的方向性(directivity)的
測量結果的雷達圖。
具體實施例方式
以下將參考附圖來詳細描述本發明的實施例。 第一實施例
圖1是示出根據本發明第一實施例的聲音處理裝置1的示例性外形的透 視圖。在圖1中,附圖標記l表示聲音處理裝置l,其具有長方體外殼IO, 本發明的聲音處理裝置l使用計算機,例如用於手機中的計算機,其也設置 於外殼10中。聲音處理裝置1包含在長方體外殼10中。使用麥克風(例如 電容式麥克風)的第一聲音接收單元14a被設置在外殼10的前面,用於接
收講話者發出的聲音。此外,第二聲音接收單元14b (例如電容式麥克風) 設置在外殼10的底部。第二聲音接收單元14b優選的是與第一聲音接收單 元14a相同種類的麥克風。聲音從各個方向到達聲音處理裝置1,並且聲音 處理裝置1基於相差來判定聲音傳來的方向,所述相差對應於聲音到達第一 和第二聲音接收單元14a和14b之間的時差。根據聲音傳來的方向,通過執 行例如抑制由第一聲音接收單元14a接收的聲音的處理,聲音處理裝置1實 現期望的方向性(directivity)。在以下描述中,當不需要對第一聲音接收單 元14a和第二聲音接收單元14b進行區分時,將這些單元都稱為聲音接收單 元14。
圖2是示出根據本發明第一實施例的聲音處理裝置1的示例性硬體 配置的方框圖。在圖2中,聲音處理裝置1包括可用於例如手機等設備 中的計算機。聲音處理裝置l包括控制整個裝置的控制單元11 (例如 CPU,中央處理單元);用於存儲程序(例如電腦程式100)和數據的 存儲單元12 (例如ROM和RAM),所述數據可以是各種設定值;以及 通信單元13,其優選地包括作為通信接口的天線以及連接到它的多個設 備。聲音處理裝置1進一步包括聲音接收單元14 (例如麥克風),用 以接收外部聲音並將所述外部聲音轉換為模擬聲音信號;輸出聲音的聲 音輸出單元15,例如揚聲器;以及對聲音信號進行轉換的聲音轉換單元 16。此外,聲音處理裝置l包括操作單元17,其接受例如文字數字字 符以及各種命令的輸入鍵的操作,以及顯示單元18 (例如液晶顯示器), 用以顯示各種類型的信息。這裡,聲音處理裝置1包括兩個聲音接收單 元14a和14b。但是,本發明不限於此,還可以具有三個或更多個聲音接 收單元14。通過執行包含在控制單元11中的電腦程式100中的各種處 理,計算機(例如手機)操作為本實施例的聲音處理裝置1。
圖3是示出根據第一實施例的聲音處理裝置1的示例性功能的功能性方 框圖。聲音處理裝置1包括接收模擬聲音的第一聲音接收單元14a和第 二聲音接收單元14b;將模擬聲音信號轉換為數位訊號的A/D轉換器161; 以及作為LPF (低通濾波器)的抗混疊濾波器160,其在將模擬信號轉換 為數位訊號期間防止發生混疊錯誤。第一聲音接收單元14a和第二聲音 接收單元14b都包括用於放大模擬聲音信號的放大器(未示出)。抗混 疊濾波器160和A/D轉換器161是在聲音轉換單元16中執行的功能。除 了可以包括在聲音處理裝置1的聲音轉換單元16中,抗混疊濾波器160 和A/D轉換器161可以與聲音接收單元14 一起在外部聲音捕獲設備中實 現。
聲音處理裝置1還包括幀產生單元120,其產生具有預定時間長度 的幀,作為聲音信號的處理單元;FFT (快速傅立葉變換)執行單元121, 其通過FFT處理將聲音信號轉換為頻域信號;計算單元122,其計算被 轉換到頻域的聲音信號的功率譜比;導出(deriving)單元123,其基於 頻譜比導出由第二聲音接收單元14b接收的聲音的聲音信號的相位校正 值;校正單元124,其基於校正值而校正由第二聲音接收單元14b接收的 聲音的聲音信號的相位;以及聲音處理單元125,其執行例如對第一聲音 接收單元14a接收的聲音進行抑制的處理。這裡,幀產生單元120、 FFT 執行單元121、計算單元122、導出單元123、校正單元124以及聲音處 理單元125都可以是作為軟體的功能,所述軟體通過執行存儲單元12中 的各種電腦程式而實現。但是,這些功能也可以通過使用專用硬體例 如集成電路的各種處理晶片而實現。
接著,將描述根據第一實施例的聲音處理裝置1的操作。在聲音處 理單元125基於由第一聲音接收單元14a和第二聲音接收單元14b接收 的聲音來執行上述處理之前,聲音處理裝置1執行相位校正,以便減少 個別差別,例如第一聲音接收單元14a和第二聲音接收單元14b之間的 靈敏度差別。首先,將描述第一聲音接收單元14a和第二聲音接收單元 14b之間的靈敏度差別施加(exerted on)到相位上的影響。
即使從相同的聲音源接收聲音,具有不同靈敏度的相同類型麥克風 中的每個麥克風輸出波形不同的信號。為展示這一點,從多個麥克風輸 出的脈衝響應的每個都顯示在圖4中,其中用於本實施例的一對相同類 型的麥克風彼此具有不同的靈敏度,並且每個麥克風的輸入(incident) 聲音是脈衝。圖4的水平軸代表採樣值,垂直軸代表輸出信號的振幅值, 其中採樣值指示了麥克風在96kHz周期採樣的輸出信號形式的採樣階數 (order)。當在96 kHz周期採樣輸出信號時,採樣值100對應於約1.04 ms。實線表示從具有較高靈敏度的麥克風輸出的波形,虛線表示從具有
較低靈敏度的麥克風輸出的波形。當與從低靈敏度麥克風輸出的波形比 較時,從高靈敏度麥克風輸出的波形在振幅上變化大而在時間上變化慢。 然而,也就是說,與具有較高靈敏度的麥克風輸出的信號波形相比,從
具有較低靈敏度的麥克風輸出的信號波形在相位上前移(advance)。
為了確認圖4中的結果,進行下面的理論考慮。參考麥克風電路系 統的等效機械電路(mechanical circuit),將描述靈敏度差別和相位前移 之間的關係。首先,用於聲音接收單元14的電容式麥克風的等效電路可 被顯示為圖5中的圖表,其中相對於輸出終端Toutl和Tout2,具有電容 值C的電容器與具有電阻值R的電阻器並聯。 一旦電容式麥克風由外界 聲音壓力振動之後,輸出終端Toutl和Tout2之間出現的輸出電壓的變化 等效於具有在電阻R作用下的彈性係數k (=1/C)的阻尼振蕩。這裡, 假定圖5的等效電路能夠表示為示出運動方程式的下述方程式(1)。 i + 2i i + w2 =o,o = VI7^) 方程式(1)
其中x是輸出電壓,R是電阻,co是角頻率,k是虛擬彈簧的彈性係數, 以及m是該虛擬彈簧的重量(weight)。
對方程式(1)求解x得到以下方程式(2)。
;c = ," + ^e"^) 方程式(2)
其中A和B是常數。
方程式(2)能夠變形為下述方程式(3)。
x =e_wsin( ;2-力) 方程式(3)
圖6示出了由求解運動方程式(1)得到的方程式(3)表示的作為 輸出電壓x隨時間的變化。實線顯示的是在電阻R的值較小的情況下理 論上x隨時間的變化,其中R=0.04且"2=0.026,虛線表示的是在R的 值較大情況下隨時間的變化,其中11=0.05且"2=0.026。方程式(3)和 圖6顯示了由虛線表示的輸出電壓的變化的最大振幅小於實線表示的, 最大振幅由術語e^表示。更進一步,虛線表示的整個波形比實線的波形 前移,也即,虛線表示的波形比實線表示的波形在相位上前移。假定來 自麥克風的輸出電壓的振幅越大,麥克風的靈敏度越大,相對於從具有 較高靈敏度的麥克風輸出的聲音信號,較低靈敏度麥克風的聲音信號會 導致相位的前移。該結果與圖4中脈衝響應的實驗結果相一致。假定高
電阻R情況下的輸出電壓x具有更大振幅和前移的相位。在假定輸出電
壓x的振幅對應於麥克風靈敏度的情況下,當使用具有不同靈敏度的多
個麥克風時,相比於由具有較高靈敏度的麥克風捕獲的聲音信號的相位,
由具有較低靈敏度的麥克風捕獲的聲音信號的相位會前移。這與圖4中 脈衝響應的實驗結果相一致。
麥克風之間的靈敏度差別可以通過上述的聲音信號的振幅來識別。 由於靈敏度差別影響相位,因此本發明的聲音處理裝置1基於相應于振 幅的功率譜的值來校正相位,從而減少聲音接收單元14之間的靈敏度差 別的影響。
參考圖7的操作圖,將描述由根據第一實施例的聲音處理裝置1執 行的示例性的一個處理。在操作S101中,從相應的聲音接收單元14輸 出的每一個模擬聲音信號通過抗混疊濾波器160濾波,然後分別由A/D 轉換器161轉換為數位訊號,這些處理都是由控制單元11控制的。
基於控制單元11的控制下,聲音處理裝置1通過幀產生單元120將 每一個數位化的聲音信號分為多個幀,每個幀具有預定的時間長度,其 中每個幀用作為一個待處理的單元。預定時間長度例如是,約20到40 的範圍,如S102所示。此外,在幀處理期間,每個幀可以以例如約10 到20 ms的範圍進行移動。
基於控制單元11的控制下,在由FFT執行單元121執行的處理中, 聲音處理裝置1通過FFT (快速傅立葉變化)處理將以幀為單位的聲音 信號轉換為用作頻域信號的頻譜,如S103所示。在操作S103中,將聲 音信號轉換為相位譜和振幅譜。在以下處理中將使用功率譜,其是振幅 譜的平方。但是,在下述處理中也可以使用振幅譜來代替功率譜。
聲音處理裝置1計算功率譜的功率譜比。 一個功率譜是基於由第二 聲音接收單元14b接收的聲音。另一個功率譜是基於由第一聲音接收單 元14a接收的聲音。基於控制單元ll的控制,所述功率譜在由計算單元 122執行的處理中獲得,如S104所示。在操作S104中,利用下述方程 式(4)計算出為每個頻率設置(set)的每個功率譜的所述比率(ratio)。
mtio=S2(co)/Sl((D) 方程式(4)
其中,co是角頻率,Sl(co)是基於來自第一聲音接收單元14a的聲音
信號的功率譜,以及S2(co)是基於來自第二聲音接收單元14b的聲音信號
的功率譜。
基於控制單元11的控制下,在由導出單元123執行的處理中,基於 方程式(4)中示出的功率譜比,聲音處理裝置1計算第二聲音接收單元 14b的頻域中的聲音信號相對於第一聲音接收單元14a的頻域中的聲音 信號的相位校正值,如S105所示。在操作S105中,使用下述方程式(5) 計算校正值。
Pcomp(co)-[aF(S"co)/S2((o"]co + (3 方程式(5)
其中,Pcomp(co)是相位校正值,ot和P是常數,以及F(S"co)/S2(coW是作
為變量的S"O)/S2(C0)的函數。
下面描述如何確定方程式(5)中的常數a和P。首先,用於調整 (adjustment)的單元包括兩組麥克風,也即,設定具有最高靈敏度的麥 克風組和具有最低靈敏度的麥克風組。此外,在用作聲音接收單元14的 相同種類(類型)的那些麥克風中,還準備了具有相同或實質上相同靈 敏度的麥克風組。隨後,在與每組麥克風中每個麥克風相等距離的位置 再現(reproduce)白噪聲,並且確定每組麥克風的相差譜,即從每個麥 克風輸出的信號的每個相位譜之間的差別((A(w)-^(w))。最後,常數a 和卩以這樣的方式確定,即使得具有不同靈敏度的麥克風組的相差譜適合於 (fit)具有相同或實質相同靈敏度的麥克風組。確定的常數a和p的每個 數據存儲於聲音處理裝置1的存儲單元12中。操作S105中的處理可以 使用與用於調整的那些麥克風(如聲音接收單元14)相同類型的麥克風 來執行。例如,方程式(5)中的函數F從諸如常用對數、自然對數等對 數函數、以及從適當的S型(sigmoid)函數中選出。
基於控制單元11的控制下,在由校正單元124執行的處理中,聲音 處理裝置1將在操作S105中計算出的相位校正值加到第二聲音接收單元 14b的頻域中的聲音信號的相位上,從而校正第二聲音接收單元14b的聲 音信號,如S106所示。在操作S106中,使用下述方程式(6)校正所述 聲音信號。
formula see original document page 11(6)
其中^(w)是基於由第二聲音接收單元14b接收的聲音的相位譜,
是經校正的相位譜。
基於控制單元11的控制下,聲音處理裝置1執行各種聲音處理,例
如在聲音處理單元125執行的處理中,基於第一聲音接收單元Ma的聲 音信號以及第二聲音接收單元14b的相位被校正的聲音信號,來抑制由 第一聲音接收單元14a接收的聲音,如S107所示。
在操作S105中使用的方程式(5)能夠根據聲音處理裝置1的形狀 和/或聲音處理的細節而適應性改變。例如,下述的方程式(7)能夠用於 取代方程式(5)。
formula see original document page 12方程式(7)
方程式(5)適用於校正當第一聲音接收單元14a和第二聲音接收單
元14b如圖1所示在聲音處理裝置1中垂直安排時的正常操作下的相位 譜。另一方面,方程式(7)適用於校正在第一聲音接收單元14a和第二 聲音接收單元14b是水平安排在聲音處理裝置1的前面時的相位譜。艮口, 期望根據適當的位置來調查需所使用的方程式。
上述對校正的解釋是針對根據第二聲音接收單元14b的聲音信號的 相位。此外,也可以通過將方程式(5)和(7)中的函數F中的S2(o))/S,(co) 換成S"co)/S2(co),來校正第一聲音接收單元14a的聲音信號的相位。可 選擇地,對於相同的對象(object),下述方程式(8)可用於替換方程 式(6)以校正第一聲音接收單元14a的聲音信號的相位。
formula see original document page 12方程式(8)
其中^(w)是基於由第一聲音接收單元14a接收的聲音的相位譜, 是校正後的相位譜。
接下來,將描述使用聲音處理裝置l校正靈敏度差別的結果。圖8A 和圖8B是示出使用聲音處理裝置1校正靈敏度差別的示例性結果的雷達 圖。通過基於由第一聲音接收單元14a和第二聲音接收單元14b接收的 各自聲音之間的相差來識別聲音傳來的方向,以及通過根據在聲音處理 單元125中執行的聲音處理中聲音傳來的方向,來執行例如對由第一聲 音接收單元14a接收的聲音進行抑制的處理,圖8A和圖8B示出達到的 方向性。圖8A和圖8B示出的雷達圖中的方向性是由信號功率(dB)指 示的,所述信號功率是對由第一聲音接收單元14a從聲音傳來的每個方向接收的聲音執行聲音處理之後的信號功率。這裡,當聲音從外殼io的
前面(在此第一聲音接收單元14a設置在聲音處理裝置1中)傳來時, 方位角定義為0°,當聲音來自右面時方位角定義為90°,當聲音來自後 面時方位角定義為180°,當聲音來自左面時方位角定義為270°。圖8A 示出當第一聲音接收單元14a和第二聲音接收單元14b之間的靈敏度差 別未校正時的方向性。實線指示第一聲音接收單元14a和第二聲音接收 單元14b的靈敏度相同時的狀態l;虛線指示第一聲音接收單元14a的靈 敏度高於第二聲音接收單元14b的靈敏度時的狀態2;交替的長短點劃線 指示第二聲音接收單元14b的靈敏度高於第一聲音接收單元和14a的靈 敏度時的狀態3。圖8B示出由本發明的聲音處理裝置1校正靈敏度差別 時的方向性。實線指示第一聲音接收單元14a和第二聲音接收單元14b 的靈敏度相同時的狀態1;虛線指示第一聲音接收單元14a的靈敏度高於 第二聲音接收單元14b的靈敏度時的狀態2;交替的長短點劃線指示第二 聲音接收單元14b的靈敏度高於第一聲音接收單元和14a的靈敏度時的 狀態3。
如圖8A所示,相比第一聲音接收單元14a的靈敏度和第二聲音接收 單元14b的靈敏度相同的狀態l,側面和後面的方向性在第一聲音接收單 元14a的靈敏度和第二聲音接收單元14b的靈敏度彼此不同的狀態2和3 下改變。相反,如圖8B所示,由於在狀態2和3中靈敏度差別的影響消 除或減小,因此在所有方向上,狀態2和3中的方向性相似於狀態1中 的方向性。
在第一實施例中,聲音處理裝置包括兩個聲音接收單元。但是,本 發明不限於此,並且聲音處理裝置能夠具有三個或更多聲音接收單元。 當聲音處理裝置包括三個或更多聲音接收單元時,通過將多個聲音接收 單元之一的聲音信號定義為參考信號,並通過執行功率譜比的計算、相 位校正值的計算以及對其它聲音接收單元的聲音信號的相位校正,能夠 減小靈敏度差別。
第二實施例
例如,在第二實施例中,考慮到減小處理負載以及防止聲音質量的 突然變化,改變根據第一實施例的聲音處理裝置。由於根據第二實施例
的聲音處理裝置的外形和示例性硬體配置與根據第一實施例的那些相 同,因此,參考根據第一實施例的相應部分並且將對它們的描述省略。 在以下描述中,相同附圖標記用於與第一實施例中實質相同的組件。
圖9是示出根據第二實施例的聲音處理裝置1的示例功能的功能性 方框圖。本發明的聲音處理裝置1包括第一聲音接收單元14a、第二聲音 接收單元14b、抗混疊濾波器160以及執行模擬-數字轉換的A/D轉換器 161。第一聲音接收單元14a和第二聲音接收單元14b包括用以放大模擬 聲音信號的放大器(未示出)。
聲音處理裝置1還包括幀產生單元120、 FFT執行單元121、用於計 算功率譜比的計算單元122、用於計算相位校正值的導出單元123、校正 單元124以及聲音處理單元125。此外,聲音處理裝置1包括用以選擇頻 率的頻率選擇單元126以及平滑單元(smoothing unit) 127,所述頻率用 於由計算單元122執行的對功率譜比的計算,所述平滑單元127平滑由 導出單元123計算的校正值隨時間的變化。幀產生單元120、 FFT執行單 元121、計算單元122、導出單元123、校正單元124、聲音處理單元125、 頻率選擇單元126以及平滑單元127都可以是作為通過執行存儲單元12 中的各種電腦程式而實現的軟體的功能。但是,這些功能也可以通過 使用專用硬體例如集成電路的各種處理晶片而實現。
接下來,將描述根據第二實施例的聲音處理裝置1執行的處理。圖 IO示出了由根據第二實施例的聲音處理裝置1執行的示例性處理的操作 圖。基於由相應的聲音接收單元14接收的聲音,通過用於執行計算機程 序100的控制單元11的控制,聲音處理裝置1產生模擬聲音信號,如S200 所示,使用抗混疊濾波器160濾波所述信號,並且使用A/D轉換器161 將所述信號轉換為數位訊號。
在基於控制單元11的控制由幀產生單元120執行的處理中,聲音處 理裝置1將來自被轉換為數位訊號的每一個聲音信號的每個聲音信號分 為具有預定時間長度的多個幀,所述幀用作為處理單元,如S202所示, 並且在基於控制單元11的控制由FFT執行單元121執行的處理中,聲音 處理裝置1通過FFT處理將以幀為單位的聲音信號轉換為用作頻域信號 的頻譜,如S203所示。在基於控制單元11的控制由頻率選擇單元126執行的處理中,聲音 處理裝置1在從例如1000到3000Hz的頻率範圍中選擇SNRs(信號噪聲 比)高於或等於預定值的頻率,該頻率範圍不受抗混疊濾波器160的影 響,如S204所示。
在基於控制單元11的控制由計算單元122執行的處理中,聲音處理 裝置1計算在操作S204中選擇的頻率的功率譜比,如S205所示,計算 功率譜比的平均值,如S206所示,並且在基於控制單元11的控制由導 出單元123執行的處理中,聲音處理裝置1基於功率譜比的平均值,計 算第二聲音接收單元14b的頻域聲音信號相對於第一聲音接收單元14a 的頻域聲音信號的相位校正值,如S207所示。操作S205到S207的處理 是由下述方程式(9)或(10)表示的。formula see original document page 15方程式(9)
其中Pcomp是相位校正值,ot和p是常數,N是選擇的頻率的數量, F是函數,Sl(co)是基於第一聲音接收單元14a的聲音信號的功率譜, 以及S2(co)是基於第二聲音接收單元14b的聲音信號的功率譜。
formula see original document page 15 方程式(io)
其中Pcomp是相位校正值,oc和p是常數,N是選擇的頻率的數量, F是函數,Sl(co)是基於第一聲音接收單元14a的聲音信號的功率譜, 以及S2(co)是基於第二聲音接收單元14b的聲音信號的功率譜。
方程式(9)和(10)表示的相位校正值是基於在選定頻率的功率譜 比的平均值而計算的代表值,並且不依靠選擇頻率來改變。在第二實施 例中,由於校正值是基於在N個選定頻率的頻譜而計算的,所以可以減 少處理負載(processing load)。由於隨後處理與校正值的時間性變化(time change)有關,因此將索引相位校正值Pcomp作為校正值Pcomp(t),其 是時間(幀)t的函數。
在基於控制單元11的控制由平滑單元127執行的處理中,聲音處理 裝置1平滑校正值隨時間的變化(temporal variation),如S208所示。 在操作S208中,使用下述方程式(11)執行平滑處理。
formula see original document page 16 方程式(11)
其中^是從o到i的常數。
在操作S208中,使用方程式(11)所示的一個先前校正值Pcomp(t-l) 來平滑時間性變化(time change)。因此,能夠再現自然的聲音,同時 防止校正值的突然變化。這裡,常數Y可以是例如0.9。更進一步,當選 定頻率的數量低於預定值時,例如是5,可以暫時將常數Y設定為1,從 而停止對校正值的更新。這樣,由於不使用具有在SNR低時所獲得的低 精確度的校正值,因此能夠提高可靠性。此外,為了防止由例如噪聲引 起的不期望的過度校正,需要為校正值設置上限和下限。能夠使用 sigmoid函數來代替使用方程式(ll),從而平滑校正值的時間性變化(time change)。
基於控制單元11的控制下,在由校正單元124執行的處理中,聲音 處理裝置1將操作S208中計算的相位校正值加到第二聲音接收單元14b 的頻域聲音信號的相位,以校正第二聲音接收單元14b的聲音信號,如 S209所示。在操作S209中,使用在整個頻率範圍上的特定(specific) 校正值校正聲音信號。
基於控制單元11的控制下,在由聲音處理單元125執行的處理中, 聲音處理裝置1執行各種聲音處理,例如基於第一聲音接收單元14a的 聲音信號以及第二聲音接收單元14b的相位被校正的聲音信號,來抑制 由第一聲音接收單元14a接收的聲音,如S210所示。
第一和第二實施例僅是本發明眾多實施例中的部分。可以理解的是硬體 和軟體的配置可以設置成適當的配置,並且可以結合與上述基本處理不同的 各種處理。
權利要求
1. 一種聲音處理裝置,用於處理接收到的聲音,該裝置包括多個聲音接收單元,所述多個聲音接收單元的每一個聲音接收單元輸出與接收到的聲音對應的聲音信號;轉換單元,用於將時域中的聲音信號轉換為頻域中的轉換後信號;計算單元,用於獲得兩個所述轉換後信號之間的頻譜比;導出單元,用於基於所述頻譜比導出相位校正值,基於與兩個所述轉換後信號中的一個轉換後信號對應的一個聲音信號,以對應於兩個所述轉換後信號中另一個轉換後信號的另一個聲音信號為基礎,所述相位校正值能夠校正所述另一個聲音信號的相位;以及校正單元,用於校正所述聲音信號的相位。
2. 如權利要求1所述的聲音處理裝置,其中所述計算單元能夠獲得兩個 所述轉換後信號之間的功率譜比。
3. 如權利要求2所述的聲音處理裝置,其中用下面的方程式的形式表示 所述相位校正值其中"是角頻率,Pcomp(o)是所述相位校正值,Si(")是兩個所述轉換 後信號中一個轉換後信號的功率譜,S2(")是兩個所述轉換後信號中另一個 轉換後信號的功率譜,Ot和P是常數,以及F《S2((0)/SKC0》是S2(C0)/S"(D)的函數。
4. 如權利要求2所述的聲音處理裝置,其中用下面的方程式的形式表示所述相位校正值Pcomp(co) = [aF(S"co)/S2(co川co + p其中"是角頻率,Pcomp(co)是所述相位校正值,S"co)是兩個所述轉換 後信號中一個轉換後信號的功率譜,S2(")是兩個所述轉換後信號中的另一個轉換後信號的功率譜,a和(3是常數,以及F^(co)/S2((o》是S"co)/S2(co)的函數。
5. 如權利要求3所述的聲音處理裝置,其中所述函數是對數函數,並且 所述校正單元執行加法運算,將所述相位校正值加到兩個所述轉換後信號中 另一個轉換後信號的相位上。
6. 如權利要求4所述的聲音處理裝置,其中所述函數是對數函數,並且 所述校正單元執行加法運算,將所述相位校正值加到兩個所述轉換後信號中 另一個轉換後信號的相位上。
7. 如權利要求1所述的聲音處理裝置,其中所述計算單元能夠獲得兩個 所述轉換後信號的振幅譜之間的比率。
8. 如權利要求1所述的聲音處理裝置,進一步包括平滑單元,用於平滑所述相位校正值隨時間的變化,其中基於由所述平 滑單元平滑後的所述相位校正值,所述校正單元校正所述聲音信號的相位。
9. 一種校正接收到的聲音信號之間相差的方法,該方法包括如下操作-分別將時域中的每個聲音信號轉換為頻域中的轉換後信號,每個所述聲音信號對應於各自的接收到的聲音信號;執行計算以獲得兩個所述轉換後信號之間的頻譜比;通過使用所述頻譜比導出相位校正值,所述相位校正值基於兩個所述轉 換後信號中一個轉換後信號導出;以及校正兩個所述轉換後信號中另 一個轉換後信號的相位。
全文摘要
本發明公開一種校正相差的聲音處理裝置和方法,該聲音處理裝置處理接收的聲音。包括在該裝置中的多個聲音接收單元,分別輸出對應於接收的信號的聲音信號,然後將時域中的聲音信號轉換為頻域中的分別的轉換後信號,以及計算兩個轉換後信號之間的頻譜比,以導出用以校正聲音信號的相位的相位校正值。因此,本發明的聲音處理裝置和方法能夠校正包含在該裝置中的多個麥克風的靈敏度變化,以及能夠校正隨產品壽命而產生的磨損所引起的特徵改變。
文檔編號H04R1/40GK101378607SQ200810212648
公開日2009年3月4日 申請日期2008年8月27日 優先權日2007年8月27日
發明者早川昭二 申請人:富士通株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀