新四季網

音頻信號處理的製作方法

2023-12-04 21:38:06


通信系統允許用戶彼此經由網絡通信。網絡可以是例如網際網路或公共交換電話網(PSTN)。音頻信號能夠在網絡的節點間傳輸,從而允許用戶在通信系統上的通信會話中彼此發送和接收音頻數據(諸如語音數據)。

用戶設備可以具有諸如麥克風的音頻輸入裝置,其能夠用於接收來自用戶的諸如語言的音頻信號。用戶可以進入與另一用戶的通信會話,諸如私有通話(在通話中僅有兩個用戶)或者會議通話(在通話中有兩個以上的用戶)。用戶的語音在麥克風處接收到,經過處理,然後經由網絡發送到通話中的其它用戶。用戶設備還可以具有諸如揚聲器的音頻輸出裝置,用於將在通話期間經由網絡自遠端用戶接收的音頻信號輸出到近端用戶。這些揚聲器還能夠用於從在用戶設備處執行的其它應用輸出音頻信號,並且該音頻信號可能被麥克風拾取作為非期望的音頻信號,該非期望的音頻信號將幹擾來自近端用戶的語音信號。

連同來自用戶的音頻信號一起,麥克風還可以接收其它音頻信號,諸如背景噪聲,其是非期望的並且可能干擾從用戶接收到的音頻信號。背景噪聲可能會帶來對在麥克風處從近端用戶接收到而在通話中傳輸到遠端用戶的音頻信號的幹擾。



技術實現要素:

提供該發明內容以便以簡化的形式來引入下面的具體實施方式中進一步描述的概念的選擇。該發明內容不旨在確定所要求保護的主題的關鍵特徵或主要特徵,也不旨在用於限定所要求保護的主題的範圍。

公開的是一種音頻信號處理設備,其具有用於輸出模擬音頻信號的擴音器組件和用於接收模擬音頻信號的麥克風組件。該設備包括音頻接口。音頻接口被配置為以數字形式接收在設備上生成的以便經由擴音器組件輸出的任何音頻信號以及從所述音頻信號生成模擬形式的送出音頻信號(outgoing audio signal)以便供給到所述擴音器組件。音頻接口被配置為,在生成所述送出音頻信號時,將動態範圍壓縮應用於所述音頻信號。設備還包括處理器,處理器被配置為執行軟體。該軟體被配置為接收進入音頻信號(incoming audio signal)並且從進入音頻信號生成數字形式的音頻信號。由軟體生成的音頻信號被供給到音頻接口以便由擴音器組件輸出並且用作經由麥克風組件接收到的音頻信號的音頻信號處理的基準。

生成音頻信號包括軟體將初始非線性振幅處理應用於進入音頻信號以修正其功率包絡,所述音頻信號因此具有修正後的功率包絡。音頻信號的修正後功率包絡足夠平滑以使得當動態範圍壓縮由音頻接口應用於所述音頻信號時基本上不受動態範圍壓縮影響。

附圖說明

為了輔助理解本主題並且顯示出如何將本主題投入實際使用,現在通過示例的方式參考以下附圖,在附圖中:

圖1示出了通信系統的示意圖;

圖2是用戶設備的示意性框圖;

圖3是根據一個實施例的回波消除技術的示意功能圖;

圖3A是根據另一實施例的回波消除技術的示意功能圖;

圖3B是根據另一實施例的回波消除技術的示意功能圖;

圖4是回波消除過程的流程圖;

圖5A是動態範圍向下壓縮函數的示意性表示;

圖5B是動態範圍向上壓縮函數的示意性表示;

圖6A和6B是音頻信號功率包絡的示意性比較;

圖7是查找表的示意圖。

具體實施方式

現在僅通過示例的方式來描述實施例。

圖1示出了通信系統100,通信系統100包括與第一用戶設備104相關聯的第一用戶102(「用戶A」)和與第二用戶設備110相關聯的第二用戶108(「用戶B」)。在其它實施例中,通信系統100可以包括任意數量的用戶和相關聯的用戶設備。用戶設備104和110能夠通過通信系統100中的網絡106來通信,從而允許用戶102和108彼此通過網絡106通信。圖1所示的通信系統100是基於分組的通信系統,但是可以使用其它類型的通信系統。網絡106可以是例如網際網路。用戶設備104和110中的每一個可以是例如行動電話、平板設備、膝上型設備、個人計算機(「PC」)(包括例如WindowsTM、Mac OSTM和LinuxTM PC)、遊戲設備、電視、個人數字助理(「PDA」)或能夠連接到網絡106的其它嵌入式設備。用戶設備104被布置成從用戶設備110的用戶108接收信息以及輸出信息給用戶設備110的用戶108。用戶設備104包括諸如顯示器和揚聲器的輸出裝置。用戶設備104還包括諸如鍵板、觸控螢幕、用於接收音頻信號的麥克風和/或用於捕獲視頻信號的圖像的照相機的輸入裝置。用戶設備104連接到網絡106。

用戶設備104執行由與通信系統100相關聯的軟體提供商所提供的通信客戶端的實例。通信客戶端是在用戶設備104中的本地處理器上執行的軟體程序。客戶端執行在用戶設備104處所需的處理以便用戶設備104經由通信系統100發送和接收數據。

用戶設備110對應於用戶設備104並且在本地處理器上執行對應於在用戶設備104處執行的通信客戶端的通信客戶端。在用戶設備110處的客戶端執行所需的處理以允許用戶108以與用戶設備104處的客戶端執行所需處理而允許用戶102經由網絡106通信的方式相同的方式來經由網絡106通信。用戶設備104和110是通信系統100中的端點。為清晰,圖1僅示出了兩個用戶(102和108)以及兩個用戶設備(104和110),但是更多的用戶和用戶設備可以包含在通信系統100中,並且可以利用在他們相應的用戶設備上執行的相應的通信客戶端經由通信系統100來通信。

除了設備上的本地處理器之外,設備典型地具有專門的音頻信號處理模塊(諸如,音效卡)。該音頻信號處理模塊為用戶設備執行音頻處理功能,諸如對在麥克風處捕獲的音頻信號的模擬數字轉換(ADC)以及對從揚聲器播出的音頻信號的數字模擬轉換(DAC)。為了使用音頻信號處理模塊,在設備上的本地處理器上執行的作業系統(OS)通常需要特定的軟體。例如,為了使用音效卡,OS通常需要特定的音效卡驅動器(處置音效卡的物理硬體與作業系統之間的數據連接的軟體程序)。

音效卡硬體和音效卡驅動器軟體構成了本文所使用的「音頻接口」的示例。一般地,音頻接口是設備(例如,用戶設備104、110)的組件(例如,軟體、硬體或兩者的組合),其被配置為以數字形式接收在該設備上生成的以便經由擴音器組件輸出的任何音頻信號以及從所述音頻信號生成模擬形式的送出音頻信號以便供給到擴音器組件。

常見的是,音頻接口(也即,驅動器軟體和/或硬體本身)引入對播出信號(即,待從揚聲器輸出的信號)的影響從而最大化用戶體驗(例如,包含在驅動器和/或硬體中的響度增強效果)。這些效果是通過音頻接口的信號處理模塊來實現的,其功能是在使用OS中可用的播出系統的、在設備上的本地處理器上執行的應用(例如,通信客戶端)的控制之外的,並且可能不為其所知。例如,常見的是硬體製造商在例如膝上型設備、智慧型手機、平板設備等中的擴音器設置中包含「動態範圍壓縮」(例如,用於針對給定峰值信號電平最大化覺察到的響度的最大化)。

動態範圍壓縮(還稱為動態壓縮或簡稱為壓縮)通過縮窄或「壓縮」音頻信號的動態範圍來減少了響亮聲音的音量或者放大靜音的音量(例如,使得安靜的部分更可聽和/或防止響亮的部分過度響亮)。向下壓縮將特定閾值以上的響亮聲音降低同時安靜的聲音保持不受影響,而向上壓縮增大閾值以下的聲音的響度同時使得較響亮的音段不變。向下壓縮和向上壓縮均減小了音頻信號的動態範圍。

一般地,本公開考慮音頻接口,該音頻接口被配置為,在由供給的音頻信號生成送出音頻信號時,將動態範圍壓縮應用於該音頻信號。這種壓縮的使用意在增強用戶體驗,例如,因為用戶能夠覺察到較響亮的聲音。

第一用戶設備104和第二用戶設備110二者均可以執行聲學回波消除。存在兩種主要的實現聲學回波消除的方式,一種是回波減除,另一種是回波抑制。通常,這兩種方法是組合的。

通過第一用戶設備104的麥克風捕獲的音頻信號經由網絡106傳輸以便由第二用戶設備110播出。第二用戶設備110的麥克風捕獲由第一用戶設備104傳輸的音頻信號的回波。如果該回波沒有完全地消除,則第二用戶設備110將其傳回第一用戶設備104。該接收到的信號通過第一用戶設備104的揚聲器播出,並且回波通過第一用戶設備104的麥克風捕獲。如果第一用戶設備104中的回波消除器不能完全地去除該回波,則回波信號再次傳輸到第二用戶設備110。

回波消除典型地利用從擴音器前的音頻信號處理鏈中的一點抽取(tap)的基準,該基準典型地是在音頻信號供給到擴音器之前的音頻信號的某個版本,並且對音頻信號的該版本所觀察到的回波路徑進行建模。該回波路徑不僅包括擴音器與麥克風之間的空氣接口,而且還包括在音頻信號的該版本被抽取的點後應用於音頻信號的該版本的、且因此沒有反映在基準中的任何後續信號處理。

一般地,當在設備播出的輸出中尋求基準時(用於回波消除或某其它基於基準的信號處理),如果設備應用了在基準中未反映出的未知的非線性處理,則可能會發生問題。

例如,傳統的回波消除器更佳地適於對回波路徑中的線性失真進行建模並且通常具有導致存在於回波路徑中的非線性失真的問題。該非線性回波路徑會導致信號中的回波洩漏或回波殘差。也即,當在基準與麥克風信號中拾取的回波分量之間存在大致線性關係時,傳統的回波消除器典型地表現最佳。

然而,當在通信設備的音頻接口中使用動態範圍壓縮時,其會將非線性引入回波路徑中。這對於回波消除器產生了挑戰,因為動態範圍壓縮構成了通過傳統回波消除方案建模差的非線性振幅處理,如所論述的。

一些作業系統包括用於將正要播出的信號反饋回到在本地處理器上執行的應用的功能。反饋回到在本地處理器上執行的應用的該信號在下文稱為「回送信號」。該回送信號隨後可用作回波消除程序中的基準。包含該功能的作業系統的示例是微軟的Windows 7、8、XP和Vista,以及Windows Phone 8作業系統。使用回送信號的回波消除器不需要對由音頻接口引入的那些非線性失真進行建模(因為音頻接口有效地從回波路徑去除),並且因此,回波洩漏是不期望的。然而,回送信號不能為全部作業系統所用。不具有該回送功能的作業系統的示例是Android和iOS行動作業系統。在缺失回送基準信號的情況下,回波消除會失敗並且產生回波洩漏以及其它,本公開的一個目的在於防止或至少減少這種回波洩漏。

音頻信號,諸如通過麥克風捕獲的基本上未經處理的語音,典型地具有隨時間變化的峰值信號振幅。也即,音頻信號典型地具有隨時間變化的功率包絡。音頻信號的功率包絡是反映音頻信號功率|x(t)|2中的峰值的變化的音頻信號x(t)的特性。音頻信號的功率包絡能夠通過對|x(t)|2(或者|x(t)|2的正則化版本)進行低通濾波來獲得,例如,通過在適當的持續期間(參見下文)的時間窗口內取信號功率|x(t)|2或者正則化信號功率的移動平均值(窗口平均值)。

本公開實現了:當應用於具有典型的時變功率包絡ENV[|w(t)|2|(其中,ENV[.]是適當的低通濾波器,諸如移動平均函數)的典型的音頻信號w(t)時,例如基本上未經處理的語音,動態範圍壓縮的效果是減少峰值信號功率中的變化,從而平滑該信號的功率包絡ENV[|w(t)|2](即,減少其中的變化)。也即,利用壓縮來減小動態範圍也使得信號功率包絡平滑。

然而,本公開進一步認識到,當由函數B(.)表示的動態範圍壓縮(DRC)被應用於(例如,通過音頻接口)具有已經足夠平滑的功率包絡ENV[|x(t)|2]的音頻信號x(t)時,該已經平滑的功率包絡基本上不受音頻接口DRC B(.)影響,意味著DRC B(.)對於該音頻信號x(t)的效果至多是信號功率包絡ENV[|x(t)|2]的基本上線性振幅變換;也即,音頻信號功率包絡的基本上線性的標定其中c是常數,Δ(t)基本上為零。在多頻帶方案中,該關係變成其中每個i指示不同的濾波器組容器(filter bank bin),並且Δi(t)對於每個i基本上為零。

本公開進一步在音頻信號處理設備(例如,用戶設備)的背景下利用該實現,音頻信號處理設備具有擴音器(或類似部件)、麥克風(或類似部件)以及上述種類的音頻接口,即,在設備上的軟體生成用來輸出的任何音頻信號如果要經由擴音器輸出則必須供給到該音頻接口,該音頻接口使得供給的音頻信號經過不能受軟體控制的『非自發』動態範圍壓縮B(.)。經由麥克風接收到的音頻信號經過基於基準的音頻信號處理,基於基準的音頻信號處理利用基準(例如,如上所提及以及如下文進一步詳述的回波消除)。

更具體地,主題採用前述實現通過軟體在預處理步驟應用初始的『自發』非線性振幅處理(例如,初始DRC)於進入音頻信號w(t)以修正其在軟體域內的功率包絡,從而生成具有修正後的功率包絡的數字音頻信號x(t)——修正後的功率包絡足夠平滑以便基本上不受音頻接口DRC B(.)影響(即,使得實現功率包絡匹配ENV[|B(x(t))|2]≈c*ENV[|x(t)|2],參見上文),其能夠通過使得初始DRC足夠進取(aggressive)來實現(參見下文)。通過在預處理步驟中衰減,通過應用初始DRC以壓縮信號,未知的非線性處理的德爾塔效應(上文的Δ(t))預期會少很多。

在多頻帶方案中,對於每個子頻帶i的匹配ENV[|B(xi(t))|2]≈c*ENV[|xi(t)|2],可通過在每個子頻帶i中單獨應用DRC(多頻帶DRC)來實現。如果音頻接口的未知處理的已知的不同子頻帶是已知的,則這可以進行優化,至少粗略地因為能夠在軟體域中執行等價的濾波器組劃分(即,將多頻帶軟體DRC的子頻帶匹配那些未知的處理)。

在實施例中,應用DRC,其足夠進取以使得進一步順著信號路徑下行的(未知的)處理在衰減方面不具有大的德爾塔效應。

在應用諸如初始DRC的足夠進取的初始非線性振幅運算時(其可以或者可以不類似於音頻接口壓縮),在音頻接口已經對其進行運算之後對修正後的功率包絡的淨效應小。如參考下文變得顯而易見的,定義功率包絡的窗口可以具有對於不同實現方式變化且取決於應用到麥克風信號的信號處理的本質的多個適當的持續期間,窗口定義了音頻信號基本上不受音頻接口處理影響的時間尺度。例如,其中信號處理是回波消除,適當的持續期間由回波消除器的時間尺度來確定,並且需要足夠小以顯示出不能適應的差別(例如,因為它們過於突然)作為系統增益變化,系統增益變化反映在麥克風信號中,例如,過於突然而不能由回波消除器適應的系統增益變化,就好像它是由移動揚聲器和麥克風更靠近或者更分開而引起的(典型地,回波消除器能夠適應類似這樣的變化)。

例如,對於典型的基於抑制的回波消除形式的信號處理,期望定義在具有數百毫秒大小的數量級(例如近似200ms,這是約略的數字)的窗口內的音頻信號x(t)的功率包絡足以基本上不受音頻接口處理影響而實現期望的效果。如參考下文將意識到的,這些值僅旨在示範,而且將取決於回波抑制的本質而變化(下文進行討論)。

在該上下文中,音頻接口動態範圍壓縮能夠被視為「快速動作自動增益控制」,其中「快速」意指對於音頻信號處理(例如,回波消除)而言過快而不能跟得上將導致缺少初始動態範圍壓縮的增益變化(例如,對於回波消除器而言過快而不能適應且因此會導致回波洩漏的變化)。然而,通過應用初始處理來匹配輸入與輸出信號功率包絡,這防止發生任何這樣的快速增益變化。

因為音頻信號x(t)產生於軟體本身之中,所以軟體能夠容易地被配置為提供減小動態範圍的音頻信號x(t)以用作麥克風信號的音頻信號處理中的基準。並且,因為在音頻信號x(t)供給到音頻接口時音頻信號x(t)的動態範圍已經足夠窄,所以由該信號x(t)觀察到的回波路徑由於音頻接口DRC B(.)而不包含任何非線性——也即,音頻接口的任何固有的非線性特性(由於DRC B(.)引起)不會顯現在音頻接口的輸出B(x(t))中,並且因此當將基於基準的音頻信號處理應用於拾取了擴音器輸出的麥克風信號時,不必對其進行解釋。

也即,基準與麥克風信號中的任何回波分量之間的非線性振幅差(由於B(x(t))是在當經由擴音器輸出時拾取的)減小,這樣能夠簡化音頻信號處理以及其它。

當Δ(t)(或者對於每個i的Δi(t))足夠小而使得其不顯著地影響信號處理(例如,足夠小以使得信號處理能夠在假設基準與麥克風信號中的回波分量之間的線性關係的假設下正確地起作用)時,軟體生成的信號x(t)和來自音頻接口的送出音頻信號B(x(t))被視為匹配。也即,一般地,用於匹配信號的具體標準是情形相關的並且尤其取決於應用於麥克風信號的信號處理的本質。

例如,在信號處理是回波消除的情況下,回波消除被簡化,因為音頻接口的非線性特性不必被建模(因為這些特性沒有顯現在音頻接口的輸出B(x(t))中)。初始軟體DRC的非線性特性也不必被建模,因為由於軟體壓縮信號x(t)用作基準所以軟體DRC有效地布置在建模的回波路徑之前。

在回波消除的情況下,當Δ(t)(或者對於每個i的Δi(t))足夠小而不會引起回波消除過程中的顯著偽跡(artefact)時,例如足夠小而不會引起回波洩漏,軟體生成的信號x(t)和來自音頻接口的送出音頻信號B(x(t))的功率包絡被視為匹配。回波消除器典型地對於回波路徑中的小的非線性具有一定的魯棒性(以防止小的非線性引起回波洩漏),並且在該情況下,當回波消除器對於Δ(t)(或者Δi(t))魯棒時,包絡被視為匹配。例如,回波抑制器可以應用過抑制以提供該魯棒性,並且在該情況下,至少當Δ(t)(或者Δi(t))足夠小以由過抑制補償時信號包絡才被視為匹配(下文論述)。

主題尤其而非排他地應用於音頻接口的輸出B(x(t))不能在用戶設備上的軟體中使用的情形(例如,沒有可用的回送信號的情況)。

圖2圖示出用戶設備104的詳細視圖,在該用戶設備上執行通信客戶端實例206以便經由通信系統100通信。用戶設備104包括一個或多個中央處理單元(「CPU」)202,連接到它的有:輸出設備,諸如顯示器208,其可以實現為觸控螢幕;以及用於輸出音頻信號的揚聲器(或者「擴音器」)210;用於接收音頻信號的諸如麥克風212的輸入設備;用於接收圖像數據的照相機216,以及鍵板218;用於存儲數據的存儲器214;以及用於與網絡106通信的諸如數據機的網絡接口220。揚聲器210經由音頻信號處理模塊209連接到CPU 202。用戶設備104可以包括諸如圖2所示的其它元件。顯示器208、揚聲器210、麥克風212、存儲器214、照相機216、鍵板218和網絡接口220可以集成到用戶設備104中,如圖2所示。在可替代的用戶設備中,顯示器208、揚聲器210、麥克風212、存儲器214、照相機216、鍵板218和網絡接口220中的一個或多個可以不集成到用戶設備104中並且可以經由相應的接口連接到CPU 202。該接口的一個示例是USB接口。如果用戶設備104與網絡106的經由網絡接口220的連接是無線連接,則網絡接口220可以包括用於將信號無線發送到網絡106以及無線地接收來自網絡106的信號的天線。

圖2還圖示出在CPU 202上執行的作業系統(「OS」)204。在OS 204上運行的是通信系統100的客戶端實例206的軟體。作業系統204管理計算機的硬體資源並且處置經由網絡接口220發送到網絡106以及發送自網絡106的數據。客戶端206與作業系統204通信並且管理經由通信系統的連接。客戶端206具有客戶端用戶接口,其用於向用戶102呈現信息以及接收來自用戶102的信息。通過這種方式,客戶端206執行允許用戶102在通信系統100上通信所需的處理。在該示例中,OS 204不提供客戶端206使用的回送信號。

CPU 202還執行驅動器軟體(未示出),其將軟體接口提供給音頻信號處理模塊209。生成以便在用戶設備140上輸出(例如,由客戶端和其它應用)的任何音頻數據在將要經由揚聲器210輸出時必須供給到音頻信號處理模塊209進行處理。

參考圖3,現在描述一種回波消除的方法。圖3是用戶設備104的部分的功能圖。

如圖3所示,用戶設備104包括音頻接口306,其代表了音頻信號處理模塊209及其關聯的驅動器軟體的組合功能。用戶設備104還包括揚聲器210、麥克風212和信號處理模塊300。信號處理模塊300(諸如圖3中的虛線框所示)代表了通過在設備104的CPU 202上執行通信客戶端應用206所實現的信號處理功能。信號處理模塊包括:非線性振幅處理模塊,其為動態範圍壓縮(DRC)模塊302的形式;建模模塊304,其包括濾波器模塊、降噪模塊308以及回波消除模塊,回波消除模塊是抑制模塊310以在該實施例中實現回波抑制,但是在其它實施例中可以可替代地或者另外實現回波減除。通過執行通信客戶端應用206所實現的信號處理功能可以包括比圖3所示更多或更少的功能。

為了對回波路徑增益建模以及估計通過麥克風捕獲的回波,需要基準信號,其為標記為x(t)的信號。該信號代表了通信客戶端發送(經由網絡106)以便從揚聲器播出的且在其經由擴音器210輸出之前經過了位於軟體客戶端域之外的音頻接口306的後續處理的音頻信號w(t)(通過壓縮模塊302處理)的處理後版本。

如上所述,音頻接口進行的該進一步的處理包括在信號處理模塊300的控制之外的(進一步的)動態範圍壓縮。

待從揚聲器210輸出的進入音頻信號w(t)與DRC模塊302的輸入耦合。信號處理模塊300與音頻接口306耦合。特別地,增益模塊303的輸出x(t)=A(w(t))(標示「遠端信號」)與音頻接口306的輸入耦合。增益模塊302的輸出還與建模模塊304的第一輸入耦合。音頻接口306的輸出與揚聲器210耦合。應當注意,在本文所述的實施例中,僅存在一個揚聲器(通過圖中的附圖標記210來指示),而在其它實施例中,可以存在多於一個的揚聲器,待輸出信號與揚聲器耦合(用於從其中輸出)。類似地,在本文所述的實施例中,僅存在一個麥克風(由圖中的附圖標記212指示),但是在其它實施例中,可以存在從周圍環境接收音頻信號的多於一個的麥克風)。麥克風212的輸出y(t)與信號處理模塊300耦合。特別地,麥克風212的輸出y(t)與降噪模塊308的輸入耦合。麥克風212的輸出y(t)還與建模模塊304的第二輸入耦合。建模模塊304的輸出與回波抑制模塊310的第一輸入耦合。降噪模塊308的輸出與回波抑制模塊310的第二輸入耦合。回波抑制模塊310的輸出用於提供接收的信號(已經應用了回波消除)以便在用戶設備104中進一步處理。

此處,函數「A(.)」是預處理算子,其應用動態範圍壓縮(例如,最大化);也即,「A(.)」表示在生成輸出x(t)=A(w(t))時由DRC模塊302執行的函數。音頻信號x(t)是用作回波消除基準的信號,並且還送到驅動器(即,送到音頻接口)以便播出。

圖4是信號處理模塊300的過程的流程圖。

在步驟S400中,接收到進入音頻信號w(t),其是從揚聲器210輸出的。例如,待輸出信號可以是遠端信號,其在用戶102與108之間經由通信系統100進行通話的期間在網絡接口220處從用戶設備110接收到用戶設備104處。在其它實施例中,待輸出信號可以從除了在通話中經由通信系統100之外的某處接收。例如,待輸出信號可能已經存儲在存儲器214中,並且步驟S400可以包括從存儲器214取回信號。

在步驟S402中,軟體DRC壓縮模塊302將初始動態範圍壓縮——由函數A(.)表示——應用於進入音頻信號w(t)以減小其動態範圍,從而生成具有減小的動態範圍(即,壓縮的音頻信號)的音頻信號x(t)=A(w(t))。在應用軟體級(通過客戶端應用206)以數字形式生成壓縮的音頻信號x(t)=A(w(t))。

在實施例中,初始動態範圍壓縮可以構成對進入音頻信號w(t)執行的向下壓縮函數和/或向上壓縮函數,由此通過將電平相關增益應用於進入信號w(t),進入信號w(t)的較響亮部分相對於較安靜部分減少。

向下壓縮函數的示例圖示在圖5A的曲線圖500中。對輸入信號(當通過DRC模塊302實現時為w(t))執行向下壓縮函數以生成具有比輸入信號窄的動態範圍的輸出信號(當通過DRC模塊302執行時為x(t))。曲線圖500顯示出作為以dB(「分貝」)計的輸入信號電平的函數的以dB計的輸出信號電平。向下壓縮函數具有閾值T和比率R:1(R≥1)的形式的參數,其以如下方式確定向下壓縮的本質和程度。

如圖5A所示,對於具有閾值電平T以下的電平的輸入信號的每個(時間的)部分,該部分的電平基本上不受向下壓縮影響。也即,在該閾值以下,電平相關增益具有基本為0dB的恆定值(等於線性域中的增益1)。

相反,對於具有閾值T以上的電平的信號的每個(時間的)部分,該部分的電平按比率R:1所確定的量衰減。具體地,對於具有超過閾值T的特定電平IN的輸入信號的特定部分,該特定部分衰減而具有降低的電平也即,衰減了以dB計的量(其是電平相關的,因為衰減量取決於輸入電平IN)。

壓縮具有進取性,其至少部分地通過閾值和比率值來實現。動態範圍壓縮的進取性意味著輸出音頻信號的動態範圍相對於輸入信號的動態範圍減小的程度——較低(相應地較高)的閾值和較高(相應地較低)的比率實現了更多(相應地更少)的進取性的動態範圍壓縮。

在圖5B的曲線圖500』圖示出了向上壓縮函數的示例。向上壓縮函數也對輸入信號(當通過DRC模塊302實現時為w(t))執行以生成具有比輸入信號窄的動態範圍的輸出信號(當通過DRC模塊302執行時為x(t))。曲線圖500』顯示出作為以dB(「分貝」)計的輸入信號電平的函數的以dB計的輸出信號電平。向上壓縮函數還具有閾值T和比率R:1(R≥1)的形式的參數,其以如下方式確定向下壓縮的本質和程度。然而,與圖5B的向下壓縮對比,對於具有閾值電平T以上的電平的輸入信號的每個(時間的)部分,該部分的電平基本上不受向上壓縮影響。也即,在該閾值以上,電平相關增益具有基本上為0dB的恆定值(等價於線性域內的增益1)。對於具有閾值T以下的電平的信號的每個(時間的)部分,該部分的電平提升了按比率R:1所確定的量。具體地,對於具有位於閾值T以下的特定電平IN的輸入信號的特定部分,該特定部分被提升為具有增加的電平

此處,音頻信號a(t)的「動態範圍」(例如,A(x(t)))是指該音頻信號a(t)的較響亮部分與較安靜部分之差並且能夠按例如應用於音頻信號a(t)或功率包絡ENV[|a(t)|2|]的統計測量進行量化,例如(移動)標準差,曲線的差值的(移動)範數,等等。

如將意識到的,這些僅是簡單動態壓縮器的示例。可替代的壓縮器可以通過另外的參數而參數化,另外的參數諸如攻擊時間(其確定了一旦該信號的電平開始超過閾值則壓縮器響應以衰減輸入信號的速度)、釋放時間(其確定了一旦信號電平降至閾值以下則壓縮器返回0dB增益的速度)、和/或拐點(其起到平滑從閾值以下的無衰減區域到閾值以上的電平相關衰減區域的過渡的作用)。通過減小(相應地增加)攻擊時間或釋放時間,和/或通過減小(相應地增加)拐點,能夠增加(相應地減小)壓縮的進取性。

此外,可替代地或者另外地,壓縮器可以是多頻帶壓縮器,其中信號的兩個或更多個的相應的頻帶中的兩個或更多個的頻率分量被彼此單獨壓縮——在該情況下,相應量的增益基於頻率分量的電平而應用於每個信號。對於每個頻率分量,可以存在確定待應用於該頻率分量的增益的單個相應的閾值和/或比率(和/或其它參數),或者相同的參數可以用於不同的頻率分量。

在一個實施例中,軟體DRC構成了最大化器,其應用增益量於信號w(t),該量取決於信號w(t)的電平,進取性具有大小為10ms的數量級(其將被視為極有進取性)。

在該上下文中,進取性是指軟體DRC(例如,最大化器)的時間常數τ。時間常數確定了通過改變其應用於信號w(t)的信號電平的變化的電平相關增益的軟體DRC反應有多快(適應時間)。例如,在w(t)的電平變化了δ1而引起電平相關DRC增益最終變化了δ2的情況下,對於具有時間常數τ的軟體DRC,電平相關增益將花費近似τ來使電平相關增益變化即,實現近似63%的分數變化。

如將意識到的,10ms數量級的大小是粗略的數字,如將要論述的,其實際上對於信號處理(例如,回波消除)的本質具有顯著相關性。如將意識到的,實際上,軟體DRC的進取性可以適當地在設計階段進行調諧,作為正常設計過程的部分。

在實施例中,初始(軟體)動態範圍壓縮可以具有比音頻接口所應用的動態範圍壓縮短的時間常數。也即,初始動態範圍壓縮可以比打算取消的音頻接口處理的期望類型的快。這具有在比音頻接口處理的響應時間短的時間尺度上平滑x(t)相對於w(t)的功率包絡的效果,有助於確保x(t)基本上不受該接口處理影響。

在步驟S404中,遠端信號x(t)供給到音頻接口306,音頻接口306執行遠端信號的數字模擬轉換(DAC),從而生成模擬形式的送出音頻信號以供給擴音器210。

如所表明的,在S404處生成送出音頻信號時,音頻接口306將其自身(進一步的)動態範圍壓縮應用於已經壓縮的遠端信號x(t)(已經由DRC模塊302壓縮),在該實施例中該進一步DRC是在客戶端應用206的控制之外的。

例如,音頻接口還可以實現如圖5所示的向下動態範圍壓縮函數(x(t)作為輸入信號且B(x(t))作為輸出信號),具有其自身閾值和比率(和/或其它參數,頻帶等)。

然而,如所表明的,在S402處應用的初始DRC的調諧足夠進取以生成具有基本上不受音頻接口306所應用的DRC影響的足夠窄的動態範圍的壓縮音頻x(t)。因此,儘管音頻接口正在應用其自身DRC於客戶端206控制之外的已經壓縮信號的事實,但是實際上沒有將非線性引入x(t)實際上觀察到的回波路徑。

這示意性地圖示在圖6A和圖6B中,這些圖圖示出示範性的理想化的情況。圖6A代表了沒有使用軟體DRDC 304的情形,並且其中進入音頻信號w(t)直接用作基準和到音頻接口306的輸入。圖6A分別顯示出基準和音頻接口輸出的功率包絡602、604(例如,在近似200ms的窗口內定義,參見上文),在該方案中基準是w(t),以及音頻接口輸出在該方案中是送出信號B(w(t))。如圖6A中可見,這些功率包絡具有顯著變化的相應的形狀。特別地,w(t)的功率包絡602比B(w(t))的功率包絡基本上不太平滑(即,展現出基本上更多的變化)。

相反,圖6B圖示出本公開的上述方案,其中使用軟體DRC 304來生成既用作基準又用作到音頻接口306的輸入的壓縮信號x(t)。圖6B分別顯示出基準x(t)(與w(t)相對)和音頻接口輸出B(x(t))(與B(w(t))相對)的功率包絡606、608(例如,在近似200ms的窗口內定義,參見上文)。如圖6B可見,與圖7A相比,這些功率包絡具有基本上匹配的相應的形狀。如上所述,功率包絡代表了信號功率(或標準化信號功率)的移動窗口平均。因此,在不同信號具有匹配的功率包絡的情況下,這表達了那些信號在由窗口尺寸定義的時間尺度上彼此匹配的事實。在回波消除的情況下,窗口尺寸需要足夠小以顯示出過於突然而不能適應系統增益變化的差別(也即,過於突然而不能適應,好像它們是由於比如將揚聲器210和麥克風212移動得靠近/進一步分開而得到的一樣)。

軟體生成的音頻信號與送出音頻信號之間的振幅變化會出現在該信號的功率包絡中沒有反映的那些信號的較高頻率分量中(因為該功率包絡僅反映較低頻率分量)。然而,典型地,基於抑制的聲學回波消除器由於魯棒性原因而具有某程度的過度抑制(即,它們應用於麥克風信號的回波抑制增益的量超過了理論上從麥克風信號中去除回波分量所必要的回波抑制增益的量)。因此,在該上下文中,用於定義功率包絡的適當的窗口將具有足夠小以確保在包絡中沒有反映出的振幅波導足夠小以便由過度抑制解釋的持續期間。

本公開因此考慮了音頻信號處理(例如,回波抑制),其對軟體生成的音頻信號(基準)的較高頻率分量與功率包絡中沒有反映出的送出音頻信號之間的振幅差魯棒,而對如果存在的情況下將反映在功率包絡中的較低頻率分量之間的振幅差不魯棒。因此,匹配信號的功率包絡是足夠的,因為這基本上消除了較低頻率分量,而無需對較高頻率分量進行不必要的考慮。

在調諧軟體DRC 302時,例如,作為軟體設計過程的部分,可以假設普通模型,其中進取提升衰減應用於預處理步驟,而無需音頻接口306執行的DRC的任何知識(如上文所述)。

然而,在實施例中,通用模型可通過對音頻接口自身非線性處理(DRC)的特性(例如,參數)進行建模或者進行其它檢測/推導來增強。目標是構建一個使得信號的變化可忽略的模型,如將意識到,這可以通過多種方式來實現。

也即,雖然客戶端206不能對音頻接口306應用的動態範圍壓縮進行控制,但是一些實施例提供了客戶端能夠藉以至少確定有關音頻接口應用的DRC的本質的信息,然後自動地在S402處實況的方案中調諧軟體DRC模塊(例如,一旦客戶端已經安裝到用戶設備104上並且在處理器202上實例化)。

在如圖3A中示意性圖示的一個這樣的實施例中,查找表322以客戶端206可訪問的方式存儲,例如存儲在本地存儲器214或者遠程存儲器中,例如在客戶端206能夠經由網絡106訪問的與網絡106連接的伺服器和/或數據中心處的遠程存儲器中。如圖3A所示,在該實施例中,信號處理模塊(通過客戶端106來實現)包括與如圖3A所示相同的組件,並且還包括用於訪問查找表312且具有被配置為接收有關執行客戶端106的用戶設備104的設備信息的輸入的第一控制器320。在該實施例中,軟體DRC模塊302具有與第一控制器320的輸出連接的第一附加輸入,通過該第一附加輸入,第一控制器320能夠配置DRC模塊302的參數(諸如上文提到的那些參數)。

在操作中,第一控制器320可以例如被配置為在客戶端206執行於用戶設備104上時請求來自作業系統204的設備信息。該信息可以OS 204能訪問的方式存儲在存儲器214中。可替代地,存儲的信息可由客戶端106直接訪問。設備信息可以例如包括設備製造商的標識符和設備的型號、有關音頻接口硬體的信息(例如,製造商和型號ID)、音頻接口驅動器(例如,驅動器版本號)等中的一項或多項。

如圖7所示,查找表322包括多個關聯702、704,每個關聯將一個或多個設備信息與用於調諧DRC模塊420的一組一個或多個參數值(例如,閾值和/或比率值,等等)相關聯。

第一控制器320基於接收到的設備信息根據所述查找表322來確定相關聯的一組DRC參數值並且將DRC模塊302的參數配置到那些值(例如,設定閾值到相關聯的閾值的值,設定比率到相關聯的比率的值,等等)。

查找表322可以『離線』彙編,例如通過軟體設計者在不同製造商製造的不同的設備模型上運行客戶端,手動調諧DRC模塊302的參數以實現期望的結果,以及將優化的參數記錄在查找表312中,以便『在線』使用。查找表能夠隨時間而更新,並且更新可以分布為例如客戶端軟體更新的部分,或者在表格遠程存取的情況下分布到適當的伺服器上。

在另一這樣的實施例中,客戶端206被配置為檢測音頻接口的性質,例如,檢測其正將多少DRC(如果有的話)應用於遠端信號,例如,通過將供給到音頻接口的遠端信號x(t)與麥克風信號y(t)進行比較。如圖3B所示,在該實施例中,信號處理模塊300包括第二控制器330,該第二控制器具有被配置為接收近端信號x(t)和麥克風信號y(t)的第一輸入和第二輸入。在該實施例中,DRC壓縮模塊具有連接到第二控制器330的輸出的第二附加輸入。

用於檢測非線性振幅處理(諸如DRC)是否存在於信號路徑中以及當存在於該信號路徑中時通過信號比較用於進一步檢測壓縮量的過程描述於申請號為GB1321052.1的申請人的共同未決UK專利申請中。該過程涉及到將第一音頻信號和第二音頻信號進行比較,以檢測指示第一信號的該處理包含動態範圍壓縮的條件,第二音頻信號是第一音頻信號的處理後的版本。該過程是能夠由第二控制器330以遠端信號x(t)作為第一信號且將麥克風信號y(t)作為第二信號實現的過程的示例,從而使得第二控制器302檢測音頻接口306是否已經在回波路徑中添加了壓縮以及在何種程度上添加了壓縮。

在實現GB1321052.1的過程中,第二控制器利用了如下事實:每當信號x(t)的動態範圍進一步被音頻接口306減小時,麥克風信號y(t)的標準化版本的振幅分布將具有不同於近端信號x(t)的標準化版本的對應的振幅分布的形狀的形狀,但是相反,每當音頻接口306不改變信號x(t)的動態範圍時,這些分布的形狀將基本上匹配。此處,音頻信號的標準化的版本意味著已經經過了音頻標準化的該信號的版本。音頻標準化是信號在振幅上經過均勻地進行標度調節而具有共同峰值振幅大小,例如,比如0dBFS(「相對於滿標的分貝數)的預定峰值大小的過程,是本領域已知的技術。

如本文所使用的,信號a(t)(即,在時間t具有振幅a(t))的「振幅分布」Da(t)定義在值V的集合上(跨過V的集合),對應於信號振幅a的一個或多個可能的值的集合V中的每個值v∈V(例如,集合V是定義了分布的一組信號振幅的值,例如,範圍[a1,a2],每個值v∈V是信號振幅;集合V是信號振幅的函數的一組值,例如,範圍[f(a1),(a2)],諸如[|a1|,|a2|])。對於集合V中的每個值v∈V,分布具有尺寸Da(t)(v),該尺寸與對應於該值v∈V的振幅出現在信號a(t)中的觀察平均率有關(例如,與其成比例)(例如,對於在一組振幅大小[|a1|,|a2|]上定義的分布Da(t),分布的尺寸Da(t)(|an|)與具有大小|an|的振幅——其是兩個振幅an和-an——出現在信號a(t)中的觀察率有關)。對於數字採樣的音頻信號,振幅分布可以是定義在一組值B上的直方圖Ha(t),每個值是容器b∈B,每個容器是振幅的值的範圍b=[|am|,|an|(其是振幅大小值大於或等於|am|而小於|an|的範圍),以使得直方圖定義在一組這樣的容器B={b1=[|a1|,|a2|),b2=[|a2|,|a3|),...}上,對於每個容器b∈B,直方圖Ha(t)具有尺寸Ha(t)(b),該尺寸與振幅出現在具有在該容器b=[|am|,|an|內的大小的信號a(t)的觀察平均率有關(即,具有在範圍[|am|,|an|內的大小)。在該示例中,每個容器(即,分布集合B的每個值b)對應於在該容器b中具有相應大小的振幅。

在S402,第二控制器基於檢測到的條件來自動調諧DRC模塊302的參數。例如,初始軟體DRC的進取性可以增加直至在回波路徑中沒有觀察到DRC型的效應(即,直至振幅分布的形狀或多或少收斂)。可替選地,檢測到的條件可用作初始DRC的二進位開/關切換(當沒有檢測到音頻接口DRC時為關,而當其它時候為開),或者選擇(例如,不同級別的進取性的)多個初始DRC模型中的一個。

在步驟S406在,已經由音頻接口306處理的送出音頻信號從揚聲器210輸出。通過該方式,已經由音頻接口306處理過的送出音頻信號輸出給用戶102。

在步驟S408中,麥克風212接收音頻信號。如圖3所示,接收到的音頻信號可以包括為期望信號或「主要信號」的近端信號。近端信號是用戶102想要麥克風212接收到的信號(在圖3中標記為近端),例如,語音。然而,接收到的音頻信號還包括由在步驟S406中從揚聲器210輸出的音頻信號得到的回波信號。接收到的音頻信號還可以包括噪聲,諸如背景噪聲(未示出)。因此,接收到的全部音頻信號y(t)能夠由近端信號、回波和噪聲之和給出。回波和噪聲充當近端信號的幹擾。雖然圖3中沒有示出,模擬數字(ADC)轉換應用於由麥克風212捕獲的信號以得到數位訊號y(t)。

建模模塊304取信號處理模塊300(遠端的、壓縮信號)的輸出x(t)和接收到的音頻信號y(t)作為輸入。在步驟S410中,建模模塊304用於對接收到的音頻信號y(t)中的回波的回波路徑進行建模。

回波路徑描述了從揚聲器210輸出的音頻信號行進到達麥克風212的聲學路徑的效果。音頻信號可以從揚聲器210直接行進到麥克風212,或者其可以在近端終端的環境中從各個表面反射。從揚聲器210輸出的音頻信號所遍歷的回波路徑可被視為具有隨時間而變化的頻率和相位響應的系統。

為了從近端麥克風212處記錄的信號y(t)中去除聲學回波s(t),需要估計回波路徑如何將期望的遠端揚聲器輸出信號變成輸入信號中的非期望的回波分量。

回波路徑建模在該情況下假設近似線性的回波路徑,即,假設回波路徑的輸出信號振幅與回波路徑的輸入信號振幅線性地成比例,該假設由於DRC模塊302的效應而更可能成立,因為該DRC模塊顯著地降低了音頻接口306將非線性引入壓縮的信號x(t)所觀察到的回波路徑中的可能性(參見上文)。

對於近似線性的回波路徑,回波路徑h(t)描述了接收到的音頻信號y(t)中的回波如何與從揚聲器210輸出的遠端信號x(t)相關,例如,對於脈衝響應h(t)根據如下等式所表示的線性回波路徑:其中s(t)是接收到的音頻信號y(t)中的回波,Ntrue是由麥克風212接收到的輸出的遠端信號x(t)的樣本的數量,hn(t)是描述回波路徑h(t)的脈衝響應的係數。回波路徑h(t)在時間和頻率上都可以變化並且在本文可稱為h(t)或h(t,f)。回波路徑h(t)可取決於(i)揚聲器210和麥克風212周圍的當前環境條件(例如,從揚聲器210到麥克風212的音頻信號的通道是否存在任何物理障礙,氣壓、溫度、風力等),以及(ii)揚聲器210和/或麥克風212的特性,其會隨著信號被輸出和/或接收而改變信號,以及(iii)可能沒有在遠端信號中反映出的信號的任何其它處理,尤其是,由於音頻信號處理模塊209進行的處理(但是還可能是由於其它因素,例如緩衝器延遲)。

濾波器模塊304通過確定輸出的遠端信號x(t)的當前值和有限數量(N)的先前值的加權和來對與接收到的音頻信號y(t)中的回波相關聯的回波路徑h(t)進行建模。濾波器模塊304因此實現了N階濾波器,其具有有限的長度(時間上的),在該有限長度內,在確定回波路徑的估計時考慮輸出的遠端信號x(t)的值。通過該方式,濾波器模塊304動態地適應回波路徑的濾波器估計該運算是由以下等式來描述的,其根據輸出的遠端信號x(t)定義了接收到的音頻信號y(t)中的回波:因此,輸出的遠端信號x(t)的N+1個樣本被使用,具有相應的N+1個權重N+1個權重的集合在本文簡稱為回波路徑的估計換言之,回波路徑的估計是具有N+1個值的向量,其中濾波器模塊304實現N階濾波器,考慮到輸出的遠端信號x(t)的N+1個值(例如,N+1幀)。

能夠意識到,當回波是接收到的音頻信號的佔優部分時,即,當時,更易於適應回波路徑的濾波器估計然而,即使當回波不是接收到的音頻信號y(t)的佔優部分時,如果回波s(t)獨立於y(t)的其它信號分量,則有可能適應回波路徑的濾波器估計

本領域技術人員將意識到,回波路徑的估計無需明確地計算出,而是可以由從隨機梯度算法獲得的濾波器係數來表示,隨機梯度算法為諸如最小均方(LMS)、標準化最小均方(NLMS)、快速仿射投影(FAP)和遞歸最小二乘(RLS)。

回波路徑的估計用來提供對遠端信號濾波以根據回波路徑的估計生成麥克風信號y(t)中的回波分量的估計的濾波器係數。無論使用何種特定的算法,利用算法的每次迭代來更新濾波器模塊304的濾波器係數,因此,濾波器模塊304的係數持續地隨時間更新,而無論當前的信號條件如何。

雖然上文的說明是指使用回波路徑的時間域FIR模型來估計近端信號y(t)中的回波分量,但是本領域技術人員將意識到,這僅是示例,不以任何方式進行限制。也即,濾波器模塊304可以運行以確定回波路徑的估計並且因此確定在時間域或頻率域中近端信號y(t)中的回波分量的估計

回波路徑的估計典型地基於高頻信號,因為那些信號是產生最可靠的回波路徑估計的信號。

降噪模塊308被布置成降低麥克風信號y(t)的噪聲水平,而不影響麥克風信號y(t)的語音信號質量。本領域技術人員已知,為了消除噪聲的目的,可有各種降噪技術。頻譜減除是用來在噪聲存在的情況下增強語音的這些方法中的一種。頻譜減除使用噪聲頻譜和有噪聲的語音頻譜的估計來形成基於信噪比(SNR)的增益函數,其與輸入頻譜相乘以抑制具有低SNR的頻率。該過程的目的是獲得包含比原信號少的噪聲的音頻信號。

建模模塊304中的濾波器模塊對遠端信號x(t)進行濾波以根據回波路徑的估計來生成麥克風信號y(t)中的回波分量的估計。

回波抑制模塊310被布置成將回波抑制應用於接收到的音頻信號y(t)的高電平部分。回波抑制器310的目的是將麥克風信號中存在的擴音器回波,例如,VoIP客戶端中的,抑制到足夠低以使其在麥克風212拾取的近端聲音(非回波聲音)的存在的情況下不能被覺察/產生幹擾的水平。回波抑制方法在本領域是已知的。此外,通過回波抑制模塊310應用的回波抑制方法可以通過多種方式來實現。因此,回波抑制方法的確切的細節沒有在此詳述。

回波抑制模塊310被布置成,在降噪模塊308實現的降噪之後,接收麥克風信號中的回波分量的估計和麥克風信號y(t)本身作為輸入。回波抑制模塊310被布置成確定降噪之後的估計回波的功率和麥克風信號y(t)的功率。在回波抑制模塊310中,估計的回波功率連同所確定的麥克風信號y(t)的功率以及過度抑制因素估計模塊306的輸出一起使用,以形成時間t和頻率f的回波抑制增益G(t,f)。回波抑制增益具有將麥克風信號y(t)中的任何回波s(t)抑制(在S414處)到它們不能被覺察的水平的目的。

回波消除模塊310輸出接收到的信號,回波已經被抑制,例如,以便在設備104上進一步處理。例如,在用戶102與108之間的通話中,從回波抑制模塊310輸出的信號可由客戶端206處理(例如,編碼和分組),然後經由網絡106傳送到用戶設備110。另外地或者可替代地,從數字增益控制模塊312輸出的信號可以由用戶設備104用於其它目的,例如,信號可以存儲在存儲器214中或者作為輸入用於在用戶設備104處執行的應用中。

雖然在上文中主題在聲學回波消除的背景下使用,一般地,該主題可用於使用基準來處理麥克風的任何音頻信號處理的背景中,例如,基於在基準與麥克風信號的至少分量之間存在線性關係的假設來處理麥克風信號的任何音頻信號處理。

在上述的實施例中,回波去除實現在VoIP系統中(例如,接收到的音頻信號可以包括在用戶102與108之間經由通信系統100通話的期間用於傳送到用戶設備110的用戶102的語音)。然而,本文所描述的方法能夠應用於其中要應用回波消除或其它基於基準的信號處理的任何適合的系統中。

本文所描述的方法可以通過在用戶設備104處執行電腦程式產品(例如,客戶端206)來實現。也即,電腦程式產品可被配置為在包括用戶設備104的聲學系統中執行音頻信號處理(例如,回波消除)。聲學系統還可以包括至少一個另外的用戶設備。電腦程式產品具體實施在計算機可讀存儲介質上(例如,存儲在存儲器214中)並且被配置為當執行在設備104的CPU 202上時執行本文所描述的任意方法的操作。

在上文中,公開了一種音頻信號處理設備,該音頻信號處理設備具有用於輸出模擬音頻信號的擴音器組件以及用於接收模擬音頻信號的麥克風組件。該設備包括音頻接口。該音頻接口被配置為以數字形式接收在設備上生成的以便經由擴音器組件輸出的任何音頻信號並且從所述音頻信號生成模擬形式的送出音頻信號以供給擴音器組件。音頻接口被配置為,在生成送出音頻信號時,將動態範圍壓縮應用於音頻信號。該設備還包括被配置為執行軟體的處理器。該軟體被配置為接收進入音頻信號並且從進入音頻信號生成數字形式的音頻信號。軟體生成的音頻信號供給到音頻接口,以便由擴音器組件輸出並且用作對經由麥克風組件接收到的音頻信號的音頻信號處理中的基準。

生成音頻信號包括軟體將初始非線性振幅處理應用於進入音頻信號以減小其動態範圍,音頻信號和由此具有減小的動態範圍。音頻信號的減小的動態範圍足夠窄以便當動態範圍壓縮由音頻接口應用於音頻信號時基本不受動態範圍壓縮影響。

例如,初始處理可以是初始動態範圍壓縮。除了平滑功率包絡的期望效果之外,動態範圍的減小是初始DRC的固有結果。

一般,本文所描述的任何功能(例如,圖3、3A和3B所示的功能模塊以及圖4所示的功能步驟)可以利用軟體、固件、硬體(例如,固定邏輯電路系統)來實現,或者這些實現方式的組合來實現。在圖3、圖3A,圖3B和圖4中單獨示出的模塊和步驟可以或者可以不實現為單獨的模塊或步驟。本文所使用的術語「模塊」、「功能」、「組件」和「邏輯」一般表示軟體、固件、硬體或其組合。在軟體實現方式的情況下,模塊、功能或邏輯代表了當在處理器(例如,一個CPU或多個CPU)上執行時執行規定任務的程序代碼。程序代碼可以存儲在一個或多個計算機可讀存儲器設備上。本文描述的技術的特徵是平臺獨立的,意指技術可實現在具有各種處理器的各種商業計算平臺上。例如,用戶設備還可以包括使得用戶設備的硬體執行操作的實體(例如,軟體),例如處理器功能塊等等。例如,用戶設備可以包括計算機可讀介質,計算機可讀介質被配置為維護使用戶設備以及更具體地用戶設備的作業系統和相關聯的硬體執行操作的指令。因此,指令起到配置作業系統和相關聯的硬體執行操作且以此方式實現作業系統和相關聯的硬體的變換而執行功能的作用。指令可由計算機可讀介質經由各種不同的配置提供給用戶設備。

計算機可讀介質的一種這樣的配置是信號承載介質並且因此配置為將指令(例如,作為載波)發送給計算設備,諸如經由網絡。計算機可讀介質還可以被配置為計算機可讀存儲介質且因此不是信號承載介質。計算機可讀存儲介質的示例包括隨機存取存儲器(RAM)、只讀存儲器(ROM)、光碟、閃速存儲器、硬碟存儲器以及可使用磁、光和其它技術來存儲指令和其它數據的其它存儲器設備。

雖然以特定於結構特徵和/或方法行為的語言描述了主題,但是應當理解的是,在隨附的權利要求中限定的主題不一定局限於上述的具體特徵或行為。而是,上述的具體特徵和行為被公開作為實現權利要求的示例形式。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀