新四季網

用於自適應話音可懂度處理的系統的製作方法

2023-06-12 17:05:21

專利名稱:用於自適應話音可懂度處理的系統的製作方法
用於自適應話音可懂度處理的系統背景技術
行動電話通常在包括高背景噪聲的區域中使用。這種噪聲通常具有使得來自行動電話揚聲器的口頭通信信息的可懂度的極大降低的級別。在大多數情況下,因為高環境噪聲級別掩蓋或扭曲了呼叫方的話音,所以當收聽者收聽時,丟失或至少部分地丟失了一些通fe fn息ο
在存在高背景噪聲的情況下,使可懂度的損失最小化的嘗試已經包括使用均衡器、限幅電路,或者簡單地增大行動電話的音量。均衡器和限幅電路自身就可能增大背景噪聲,因而不能解決該問題。增大行動電話的聲音或揚聲器音量的總級別,通常不能顯著地提高可懂度,並且可能造成其它問題,比如反饋和收聽者的不適感。發明內容
在特定實施例中,一種用於自動調整施加至音頻信號上的話音可懂度增強的系統,包括增強模塊,接收包括共振峰的輸入話音信號,並且對所述輸入話音信號施加音頻增強,來提供增強話音信號。音頻增強可以加強所述輸入話音信號中的一個或多個共振峰。 該系統還包括增強控制器,具有一個或多個處理器。增強控制器可以至少部分地基於檢測到的環境噪聲量來調整由所述增強模塊施加的音頻增強的量。該系統還包括輸出增益控制器,可以至少部分地基於所述環境噪聲的量和所述輸入話音信號,來調整增強話音信號的總增益,以及向增強話音信號施加所述總增益,以產生放大話音信號。該系統還可以包括失真控制模塊,可以至少通過將所述放大話音信號的一個或多個採樣映射到在正弦和表中存儲的一個或多個值,來減小所述放大話音信號中的限幅。可以根據較低次正弦諧波之和來產生所述正弦和表。
在多種實施例中,調整話音可懂度增強的方法可以包括接收話音信號和具有近端環境含量的輸入信號,利用一個或多個處理器計算所述輸入信號中的所述近端環境含量,利用所述一個或多個處理器,至少部分地基於所述近端環境含量來調整話音增強的級別,以及對所述話音信號施加所述話音增強,以產生增強話音信號。所述話音增強可以加強所述話音信號的一個或多個共振峰。
此外,在特定實施例中,用於自動地調整施加至音頻信號上的話音可懂度增強的系統可以包括增強模塊,所述增強模塊可以接收包括共振峰的輸入話音信號,以及對所述輸入話音信號施加音頻增強,以提供增強話音信號。所述音頻增強可以加強所述輸入話音信號中的一個或多個共振峰。該系統還可以包括增強控制器,所述增強控制器包括一個或多個處理器。所述增強控制器可以至少部分地基於檢測到的環境噪聲的量來調整由所述增強模塊施加的音頻增強的量。該系統還可以包括輸出增益控制器,所述輸出增益控制器可以至少部分地基於環境噪聲的量和所述輸入話音信號來調整增強話音信號的總增益,以及向所述增強話音信號施加所述總增益,以產生放大話音信號。
一種處理器可讀存儲介質,具有在其上存儲的指令,所述指令使得一個或多個處理器執行調整話音可懂度增強的方法,所述方法可以包括接收來自遠程電話的話音信號和來自麥克風的噪聲信號,計算所述噪聲信號的值,至少部分地基於所述噪聲信號的值來調整施加至所述話音信號的共振峰上的增益,以及對所述話音信號的共振峰施加所述增■、Λfrff. ο
在一些實現中,一種用於調整話音可懂度增強的噪聲閾值的系統可以包括話音增強模塊,可以利用接收設備來接收來自遠程設備的輸入話音信號,以及對所述輸入話音信號施加音頻增強,以加強所述輸入話音信號中的一個或多個共振峰。該系統還可以包括話音增強控制器,所述話音增強控制器具有一個或多個處理器。所述話音增強控制器可以至少部分地基於第一噪聲閾值以上檢測到的環境噪聲量,來調整由所述增強模塊施加的音頻增強的量。該系統還可以包括噪聲靈敏度控制器,所述噪聲靈敏度控制器可以調整所述第一噪聲閾值。所述噪聲靈敏度控制器可以包括第一相關器、第一方差模塊、第二相關器、 第二方差模塊和噪聲靈敏度調節器,其中所述第一相關器可以根據從接收設備的麥克風接收的麥克風輸入信號計算第一自相關值,所述第一方差模塊可以計算第一自相關值的第一方差,所述第二相關器可以根據揚聲器輸入信號計算第二自相關值,其中揚聲器輸入信號包括話音增強模塊的輸出信號,所述第二方差模塊可以計算第二自相關值的第二方差,所述噪聲靈敏度調節器可以使用所述第一和第二自相關值以及第一和第二方差值中的一個或多個來調整第一噪聲閾值,以產生第二噪聲閾值。因此,在特定實施例中,話音增強控制器可以至少部分地基於第二噪聲閾值以上檢測到的環境噪聲第二量,來調整施加至第二輸入音頻信號上的音頻增強的量。
在特定實施例中,一種用於調整話音可懂度增強的靈敏度的系統包括話音增強模塊,可以利用接收設備接收由接收設備從遠程設備處接收的輸入話音信號,以及向所述輸入話音信號施加音頻增強,以加強所述輸入話音信號中的一個或多個共振峰。該系統還可以包括增強控制器,所述增強控制器可以至少部分地基於所述輸入話音信號中存在的環境噪聲的量來調整由所述話音增強模塊施加的所述音頻增強的量。該系統還可以包括具有一個或多個處理器的噪聲靈敏度控制器,所述噪聲靈敏度控制器可以至少部分地基於麥克風輸入信號和揚聲器輸入信號中的至少一個或二者的統計分析來調整所述增強控制器對環境噪聲的靈敏度,其中麥克風輸入信號從接收設備的麥克風獲得,揚聲器束信號作為話音增強模塊的輸出信號來提供。
在特定實施例中,一種用於調整話音增強的靈敏度的方法包括接收輸入音頻信號;檢測輸入音頻信號中的相關含量,其中檢測包括使用一個或多個處理器來計算對所述輸入音頻信號的統計分析;以及響應於執行所述檢測,調整施加至所述輸入音頻信號的增強級別。
此外,在多種實施例中,一種音頻信號處理方法包括接收麥克風輸入信號;檢測所述麥克風輸入信號中的實質上周期性含量;以及利用一個或多個處理器,至少部分地基於在所述麥克風輸入信號中檢測到的實質上周期性含量來調整音頻增強。所述音頻增強可以至少部分地基於所述麥克風輸入信號的級別來選擇性地加強音頻輸出信號。所述方法還可以包括向揚聲器提供所述音頻輸出信號。
為了概括本公開,本文已經描述了本發明的特定方面、優點和新穎特徵。應該理解,根據本文公開的本發明的任何特定實施例,可能沒有必要實現所有這些優點。因此,可以以下方式實現或執行本文公開的本發明實現或優化本文教導的一個或一組優點,而沒有必要實現可能由本文教導或建議的其它優點。


貫穿附圖,可以重複使用參考數字,以指示參考元件之間的對應性。提供附圖來指示本文描述的本發明的實施例,而非限制其範圍。
圖1示出了用於實現話音增強系統的行動電話環境的實施例;
圖2示出了圖1的與增強系統的實施例;
圖3示出了由話音增強系統使用的話音增強控制過程的實施例;
圖4示出了由話音增強系統使用的輸出音量控制過程的實施例;
圖5A、5B、5C和6示出了由話音增強系統使用的噪聲靈敏度控制過程的實施例
圖7示出了圖1的系統的示例失真控制模塊;
圖8示出了正弦波的示例時域圖示;
圖9示出了圖8的正弦波的示例頻譜;
圖10示出了限幅正弦波的示例時域圖示;
圖11示出了圖10的限幅正弦波的示例頻譜;
圖12示出了與圖11的限幅正弦波頻譜相比諧波數目減少的示例頻譜,;
圖13示出了與圖12的頻譜相對應的部分飽和波的示例時域圖示;
圖14示出了正弦和映射函數的實施例;
圖15示出了音頻信號和該信號的失真控制版本的示例時域圖示。
具體實施方式
I.介紹
行動電話以及其它類似尺寸的設備傾向具有小揚聲器,其中在小揚聲器生產時, 其聲音的音量就受到了限制。因此,在存在環境噪聲的情況下,很難聽到行動電話上的對話。
本公開描述了一種用於基於環境噪聲、語音級別(speech level)、兩者的結合等來調整話音可懂度處理的系統和方法。話音可懂度處理可以包括加強語音中共振峰的技術。例如,話音可懂度處理可以用於使行動電話對話等的語音清晰。話音可懂度處理可以適於至少部分地基於環境噪聲增大或減小話音共振峰或其它聲音特性。通過增強話音可懂度處理,可以加強講話者語音中的共振峰,以使得收聽者感覺到更清楚。然而,在存在相當大的環境噪聲的情況下,加強語音中的共振峰可能使得語音聽起來刺耳。因此,如果環境噪聲減小,則可以降低話音可懂度處理的量,以避免語音中的刺耳聲。
此外,還可以至少部分地基於噪聲級別和/或話音級別,自適應地增大音頻信號的總增益。然而,如果將音頻信號的總增益增大到超出特定級別,則可能發生音頻信號飽和,從而引起諧波失真。在特定實施例中,為了減少飽和的失真效應,可以使用失真控制處理。失真控制處理可以減少高增益情形期間發生的失真,同時允許發生一些失真,以保持或增大響度。在特定實施例中,可以通過將音頻信號映射到輸出信號來執行失真控制,其中與全飽和信號相比,該輸出信號具有較少的諧波。
II.系統概要
圖1示出了用於實現話音增強系統110的行動電話環境100的實施例。在示例行動電話環境100中,示出了呼叫方電話104和接收方電話108。呼叫方電話104和接收方電話108可以是行動電話、基於網際網路協議的話音(VOIP)電話、智慧型電話、地面通信線電話等。呼叫方電話104可以被看作是位於行動電話環境100的遠端,而接收方電話可以被看作是位於行動電話環境100的近端。當行動電話108的用戶說話時,近端與遠端可以顛倒。
在所描述的實施例中,呼叫方向呼叫方電話104提供話音輸入102。呼叫方電話 104中的發射機106向接收方電話108發送話音輸入信號102。發射機106可以根據呼叫方電話104的類型無線地或通過地面通信線發送話音輸入信號102。接收方電話108的話音增強系統110可以接收話音輸入信號102。話音增強系統110可以包括用於提高話音輸入信號102的可懂度的硬體和/或軟體。例如,話音增強系統110可以利用話音增強來處理話音輸入信號102,其中話音增強加強了口聲的區別特性。
話音增強系統110還可以利用接收方電話108的麥克風來檢測環境噪聲112。環境噪聲或含量112可以包括背景噪聲或周圍噪聲(ambient noise)。除了其普通含義之外, 環境噪聲或或含量還可以包括一些或全部近端噪音。例如,除了接收方電話108的麥克風接收到的背景聲音之外,環境噪聲或含量還包括來自揚聲器輸出114的回聲。在一些情況下,環境噪聲還可以包括來自接收方電話108的用戶的話音輸入,包括咳嗽、清嗓子以及雙講(double talk)(參見以下的「噪聲靈敏度控制(Noise Sensitivity Control)」)。
有利地,在特定實施例中,話音增強系統110至少部分地基於環境噪聲112的量來調整施加至話音輸入信號102上的話音增強的強度。例如,如果環境噪聲112增大,則話音增強系統110可以增大所施加的話音增強的量,反之亦然。因此,話音增強可以至少部分地跟蹤檢測到的環境噪聲112的量。
此外,話音增強系統110可以至少部分地基於環境噪聲112的量來增大施加至話音輸入信號102上的總增益。然而,當存在較小的環境噪聲112時,話音增強系統110可以減少所施加的話音增強和/或增益增大的量。這種減少有益於收聽者,原因在於當存在低級別的背景噪聲112時,話音增強和/或音量增大可能聽起來刺耳或者討厭。
因此,在特定實施例中,話音增強系統110將話音輸入信號變換為增強的輸出信號114,其中存在變化的環境噪聲級別的情況下,所述增強的輸出信號114對於收聽者而言可能更好理解。在一些實施例中,還可以在呼叫方電話104中包括話音增強系統110。話音增強系統110可以至少部分地基於呼叫方電話104檢測到的環境噪聲的量,來對話音輸入信號102施加增強。因此,可以在呼叫方電話104、接收方電話108,或者兩者中使用話音增強系統110。
儘管示出的話音增強系統110是電話108的一部分,但是替換地,可以在任何通信設備或與電話通信的設備中實現話音增強系統110。例如,可以在與支持VOIP的電話進行通信或耦合的計算機、路由器、模擬電話適配器等中實現話音增強系統110。還可以在公共地址(「PA」)設備(包括網際網路協議上的PA)、無線電收發機、助聽設備(例如,助聽器)、 對講電話以及其它音頻系統中使用話音增強系統110。此外,可以在向一個或多個揚聲器提供音頻輸出的任何基於處理器的系統中實現話音增強系統110。
圖2示出了話音增強系統210的更詳細的實施例。話音增強系統210可以具有話音增強系統110的全部特徵。可以在以下設備中實現話音增強系統210:行動電話、峰窩電話、智慧型電話或包括任何上述設備的其它計算設備。有利地,在特定實施例中,話音增強系統210至少部分地基於檢測到的環境噪聲的量和/或話音信號的級別來調整話音可懂度處理和音量處理。
話音增強系統210包括話音增強模塊220。話音增強模塊220可以包括用於對話音輸入信號202施加話音增強的硬體和/或軟體。話音增強可以加強話音輸入信號202中的口聲的區別特性。在某些實施例中,這些區別特性包括在人(例如,使用電話的呼叫方) 的聲道中產生的共振峰。人類話音的可懂度可能很大程度上取決於共振峰的頻率分布的圖案。因此,話音增強模塊220可以選擇性地增強共振峰,以在存在背景噪聲的情況下提供更容易理解的話音。
在特定實施例中,話音增強模塊220利用1995年10月17日提交的發明名稱為 「公共地址可懂度系統」的美國專利NO. 5459813( 「813專利」)中描述的一些或全部特徵來施加話音增強,其全部內容通過引用合併於此。儘管『813專利在電路的上下文中描述了這些特徵,但是話音增強模塊220可以利用在諸如數位訊號處理器(DSP)之類的處理器中執行的指令來實現這些特徵的一部分或全部。此外,話音增強模塊220還可以使用『813專利中沒有公開的話音增強技術。
話音增強模塊220可以通過將話音輸入信號202劃分為頻率子帶來處理共振峰。 話音增強模塊220可以將話音輸入信號202劃分為兩個或多個子帶等等。話音增強模塊 220可以通過應用具有中心頻率的帶通濾波器來執行這種頻率劃分,其中,在所述中心頻率處傾向於出現共振峰或者在所述中心頻率附近傾向於出現共振峰。在實施例中,這種頻率劃分可以通過例如在『813專利的第4列第50行至第5列第M行以及第7列中的第10行至32行中描述的頻譜分析器42或IM來完成,在此特別併入『813專利的該部分以供參考。
話音增強模塊220可以通過獨立地放大子帶中的共振峰,並且選擇性地對其加權來施加話音增強。對共振峰加權可以使得特定共振峰被加強,從而提高可懂度。話音增強模塊220可以將加權後的共振峰與基帶話音分量相結合,以向(以下描述的)輸出增益控制器230提供輸出話音信號。話音增強模塊220還可以增強其它的有聲區別特性,比如爆破音和摩擦音。
例如,話音增強模塊220還可以以與『813專利的以下部分中描述的方式相同或類似的方式執行這些放大、加權和組合功能(或者其數字實現)第5列第1-7行;第5列第 46行至第6列第19行;以及第9列第8行至39行。因此,特別併入『813專利的這些部分以供參考。為了對可以如何數字地實現這些功能中的某些功能的示例進行舉例說明,『813 專利描述了利用可變電阻來對特定子帶中的信號加權(例如,參見第5列第66行至第6列第19行)。話音增強模塊220可以通過將增益值存儲在存儲器中並利用處理器對信號施加該增益值,來數字地實現這些權重。
有利地,在特定實施例中,提供一種話音增強控制器222,該話音增強控制器可以控制話音增強模塊220提供的話音增強的級別。話音增強控制器222可以包括硬體和/或軟體。話音增強控制器222可以向話音增強模塊220提供增強級別控制信號或值,該話音增強模塊220增大或減小施加的話音增強的級別。在一個實施例中,增強級別控制信號調整子帶的加權。例如,控制信號可以包括與一些或全部子帶的輸出(或輸入)相乘的一個或多個增益值。同樣地,控制信號可以用於加上或減去一些或全部子帶的輸入或輸出。當環境噪聲204增大和減小時,控制信號可以逐採樣地進行調整。
在特定實施例中,在檢測到環境噪聲204的閾值能量之後,話音增強控制器222調整話音增強的級別。在閾值以上時,話音增強控制器222可以使得話音增強的級別跟隨或實質上跟隨環境噪聲204的量。在一個實施例中,例如,所提供的噪聲閾值以上的噪聲增強的級別和噪聲能量(或功率)與閾值的比例成比例。在備選實施例中,調整話音增強的級別,而不管存在的環境噪聲的量,例如沒有使用閾值。
所描述的話音增強系統210的實施例包括噪聲靈敏度控制器2M和額外增強控制 226,所述額外增強控制2 用於進一步調整由話音增強控制器222提供的控制量。噪聲靈敏度控制器2M可以向話音增強控制器222提供噪聲靈敏度控制值,以調整話音增強控制器222對存在的噪聲204量敏感的程度。如以下將更詳細地描述的,噪聲靈敏度控制器2M 可以影響噪聲閾值,在該噪聲閾值以下,話音增強控制器222不可以調整話音增強的級別。
在特定實施例中,噪聲靈敏度控制器2M至少部分地基於從麥克風和/或揚聲器輸入獲得的音頻採樣自動地產生噪聲靈敏度控制。有利地,在特定實施例中,噪聲靈敏度控制器2M可以自動地調整噪聲靈敏度,以解決由麥克風獲得的揚聲器回聲以及其它噪聲偽跡。以下將參考圖5和6更詳細地描述這些特徵。此外,在一些實施例中,噪聲靈敏度控制器2M提供用戶接口,該用戶接口允許用戶調整噪聲靈敏度控制。因此,噪聲靈敏度控制器 224可以提供對話音增強控制器222的自動和/或手動控制。
額外增強控制2 可以向話音增強控制器222提供額外增強控制信號,該額外增強控制信號可以用作在其下增強級別不再下降的值。可以經由用戶接口向用戶顯現額外增強控制226。該控制2 還允許用戶將增強級別增大到超出由話音增強控制器222確定的增強級別。在一個實施例中,話音增強控制器222可以將來自額外增強控制226的額外增強加到由話音增強控制器222確定的增強級別中。對於可能想要更強的話音增強處理或者想要頻繁施加話音增強處理的聽力受損者而言,額外增強控制2 可能特別有用。
在特定實施例中,輸出增益控制器230可以控制施加至話音增強模塊220的輸出信號上的總增益的量。可以以硬體和/或軟體實現輸出增益控制器230。輸出增益控制器 230至少部分地基於噪聲輸入204的級別和話音輸入202的級別來調整施加至輸出信號的增益。除了諸如電話的音量控制之類的任何用戶設置的增益之外,可以施加這種增益。有利地,基於環境噪聲204和/或話音輸入202來調整音頻信號的增益可能有助於收聽者進一步感知話音輸入信號202。
在所描述的實施例中,還示出了自適應級別控制232,其可以進一步調整由輸出增益控制器230提供的增益量。用戶接口還可以向用戶顯現自適應級別控制232。增大這種控制232可以在來電話音輸入202級別下降或者當噪聲輸入204增大時使控制器230的增益增大得更多。減小這種控制232能夠在來電話音輸入202級別下降或者當噪聲輸入204 下降時使控制器230的增益增大得更少。
在一些情況下,話音增強模塊220、話音增強控制器222和/或輸出增益控制器 230施加的增益可以使得話音信號被限幅或飽和。飽和可能導致令收聽者不愉快的諧波失真。因此,在特定實施例中,還提供了失真控制模塊140。失真控制模塊140可以接收輸出增益控制器230的調整增益後的話音信號。失真控制模塊140可以包括硬體和/或軟體, 在至少部分地保持或者甚至增大由話音增強模塊220、話音增強控制器222和/或輸出增益控制器230提供的信號能量的同時控制失真。
在特定實施例中,失真控制模塊140通過將話音信號中的一個或多個採樣映射到輸出信號來控制話音信號中的失真,與全飽和信號相比,該輸出信號具有較少的諧波。對於不飽和的採樣,該映射可以線性地或近似線性地跟隨話音信號。對於飽和的採樣,該映射可以是施加控制失真上非線性變換。因此,在特定實施例中,與全飽和信號相比,失真控制模塊140可以允許話音信號聽起來更響亮,具有更少的失真。因此,在特定實施例中,失真控制模塊140將代表物理話音信號的數據轉換為代表了具有控制失真的另一物理話音信號的數據。
III.話咅增強控制
圖3示出了話音增強控制過程300的實施例。可以通過話音增強系統110或210 來實現話音增強控制過程300。具體地,可以通過話音增強控制器222來實現話音增強控制過程300。有利地,在特定實施例中,話音增強控制過程300至少部分地基於環境噪聲能量的級別來調整話音增強處理。
在方框302,通過諸如電話之類的通信設備接收環境噪聲輸入信號。該環境噪聲輸入信號可以通過通信設備的麥克風來檢測。在判定框304,確定是否啟用環境控制。如果不啟用環境控制,則向方框306提供零值。在一個實施例中,可以由用戶通過通信設備的用戶接口啟用或禁用環境控制。禁用環境控制可能使得話音增強控制過程基於噪聲級別以外的因素(諸如上述額外控制級別)來調整話音增強處理。
在方框306,可以通過採用噪聲信號的絕對值來計算環境噪聲信號的能量,以及在方框308中,通過對噪聲信號施加噪聲平滑濾波器來計算環境噪聲信號的能量。噪聲平滑濾波器可以是一階濾波器或者較高階濾波器。例如,平滑濾波器可以是低通濾波器等。在一些實施例中,噪聲平滑濾波器提供每採樣的平均(例如,移動平均)噪聲能量級別。在備選實施例中,計算噪聲信號的功率,而非能量。
在方框310,可以向輸出增益控制過程提供環境噪聲信號的能量。以下參考圖4描述示例輸出增益控制過程。還可以向判定框312提供環境噪聲能量,所述判定框312可以確定是否能量已經達到(例如,大於或者等於)噪聲閾值。在一個實施例中,如下計算噪聲閾值
噪聲閾值=1-(α *噪聲靈敏度控制)(1)
其中,α是常量,其中噪聲靈敏度控制可以是由圖2的噪聲靈敏度控制器2 產生的值。噪聲靈敏度控制可以影響話音增強控制器222對環境噪聲輸入302的靈敏度。噪聲靈敏度控制可以基於多種因素而改變,從而使得噪聲閾值改變(參見圖5和6)。在實施例中,α和噪聲靈敏度控制可以在範圍
之間,或者可以具有在該示例範圍之外的其它值。
在所描述的實施例中,如果噪聲能量大於或等於閾值,則將噪聲能量傳送至乘法框314。否則,向乘法框314提供零控制級別。因為控制級別可以乘以以上參考圖2描述的話音信號子帶,所以零控制級別可能潛在地造成不向話音信號應用話音增強處理(例如, 在以下的方框316處,沒有提供額外處理)。
在乘法方框314,將判定方框312的輸出與噪聲閾值的的乘法逆元素 (multiplicative inverse)相乘。備選地,判定框312的輸出除以噪聲閾值判定。乘法框314的輸出可以是初步增強級別。因此,在特定實施例中,增強級別可以是噪聲能量與噪聲閾值的比值。
在框316,可以將以上參考圖2描述的額外增強控制添加至初步增強控制級別中。 額外增強控制可以在範圍W,l]之間,或者具有一些其它值。在判定框318,確定是否已經達到高控制級別。高控制級別可以是預定峰值或最大控制級別。如果已經達到了高控制級別,則在判定框318,將增強控制級別限制到高控制級別。否則,判定框318向判定方框320 傳遞增強控制級別。
在判定框320,可以確定是否啟用話音增強控制。如果否,則用戶輸入可以用於調整話音增強處理級別。可以經由用戶接口等向用戶顯現用戶輸入。如果啟用控制,則在方框322,可以將在方框302至318中計算的增強控制級別作為輸出控制級別。
儘管在本示例中使用了噪聲閾值,但是不需要在所有實施例中使用噪聲閾值。在特定實施例中,可以基於任何噪聲級別調整話音增強處理。然而,在一些情況下,使用閾值可能是有益的。例如,在低環境噪聲的情況下,話音增強處理可能是刺耳或者令人不快的。 因此,使用閾值來確定何時開啟話音增強控制可以使得在存在更大噪聲級別時使用話音增強處理。
IV.輸出增益控制
圖4示出了輸出增益控制過程400的實施例。輸出增益控制過程400可以通過話音增強系統110或210來實現。具體地,可以通過輸出增益控制器230來實現輸出增益控制過程400。有利地,在特定實施例中,輸出增益控制過程400至少部分地基於環境噪聲能量的級別以及話音輸入級別來調整輸出增益。
在框402,通過諸如電話之類的通信設備接收來自遠程呼叫方的話音輸入信號。在方框404和406,可以通過在方框404採用話音輸入的絕對值來確定話音輸入信號中的能量,以及通過在方框406應用話音平滑濾波器來計算話音輸入信號中的能量。話音平滑濾波器可以是低通濾波器等,提供每採樣(sample per sample basis)的平均(例如,移動平均)話音級別。
在框408,接收環境噪聲能量。在上述音量控制過程300中計算該環境噪聲能量。 在判定框410,將話音平滑濾波器的輸出與接收增益閾值相比較,以及將環境噪聲能量與麥克風增益閾值相比較。接收增益閾值可以至少部分地取決於以上參考圖2描述的自適應增益控制。麥克風增益閾值可以至少部分地基於以上參考圖2描述的噪聲靈敏度控制。
在一個實施例中,如下計算接收增益閾值
接收增益閾值=0.5+( Y *自適應增益控制)(2)
其中,Y是範圍在W,l]之間的常量,以及自適應增益控制可以是與圖2的自適應增益控制232相對應的值。同樣,可以如下計算麥克風增益閾值
麥克風增益閾值=1_( η*噪聲靈敏度控制) (3)
其中,η是範圍在
之間的常量,以及噪聲靈敏度控制是由上述噪聲靈敏度控制器2Μ產生的值。噪聲靈敏度控制可以改變值(也參見圖5和6),從而使得在一些實施例中麥克風增益閾值也改變。
在判定方框410,如果滿足條件,則向乘法框412提供環境噪聲能量。否則,可以向乘法框412提供低增益級別。低增益級別可以是最小增益級別等。例如,在環境噪聲能量相對低並且話音輸入相對高的情況下,可以使用低增益級別。在這些情況下,因為話音信號可能已經是相對容易理解的,所以可能期望進行細微的增益調整。
在乘法框412,將判定方框410的輸出乘以麥克風增益閾值的乘法逆元素,以產生增益級別。備選地,判定框410的輸出可以除以麥克風增益閾值。因此,增益級別可以是環境噪聲能量與麥克風增益閾值的比值。在方框414,確定是否已經達到了高增益級別。如果沒有達到高增益級別,則向輸出增益平滑濾波器416傳遞乘法框412的輸出。否則,向輸出增益平滑濾波器提供高增益級別。高增益級別可以是最大增益級別等。
在方框416,向判定框414的輸出施加輸出增益平滑濾波器。輸出增益平滑濾波器可以是低通濾波器等,對乘法方框412和/或判定方框414處計算的增益級別進行平均。 該平滑濾波器可以減少增益級別的突然變化。在方框418處,將增益平滑濾波器的輸出乘以輸出增益控制,其中所述輸出增益控制可以是用戶設置的值。例如,可以經由用戶接口向用戶顯現輸出增益控制。在方框420,提供乘法方框418的輸出作為輸出增益級別。
V.噪聲靈敏度控制
如上所述,可以自動地或者在用戶控制之下改變由噪聲靈敏度控制器2M產生的噪聲靈敏度控制。在特定實施例中,改變噪聲靈敏度控制影響了話音增強控制器222和/ 或輸出增益控制器230對噪聲的靈敏度。在一個實施例中,增大噪聲靈敏度控制使得話音增強控制器222通過極大地增強話音的可懂度來極大地響應環境噪聲,反之亦然。類似地, 增大噪聲靈敏度控制可以使得輸出增益控制器230極大地增大施加至增強音頻信號的輸出增益,反之亦然。
在若干情況下,自動地減小話音增強控制器222和/或輸出增益控制器230的靈敏度可能是有益的。例如,如果圖1的接收電話108僅接收噪聲,而不會接收來自呼叫方電話104的話音信號(例如,由於對話暫停),則施加話音增強可能增大噪聲的響度。此外,當接收電話108的麥克風獲得來自電話108的揚聲器輸出114的話音信號時,可能發生令人不快的效果。這種揚聲器反饋可以被話音增強控制器222解釋為環境噪聲,這可以使得話音增強對揚聲器反饋進行調製。得到的調製後的輸出信號114可能是令收聽者不愉快的。 當收聽者與接收方電話108通話的同時接收方電話108輸出從呼叫方電話104接收到的話音信號時,可能發生類似的問題。接收電話108的麥克風可以檢測到雙講,並且話音增強控制器222可以使得話音增強調製該雙講,從而導致令人不快的聲音。
在特定實施例中,噪聲靈敏度控制器2M可以通過自動調整話音增強控制器222 和/或輸出增益控制器230對噪聲的靈敏度來克服這些和其它問題。備選地,噪聲靈敏度控制器2M可以觸發(例如,開啟或關閉)話音增強控制器222和/或輸出增益控制器230。 參考圖5A、5B和5C,示出了更詳細的噪聲靈敏度控制器52^、524b和52 的實施例。圖 5A的噪聲靈敏度控制器52 可以調整控制器222、230的噪聲靈敏度或者觸發控制器222、 230,以說明接收電話108隻接收噪聲而不接收來自遠端(例如,來自呼叫方電話104)的話音信號的情形。圖5B的噪聲靈敏度控制器52 可以調整控制器222、230的噪聲靈敏度或者觸發控制器222、230,以說明揚聲器反饋和/或雙講的情形。圖5C的噪聲靈敏度控制器 524c結合了圖5A和5B所示的控制器52^、5Mb的特徵。
在圖5A中,噪聲靈敏度控制器52 接收揚聲器輸入502a。揚聲器輸入50 可以包括在緩衝器等中存儲的一個或多個輸出採樣,其中所述一個或多個輸出採樣還被提供至諸如電話108之類的通信設備的揚聲器。揚聲器輸入50 可以是上述話音增強系統210 的輸出信號250。向相關器530a提供揚聲器輸入50加,其中相關器530a可以計算或估計揚聲器輸入50 的自相關。在實施例中,相關器530a計算揚聲器輸入50 中的一組採樣的自相關。
話音信號傾向於是周期性的或者實質上周期性的。因此,如果揚聲器輸入50 包括話音信號,則由於自相關的性質,揚聲器輸入50 的自相關函數也可能是周期性的或實質上周期性的。另一方面,噪聲信號通常是不相關的,並且不是周期性的(以下描述一些異常)。對周期性的或實質上周期性的信號的自相關進行評估可能導致比很多噪聲信號的自相關要大的值。
向靈敏度調節器550a提供由相關器530a所計算得的自相關。在一個實施例中, 如果自相關較小或低於閾值,則揚聲器輸入50 極可能是噪聲。因此,靈敏度調節器550a 可以減小與以上等式(1)和(3)的噪聲靈敏度控制相對應的噪聲靈敏度控制5(Ma。因此, 噪聲靈敏度控制50 可以調整話音增強控制器222使用的噪聲閾值和/或輸出增益控制器230使用的麥克風增益閾值。因此,話音增強控制器222和/或輸出增益控制器230可以不太積極響應環境噪聲。如果自相關較大的或者大於閾值(表示揚聲器輸入50 可能包括話音),則靈敏度調節器550a可以增大噪聲靈敏度控制50如。因此,話音增強控制器 222和/或輸出增益控制器230可以積極地響應環境噪聲。
在特定實施例中,靈敏度調節器550a提供的靈敏度調整量可以與自相關的級別相對應。例如,自相關越低,靈敏度調節器550a就可以使噪聲靈敏度控制50 越小,反之亦然。
在所描述的實施例中,相關器530a還向可選的方差模塊MOa提供自相關值。方差模塊MOa可以計算或估計一組自相關值的方差。方差模塊MOa可以向靈敏度調節器 ^Oa提供得到的方差值,靈敏度調節器550a可以使用該方差值,以細化對噪聲靈敏度控制 504a的調整。較大的方差值可以反映話音信號的存在,而較小的方差值則可以反映主要噪聲的存在。因此,靈敏度調節器550a可以包括邏輯,以當自相關和方差值都較大時增大噪聲靈敏度控制50 ,以及當自相關和方差值中的一個值為小或者兩個都較小時減小噪聲靈敏度控制504b。
可以提供用於所示示例噪聲靈敏度控制器52 的多種備選配置。例如,可以省略方差模塊MOa。備選地,相關器530a可以僅向方差模塊提供值,以及靈敏度調節器550a可以只基於方差值來調整噪聲靈敏度控制504a。此外,相關器530a可以使用其它統計措施來分析揚聲器輸入502a。例如,相關器530a可以使用任何歸一化的無偏估計器。在一個實施例中,相關器530a通過一組採樣的總功率或能量來歸一化所述相關。通過功率來歸一化所述相關可以使得靈敏度調節器^Oa基於輸入信號50 的特性而非基於輸入信號50 的功率方差來調整噪聲靈敏度控制5(Ma。
參考圖5B,示例噪聲靈敏度控制器524b包括圖5A的特徵中的大多數特徵。然而, 噪聲靈敏度控制器524b接收麥克風(「mic」)輸入502b,而非揚聲器輸入50 ,其中麥克風輸入520b可以包括由麥克風接收的一組採樣。對麥克風輸入502b應用以上描述的相關和/或方差技術可以允許噪聲靈敏度控制器524b在存在揚聲器反饋和/或雙講的情況下改善話音可懂度處理。
向能夠提供相同上述自相關特徵的相關器530b提供麥克風輸入502b。在揚聲器反饋或雙講的情況下,麥克風輸入502b可以包括周期性的或實質上周期性的信息。因此, 自相關函數可以是周期性的或實質上周期性的,以及相關器530b計算的自相關值可以大於許多形式的噪聲的自相關。
如前,相關器530b可以向靈敏度調節器550b提供自相關值。如果自相關值較大或大於閾值,則靈敏度調節器^Ob可以減小噪聲靈敏度控制504b,以減小由揚聲器反饋和 /或雙講造成的話音增強調製。類似地,如果自相關值較小或者小於閾值,則靈敏度調節器 550b可以增大噪聲靈敏度控制504b。如上,靈敏度調節器550b可以至少部分地基於自相關的級別來調整噪聲靈敏度控制504b的量。
相關器530b還向可選的方差模塊MOb提供自相關值。方差模塊MOb可以計算一組自相關值的方差或方差的近似值。方差模塊MOb可以向靈敏度調節器550b提供得到的方差值,靈敏度調節器^Ob可以使用該方差值來細化對噪聲靈敏度控制504b的調整。較大的方差值可以反映話音反饋和/或雙講的存在,而較小的方差值可以主要反映噪聲的存在。因此,當方差較大時,靈敏度調節器550b還可以減小噪聲靈敏度控制504b,反之亦然。
有益地,方差模塊MOb可以解決具有諧波分量的某些噪聲信號。一些噪聲信號, 比如由汽車和飛機產生的這些噪聲信號,具有低頻諧波含量,其可以導致較高的相關值。 然而,與針對話音信號的方差值相比,這些噪聲信號的自相關可以具有較低的方差值。因此,靈敏度調節器^Ob可以包括邏輯,以當自相關和方差值都較大時減小噪聲靈敏度控制 504b,以及當自相關和方差值中的一個值或者兩個值都較小時,增大噪聲靈敏度控制504b。
在多種實施例中,以上參考噪聲靈敏度控制器52 描述的備選配置還可以用於修改噪聲靈敏度控制器524b。此外,在備選實施例中,可以使用聲學回聲消除器來替代相關器530b、方差模塊MOb和/或靈敏度調節器550b (或者除了相關器530b、方差模塊MOb 和/或靈敏度調節器陽此以外還可以使用聲學回聲消除器)。聲學回聲消除器可以在麥克風輸入502b處減少或消除從揚聲器接收到的回聲。例如,可以採用實現了 1993年3月的 ITU-T建議G. 167中描述的特徵的聲學回聲消除器,因而併入其全部作為參考。然而,有利地,在某些實施例中,可以利用比聲學回聲消除器要少的處理資源來實現本文描述的相關和/或方差特徵。
參考圖5C,噪聲靈敏度控制器52 組合了噪聲靈敏度控制器52 和524b的特徵。特別地,噪聲靈敏度控制器52 接收麥克風輸入502b和揚聲器輸入5(Ma。向相關器 530a提供揚聲器輸入502a,相關器530a向靈敏度調節器550c以及方差模塊MOa提供自相關值,方差模塊MOa向靈敏度調節器550c提供方差值。向相關器530a提供麥克風輸入 502b,相關器530b向靈敏度調節器550c以及方差模塊MOb提供自相關值,方差模塊MOb 向靈敏度調節器^Oc提供方差值。
靈敏度調節器550c可以包括邏輯,以至少部分地基於從以下部件中的任何一個部件接收的信息來調整噪聲靈敏度控制5(Mc 部件530a、530b、MOa和MOb。在特定實施例中,靈敏度調節器^Oc執行軟判定,以調整噪聲靈敏度控制5(Mc。在圖6中描述了可以由靈敏度調節器^Oc執行的過程600的一個示例。在過程600的判定框602,確定是否麥克風方差值大於閾值。麥克風方差值可以由方差模塊MOb來計算。如果麥克風輸入502b 的自相關的方差大於閾值,則可能由於語音反饋或雙講而存在周期性的或實質上周期性的信號。因此,在方框604,靈敏度調節器550c至少部分地基於來自相關器530b的相關值來減小噪聲靈敏度控制,其中相關值越大,潛在地導致更大的減小。
如果麥克風方差小於閾值,則在判定框606處確定是否揚聲器方差小於閾值。方差模塊MOa可以根據揚聲器輸入50 的自相關來計算揚聲器方差值。如果揚聲器方差大於等於閾值,則在揚聲器輸入信號50 中可能存在語音信號。因此,在方框608處,靈敏度調節器550c將噪聲靈敏度控制設置為預設級別。
如果揚聲器方差小於閾值,則在揚聲器輸入50 中可能存在噪聲。因此,靈敏度調節器550c至少部分地基於來自相關器530a的相關值來減小噪聲靈敏度控制,其中相關值越小,潛在地導致更大的減小。
過程600示出了靈敏度調節器550c的一個示例實現方式。在其它實施例中,可以向過程600中描述的閾值之一或兩個閾值提供滯後量。在其它實施例中,在方框604中,將噪聲靈敏度控制設置為不直接取決於相關值的特定較小值。同樣地,在方框610中,可以將噪聲靈敏度控制設置為不取決於相關值的值。此外,可以使用自相關和方差以外的其它統計措施來調整噪聲靈敏度,包括標準偏差、高階矩、聲學回聲消除等。多種其它配置也是可能的。
更一般地,以上描述的任何噪聲靈敏度控制器可以被看作是話音、對話或語音分類器,其檢測輸入音頻信號中的一個或多個聲音、對話或語音分量,和/或對輸入音頻信號中的一個或多個聲音、對話或語音分量進行分類。噪聲靈敏度控制器還可以被看作是話音檢測器或普通信號分類器。噪聲靈敏度控制器至少部分地通過使用一個或多個處理器來執行話音或信號分類或檢測,以分析輸入音頻信號的一個或多個統計特徵。自相關和方差、聲學回聲消除及估計器僅是噪聲靈敏度控制器可以採用的技術的示例。包括其它統計技術的其它技術可以用於檢測輸入信號的話音或其它分量。
此外,話音反饋和雙講也僅是可以檢測的聲音分量的示例。以上參考圖5和6描述的噪聲靈敏度控制器的特徵可以用於檢測音頻信號中的其它話音分量,包括任何媒體內容(比如,電視、無線電、音樂和其它內容)中的話音。例如,控制器可以使用媒體內容中的音頻的自相關來檢測媒體內容中的話音分量。在一個實施例中,控制器可以向對話增強提供檢測到的話音分量,以增大或減小所施加的對話增強的量,從而使能該對話增強更有效地增強對話。
VI.失真控制
話音增強控制器222和/或輸出增益控制器230可以增大施加至話音信號的一個或多個增益。在一些情況下,使增益增大以超過特定點可以導致信號飽和,這可以造成失真。有利地,在特定實施例中,以上描述的失真控制模塊240可以提供控制失真,從而提供較大的響度。
圖7示出了更詳細的失真控制模塊740的實施例,其可以具有以上描述的失真控制模塊140的所有特徵。可以以硬體和/或軟體實現失真控制模塊740。在特定實施例中, 失真控制模塊740可以導致音頻信號中的選定失真,以增大信號能量,並從而增大響度。該選定失真可以是控制失真,其增加了比全飽和信號中存在的諧波要少的諧波。
如上所述,失真控制模塊740可以至少部分地通過將輸入採樣映射成輸出採樣來導致選定失真。失真控制模塊740可以通過將輸入信號702的採樣用作進入正弦和(sum-of-sines)表714或表的索引來執行這種映射。正弦和表714可以包括將諧波相關的正弦波求和來產生的值。
舉例說明,如果輸入信號702具有值為m的採樣,則失真控制模塊740可以將輸入採樣映射到正弦和表714中索引m處的輸出採樣。如果輸入信號702的採樣落在表714的索引值之間,則失真控制模塊740可以對索引值進行內插。使用內插可以允許減小正弦和表714的大小,以節約存儲器。然而,在特定實施例中,正弦和表714可以被設計為足夠大, 以避免使用內插。失真控制模塊740可以使用正弦和表714中映射後的輸出值作為針對輸出信號722的輸出採樣。
正弦和表714可以被實現為任何數據結構,比如數組、矩陣等。產生表714,以包括任意數目的諧波正弦波,該任意數目的諧波正弦波包括奇次諧波、偶次諧波或其結合。在特定實施例中,奇次諧波可以提供針對話音音頻信號的良好失真控制。偶次諧波可以在其它實現方式中使用,並且有利於減少音樂信號中的限幅。奇次諧波或偶次諧波可以用於混合的話音和音樂信號。然而,這僅是說明性示例,以及奇次諧波或偶次諧波或者兩者可以用於任何應用中。
當使用更多正弦波來產生表714時,信號能量和失真方面的潛在增大就越大,反之亦然。因為使用大量的正弦波可以導致顯著的諧波失真,所以在特定實施例中,有益地, 使用相對小數目的低頻正弦波來構建正弦和表714。
例如,可以根據兩個或三個諧波相關正弦波、四個正弦波、五個正弦波、或者更多正弦波之和來構建表714。可以在存儲器中存儲多個正弦和表714,並且可以基於不同的目的而由失真控制模塊740使用。例如,具有多個諧波的正弦和表714可以用於話音信號,而具有較少諧波的表714可以用於音樂,以構建較少的失真。
失真控制模塊740還可以提供用戶接口,該用戶接口向用戶提供失真控制,以調整信號能量增大和/或失真的量。例如,可以提供圖形化遊標、鈕等,或者用戶能夠按壓物理或軟按鈕來調整所施加的能量增大或失真的量。增大失真控制可以使得能夠使用具有更多諧波的表,反之亦然。
現在使用與三個奇次諧波相關正弦波來描述用於產生正弦和表714的示例過程。 在該示例中,可以通過填充具有選定大小的第一表格來產生正弦和表714,其中所述選定大小的第一表格具有一個正弦波周期的值(例如,從0弧度至2pi)。填充大小為N(N是整數) 的表格可以包括將一個正弦波周期劃分成N個值,以及將該N個值分配給表格中的N個空位。該第一正弦波表格可以表示基諧波或一次諧波。
可以以類似的方式(通過將三個正弦周期劃分為N個值),利用正弦波的三個周期來填充與第一表格相同大小的第二表格。第二表格中的值可以表示第一正弦波的三次諧波。類似地,可以利用五個正弦波周期來填充與前兩個表格相同大小的第三表格,該第三表格表示五次諧波。可以根據需要來縮放第一、第二和第三表格中的值。例如,可以縮小第二表格中的值,以使其幅度小於第一表格中那些值的幅度,以及可以縮放第三表格中的值,以包括比第二表格中的值要小的值。
因為在特定實施例中,三個表格大小相同(例如,具有相同數目的N個條目),所以可以將三個表格的相應索引中的值加在一起,以創建新正弦和表714,該新正弦和表714包括一次、三次和五次諧波之和。因此,在特定實施例中,如果要繪製正弦和表714中的值,則應當示出經求和後的波形的一個周期的近似圖形。在特定實施例中,使用的正弦波越多,繪製的這個波形將越近似於方波。在多種實施例中,可以以與描述三個奇次諧波的方式相類似的方式,來構建具有不同諧波的其它正弦和表。備選地,可以使用正弦波周期的一些部分而非完整的周期來構建正弦和表714。
由於失真控制模塊740將來自輸入信號702的採樣映射到正弦和表714中,表714 中的諧波頻率可以依賴於表查找速率,表查找速率繼而可以依賴於輸入信號的頻率。在特定實施例中,這種頻率依賴性使得失真控制模塊740以與輸入信號702的頻率相同速率或者以接近該速率的速率執行表查找操作。
作為說明,對於具有給定頻率的簡單正弦波輸入信號702,失真控制模塊740可以以相同頻率執行映射操作。得到的諧波可以具有取決於正弦波頻率的特定頻率。因此,使正弦波的頻率加倍可以使得諧波頻率加倍。對於包括多個疊加頻率的輸入信號702,由失真控制模塊740執行的映射可能導致諧波疊加。
圖8至15示出了失真和正弦波和的示例。作為參考,圖8示出了正弦波802的示例時域曲線800。示出了在沒有限幅的情況下正弦波802的峰值804。正弦波802的峰值電平804處於Odb處,在一些實施例中,峰值電平804可以是峰值可能數字電平。圖9示出了示例曲線900,該示例曲線900示出了圖8的正弦波802的頻譜902。因為圖9是正弦曲線,所以代表了一個頻率。
在特定實施例中,使正弦波802的幅度增大到超出峰值電平可能導致硬限幅。圖 10的曲線1000中示出了正弦曲線1002的硬限幅。限幅後的正弦曲線1002包括在峰值電平處飽和的限幅部分1004。在圖11中示出的頻域圖示1102中,可以看見限幅後的正弦波 1002的諧波1104的示例。如所示,諧波1104可以擴展為與採樣頻率一樣高(在所示示例圖中大約22kHz)。諧波1106的特定部分還是混淆的,從而造成進一步的失真。
為了避免硬限幅的完全失真,同時仍然允許增大音量,如上所述,失真控制模塊 740可以使用較低頻諧波的複合波。圖12示出了這種波的一組諧波的示例,其包括複合波的示例頻率響應曲線1200,可以響應於400Hz的輸入正弦波而產生所述複合波。與圖11的全限幅情況相比,曲線1200中的頻譜包括較少的諧波1202。在所描述的實施例中,已經產生了五次諧波1202。與圖11的高頻諧波1104相比,最高次諧波1202處於較低頻率下。在該實施例中不存在混淆諧波1106。
所示示例實施例包括大約400Hz、1200Hz、2000Hz、^OOHz和3600Hz的諧波。這些諧波1202是奇次諧波1202,其包括一次諧波1204、三次諧波1206、五次諧波1208、七次諧波1210和九次諧波1212。一次諧波1204具有約OdB的幅度,在特定實施例中,OdB的幅度是最大可能數字幅度。相繼的諧波1202的幅度隨著頻率的增大而變小。在實施例中,諧波 1202的幅度單調遞減。在其它實施例中,這些幅度可以改變。
由較低頻率諧波提供的控制失真的結果可以是圓潤且更自然的聲音波形,該聲音波形具有較高的信號能量或者較高的平均信號能量。圖13示出了波1302的示例時域曲線 1300,該示例時域曲線1300示出了映射至圖12的諧波1204上的正弦波。所示示例波1302 具有部分限幅部分1306和部分圓潤部分1308。波1302與硬限幅波1002之間的比較結果, 示出了波1302比硬限幅波1002更圓潤。此外,波1302的部分1304是線性的或者近似線性的。彎曲部分1308從限幅部分1306在大約-3dB處開始彎曲。
圖14示出了示例曲線1400,該示例曲線1400描繪了正弦和映射函數1410的實施例。可以通過繪製正弦和表(例如上述表714)中的值來繪製所示正弦和映射函數1410。 正弦和映射函數1410包括四分之一周期的正弦和波。為了最佳化,可以使用正弦和波的四分之一周期來替代完整波,這將在下文進行描述。
在χ軸上繪出了輸入信號值,其包括範圍在0至1之間的正幅度值。類似地,在y 軸上繪出了輸出信號值,也包括範圍在0至1之間的幅度值。將在下文描述負幅度值。當失真控制模塊140或740將輸入採樣映射到輸出採樣時,在特定實施例中,將輸入採樣映射到映射函數1410上的點。與輸入採樣相比,映射後的輸出採樣可以具有更大或更小的值, 這取決於輸入採樣被映射到了何位置。
為了清楚起見,示出正弦和映射函數1410作為連續函數。然而,當在數字系統中實現時,映射函數1410可以是離散的。此外,如上所述,不可能為所有的輸入信號值定義映射函數1410。因此,例如,失真控制模塊140或740可以在映射函數1410上的兩個最近點之間對輸出信號值進行內插。
作為參考,示出了虛線1420,其與線y = x相對應。如果根據虛線1420映射輸入採樣,則輸出採樣可以與輸入採樣相同。映射函數1410包括線性或近似線性的映射區域 1412以及非線性或近似非線性的映射區域1414。隨著落在線性映射區域1412中的輸入採樣值增大,線性映射區域1412中的相應輸出採樣也線性地或實質上線性地增大。落在非線性區域1414中的某些輸入採樣值非線性地或實質上非線性地增大,具有變化的增大級別。
映射函數1410的大多數值大於虛線1420的值,使得大多數輸入採樣可以被映射到更大的值。然而,在非線性映射區域1414的區域1416中,映射函數1410的值小於或者等於虛線1420的值。在該區域1416,輸入採樣被映射到了更小的值。因此,例如,可以減小硬限幅採樣的值(例如,具有1. 0或近似1. 0的值)。
如上所述,映射函數1410包括正弦和波的四分之一,而非完整的波。使用四分之一的波(或者甚至是二分之一波)可以使得能夠減小正弦和表714的大小,從而節約存儲器。對於負輸入信號值,(例如,在範圍[_1,0]之間等),失真控制模塊140、740可以反轉 χ軸上的映射函數1410,並且顛倒y軸上的映射函數1410。此後,失真控制模塊140、740可以將映射函數1410應用到輸入採樣上。備選地,可以反轉負值,並將其歸一化到範圍
。然後,可以應用映射函數1410,並且可以將得到的輸出採樣求反,以恢復到負值。
在備選實施例中,例如,根據用於產生正弦和表714的諧波的數目,所示函數1410 可以看起來不同。例如,線性映射區域1412可以具有更大或更小的斜率。非線性映射區域 1414可以是不同的形狀;例如,可以具有更少的峰值。同樣地,區域1416可以在幅度上更小或更大。
在特定實施例中,χ軸和/或y軸的範圍可以不同於上述範圍W,l]。將Χ軸的範圍縮減到
可以增大至少一部分輸入信號的放大率,其中a小於1。反之,將χ軸範圍增大到
可以減小至少一部分輸入信號的放大率,其中b大於1。有益地,在一些實施例中,使用大於1的b值可以減少限幅。類似地,可以將y軸改變為
,其中c小於或大於1。
圖15示出了在施加失真控制之前的音頻信號1512的示例時域圖示的曲線1500。 此外,圖15示出了施加了失真控制之後相同音頻信號1514的示例時域圖示。使用失真控制的示例實現將近似6dB的附加增益引入到了該波形中。
失真控制可以用於其它應用中,例如,失真控制可以用於增大低音音量,而減小失真。失真控制還可以被用於頻率展開應用中。此外,例如,失真控制還可以用於通過選擇多種諧波創建期望的樂器音質,來合成樂器聲音或其它聲音。
VII.結論
根據實施例,這裡描述的任何算法的特定動作、事件或功能可以以不同順序來執行,可以添加、合併或一起省去(例如,不是所有所描述的動作或事件對於算法的實行是必需的)。此外,在特定實施例中,例如可以通過多線程處理、中斷處理或多處理器或處理器核來同時執行動作或事件,而非順序執行。
結合這裡所公開的實施例描述的各個示意邏輯塊、模塊和算法步驟可以實現為電子硬體、計算機軟體或二者的組合。為了清楚示意硬體和軟體的可互換性,上述通常在它們的功能方面描述了各個示意組件、塊、模塊和步驟。將這種功能實現為硬體或軟體取決於特定應用並設計施加於總體系統的約束。針對每個特定應用,可以以變化的方式來實現所描述的功能,但是這種實現方式的決定不應當解釋為導致對本公開範圍的背離。
可以利用通用處理器、數位訊號處理器(DSP)、專用集成電路(ASIC)、現場可編程門陣列(FPGA)或其他可編程邏輯器件、離散門或電晶體邏輯、離散硬體組件、或其任何組合(被設計為執行這裡描述功能),來實現或執行結合這裡公開的實施例而描述的各個示意邏輯塊和模塊。通用處理器可以是微處理器,但可選地,該處理器可以是處理器、控制器、 微控制器或狀態機及其組合等。處理器還可以實現為計算設備的組合(例如,DSP和微處理器的組合)、多個微處理器、與DSP內核結合的一個或多個微處理器、或任何其他的這種配置。
結合這裡公開的實施例描述的方法或算法的步驟可以直接以硬體、由處理器執行的軟體模塊或二者的組合的形式來實現。軟體模塊可以駐留在RAM存儲器、快閃記憶體存儲器、 ROM存儲器、EPROM存儲器、EEPROM存儲器、寄存器、硬碟、可拆卸盤、CD-ROM或本領域已知的任何其他形式的存儲介質中。示例性存儲介質可以耦合至處理器,使得處理器可以從存儲介質讀取信息,並向存儲介質寫入信息。可選地,存儲介質可以與處理器集成。處理器和存儲介質可以駐留在ASIC中。ASIC可以駐留在用戶終端中。可選地,處理器和存儲介質可以作為分立組件駐留在用戶終端中。
除非另有聲明否則將在所使用的上下文理解,這裡使用的諸如「可以」、「例如」等之類的條件性語言通常傾向於覆蓋特定的實施例包括而其他實施例不包括的特定特徵、元素和/或狀態。因此,這種條件性語言通常不傾向於暗示對於一個或多個實施例按照任意方式要求所述特徵、元素和/或狀態,或者一個或多個實施例需要包括利用作者的輸入或提示包括來決定是否在任意具體的實施例中要包括或執行這些特徵、元素和/或狀態的邏輯。
儘管上述詳細描述已示出、描述並指出了應用於各個實施例的新穎特徵,但將理解,在不背離本公開的精神的前提下,可以對所示設備或算法的形式和細節進行各種省略、 替換和改變。將認識到,由於一些特徵可以與其他特徵分離地使用或實現,因此這裡描述的本發明的特定實施例可以以不能提供這裡所述的所有特徵和優點的形式來實現。這裡公開的本發明的範圍由所附權利要求而不是由上述描述來指示。在權利要求的等同意義和範圍內的所有改變應包括在其範圍內。
權利要求
1.一種用於自動調整施加至音頻信號的話音可懂度增強的系統,所述系統包括增強模塊,被配置為接收包括共振峰的輸入話音信號,以及對輸入話音信號施加音頻增強,以提供增強話音信號,所述音頻增強被配置為加強輸入話音信號中的一個或多個共振峰;增強控制器,包括一個或多個處理器,所述增強控制器被配置為至少部分地基於檢測到的環境噪聲的量來調整由所述增強模塊施加的音頻增強的量;輸出增益控制器被配置為至少部分地基於環境噪聲的量和輸入話音信號,來調整增強話音信號的總增益,以及向增強話音信號施加所述總增益,以產生放大話音信號;以及失真控制模塊,被配置為通過至少將放大話音信號的一個或多個採樣映射到在正弦和表中存儲的一個或多個值來減小放大話音信號中的限幅,其中所述正弦和表是根據較低次正弦諧波之和來產生。
2.如權利要求1所述的系統,其中,所述增強模塊還操作於通過對輸入話音信號的頻率子帶施加增益來加強所述一個或多個共振峰。
3.—種調整話音可懂度增強的方法,所述方法包括接收話音信號以及包括近端環境含量的輸入信號;利用一個或多個處理器計算輸入信號中的近端環境含量;利用所述一個或多個處理器,至少部分地基於近端環境含量來調整話音增強的級別;以及對所述話音信號施加所述話音增強,以產生增強話音信號,所述話音增強被配置為加強所述話音信號的一個或多個共振峰。
4.如權利要求3所述的方法,其中所述計算包括獲得所述近端環境含量的幅度,以及平滑所述近端環境含量的幅度。
5.如權利要求3所述的方法,其中所述利用一個或多個處理器調整話音增強的級別包括當所述近端環境含量在閾值之上時,跟隨近端環境含量。
6.如權利要求5所述的方法,其中至少部分地基於用戶可調整噪聲靈敏度級別來確定閾值。
7.如權利要求3所述的方法,還包括至少部分地基於近端環境含量和話音信號中的能量總量,調整增強話音信號的總增益。
8.如權利要求7所述的方法,其中所述調整總增益包括計算與近端環境含量成比例的增益級別。
9.如權利要求3所述的方法,還包括將增強話音信號的一個或多個採樣映射到正弦和表中存儲的一個或多個值,以減小增強話音信號中的限幅。
10.一種用於自動調整施加至音頻信號的話音可懂度增強的系統,所述系統包括增強模塊,被配置為接收包括共振峰的輸入話音信號,並且對輸入話音信號施加音頻增強,以提供增強話音信號,所述音頻增強被配置為加強輸入話音信號中的一個或多個共振峰;增強控制器,包括一個或多個處理器,所述增強控制器被配置為至少部分地基於檢測到的環境噪聲的量來調整由增強模塊施加的音頻增強的量;以及輸出增益控制器被配置為至少部分地基於環境噪聲的量和輸入話音信號來調整增強話音信號的總增益,以及向所述增強話音信號施加所述總增益,以產生放大話音信號。
11.如權利要求10所述的系統,其中,增強控制器還被配置為至少部分地基於環境噪聲的量與閾值的比值來調整所施加的環境增強的量。
12.如權利要求10所述的系統,其中,增強模塊還操作用於通過對輸入話音信號的頻率子帶施加增益來加強一個或多個共振峰。
13.如權利要求12所述的系統,其中,增強控制器還被配置為通過至少對輸入話音信號的頻率子帶施加附加增益來調整所施加的音頻增強的量。
14.如權利要求10所述的系統,其中,輸出增益控制器還被配置為通過提供與環境噪聲的量成比例的增益級別來調整總增益。
15.如權利要求10所述的系統,其中,輸出增益控制器被配置為響應於閾值之下的話音信號的能量,來調整總增益。
16.如權利要求10所述的系統,還包括失真控制模塊,用於減少放大話音信號中的限幅。
17.—種處理器可讀存儲介質,其上存儲有使得一個或多個處理器執行調整話音可懂度增強的方法的指令,所述方法包括接收來自遠程電話的話音信號和來自麥克風的噪聲信號; 計算噪聲信號的值;至少部分地基於噪聲信號的值,調整施加至話音信號的共振峰的增益;以及對話音信號的共振峰施加增益。
18.如權利要求17所述的處理器可讀存儲介質,還包括至少部分地基於話音信號的能量總量來調整話音信號的總增益。
19.如權利要求18所述的處理器可讀存儲介質,其中,響應於閾值以下的話音信號的能量,來調整總增益。
20.一種用於調整話音可懂度增強的噪聲閾值的系統,所述系統包括話音增強模塊,被配置為利用接收設備接收來自遠程設備的輸入話音信號,並且對輸入話音信號施加音頻增強,以加強輸入話音信號中的一個或多個共振峰;話音增強控制器,包括一個或多個處理器,所述話音增強控制器被配置為至少部分地基於第一噪聲閾值以上的檢測到的環境噪聲的量,來調整由所述增強模塊施加的音頻增強的量;以及噪聲靈敏度控制器,被配置為調整所述第一噪聲閾值,所述噪聲靈敏度控制器包括 第一相關器,被配置為根據從接收設備的麥克風接收的麥克風輸入信號來計算第一自相關值;第一方差模塊,操作用於計算所述第一自相關值的第一方差; 第二相關器,被配置為根據揚聲器輸入信號計算第二自相關值,其中所述揚聲器輸入信號包括話音增強模塊的輸出信號;第二方差模塊,操作用於計算所述第二自相關值的第二方差;以及噪聲靈敏度調節器,被配置為使用第一和第二自相關值和第一和第二方差值中的一個或多個來調整第一噪聲閾值,以產生第二噪聲閾值,其中,話音增強控制器被配置為至少部分地基於第二噪聲閾值以上的檢測到的環境噪聲的第二量,來調整施加至第二輸入音頻信號的音頻增強的量。
21.如權利要求20所述的系統,其中,所述噪聲靈敏度調節器還被配置為響應於預定量以上的第一方差,來產生小於第一噪聲閾值的第二噪聲閾值。
22.如權利要求21所述的系統,其中,所述噪聲靈敏度調節器還被配置為至少部分地基於第一自相關值中的一個或多個,來減小第二噪聲閾值。
23.如權利要求21所述的系統,其中,所述噪聲靈敏度調節器還被配置為針對較大的第一自相關值,提供對第二噪聲閾值的更大減小。
24.如權利要求23所述的系統,其中,所述噪聲靈敏度調節器還被配置為至少部分地基於所述第二自相關值中的一個或多個,減小所述第二噪聲閾值。
25.如權利要求21所述的系統,其中,所述噪聲靈敏度調節器還被配置為對於較小的第二自相關值,提供對第二噪聲閾值的更大減小。
26.如權利要求20所述的系統,其中,所述噪聲靈敏度調節器還被配置為響應於小於預定量的第二方差,來產生小於所述第一噪聲閾值的第二噪聲閾值。
27.一種用於調整話音可懂度增強的靈敏度的系統,所述系統包括話音增強模塊,被配置為利用接收設備來接收接收設備從遠程設備處接收到的輸入話音信號,並且向輸入話音信號施加音頻增強,以加強輸入話音信號中的一個或多個共振峰;增強控制器,被配置為至少部分地基於輸入話音信號中存在的環境噪聲的量來調整由話音增強模塊施加的音頻增強的量;以及噪聲靈敏度控制器,包括一個或多個處理器,被配置為至少部分地基於從接收設備的麥克風獲得的麥克風輸入信號和作為話音增強模塊的輸出信號提供的揚聲器輸入信號中的至少一個信號或者兩者的統計分析,來調整增強控制器對環境噪聲的靈敏度。
28.如權利要求27所述的系統,其中,所述噪聲靈敏度控制器包括相關器,被配置為計算麥克風輸入信號和揚聲器輸入信號中的一個或者兩個的自相關。
29.如權利要求觀所述的系統,其中,所述噪聲靈敏度控制器還包括方差模塊,被配置為估計自相關的方差。
30.如權利要求觀所述的系統,其中,所述噪聲靈敏度控制器還包括靈敏度調節器, 被配置為至少部分地基於計算的自相關,來調整增強控制器對環境噪聲的靈敏度。
31.如權利要求觀所述的系統,其中,所述噪聲靈敏度控制器還包括靈敏度調節器, 被配置為至少部分地基於估計的方差,來調整增強控制器對環境噪聲的靈敏度。
32.一種用於調整話音增強的靈敏度的方法,所述方法包括接收輸入音頻信號;檢測輸入音頻信號中的相關含量,所述檢測包括使用一個或多個處理器來計算輸入視頻信號的統計分析;以及響應於所述檢測,調整施加至輸入音頻信號的增強級別。
33.如權利要求32所述的方法,其中,所述計算輸入音頻信號的統計信息包括計算輸入音頻信號的自相關。
34.如權利要求33所述的方法,其中,所述檢測還包括計算自相關的方差。
35.如權利要求32所述的方法,其中,所述調整包括增大施加至輸入音頻信號的增強級別。
36.如權利要求32所述的方法,其中,所述增強包括對話增強。
37.如權利要求32所述的系統,其中,所述統計分析包括聲學回聲消除。
38.一種音頻信號處理方法,所述方法包括接收麥克風輸入信號;檢測麥克風輸入信號中的實質上周期性含量;利用一個或多個處理器,至少部分地基於在麥克風輸入信號中檢測到的實質上周期性含量來調整音頻增強;所述音頻增強被配置為至少部分地基於麥克風輸入信號的級別來選擇性地增強音頻輸出信號;以及向揚聲器提供所述音頻輸出信號。
39.如權利要求38所述的方法,其中,所述實質上周期性含量包括來自揚聲器的回聲。
40.如權利要求38所述的方法,其中,所述實質上周期性含量包括來自通信設備的收聽者的話音,所述通信設備被配置為實現所述音頻信號處理方法。
41.如權利要求38所述的方法,其中,所述麥克風輸入信號包括近端環境含量。
42.如權利要求38所述的方法,其中,所述檢測實質上周期性含量包括使用一種或多種統計技術來檢測所述實質上周期性含量。
43.如權利要求38所述的方法,其中,所述調整包括調整音頻增強對麥克風輸入信號的級別的靈敏度。
44.如權利要求38所述的方法,其中,所述調整包括關斷所述音頻增強。
45.如權利要求38所述的方法,其中,所述音頻增強包括話音可懂度增強。
46.如權利要求38所述的方法,其中,在通信設備中實現所述音頻信號處理方法。
全文摘要
自適應音頻系統可以在通信設備中實現。自適應音頻系統可以增強由通信設備接收的音頻信號中的話音,以提高話音的可懂度。音頻系統可以至少部分地基於由通信設備接收的環境含量(例如,噪聲)的級別來調整音頻增強。例如,對於更高的環境含量級別,該音頻系統可以更強地施加音頻增強。此外,該自適應音頻系統可以檢測環境含量中的實質上周期性含量。自適應音頻系統還可以響應於環境含量來調整音頻增強。
文檔編號G06F15/16GK102498482SQ200980161425
公開日2012年6月13日 申請日期2009年9月14日 優先權日2009年9月14日
發明者何星, 楊鈞, 理察·J·奧利弗, 詹姆斯·特雷西 申請人:Srs實驗室有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀