新四季網

用於通過音頻電平進行上下文取代的系統、方法及設備的製作方法

2023-05-29 05:58:11 2

專利名稱:用於通過音頻電平進行上下文取代的系統、方法及設備的製作方法
技術領域:
本發明涉及話音信號的處理。
背景技術:
用於語音信號的通信及/或存儲的應用通常使用麥克風來捕獲包括主揚聲器語 音的聲音的音頻信號。音頻信號的表示語音的部分稱為話音或話音分量。所捕獲的音頻信 號常常還將包括來自麥克風的周圍聲學環境的(例如背景聲音)的其它聲音。音頻信號的 此部分稱為上下文或上下文分量。例如話音及音樂的音頻信息通過數位技術的傳輸已變得廣泛,尤其是在長途電 話、例如基於IP的語音傳輸(還稱為VoIP,其中IP指示網際網路協議)的包交換電話,及例 如蜂窩式電話的數字無線電電話中。此種增長已導致對減少用以經由傳輸信道傳送語音通 信的信息的量且同時維持重建話音的所感知質量的興趣。舉例來說,需要最佳地使用可用 無線系統帶寬。有效使用系統帶寬的一種方式為採用信號壓縮技術。對於攜載話音信號的 無線系統來說,出於此目的起見,通常採用話音壓縮(或「話音解碼」)技術。經配置以通過提取與人話音產生的模型有關的參數而壓縮話音的裝置常常稱為 語音解碼器、編解碼器、聲碼器、「音頻解碼器」或「話音解碼器」,且以下描述可互換地使用 這些術語。話音解碼器通常包括話音編碼器及話音解碼器。編碼器通常作為一系列稱為 「幀」的樣本塊接收數字音頻信號,分析每一幀以提取某些相關參數,且將參數量化為經編 碼幀。經編碼幀經由傳輸信道(即,有線或無線網絡連接)傳輸到包括解碼器的接收器。或 者,經編碼音頻信號可經存儲以供在以後時間進行檢索及解碼。解碼器接收且處理經編碼 幀、對其進行反量化以產生參數,且使用反量化參數重新創建話音幀。在典型通話中,每一揚聲器靜默約百分之六十的時間。話音編碼器常常經配置以 區分含有話音的音頻信號的幀(「活動幀」)與僅含有上下文或靜默的音頻信號的幀(「非 活動幀」)。所述編碼器可經配置以使用不同解碼模式及/或速率來編碼活動與非活動幀。 舉例來說,非活動幀通常感知為攜載極少或不攜載信息,且話音編碼器常常經配置以使用 比編碼活動幀少的位(即,較低位速率)來編碼非活動幀。用以編碼活動幀的位速率的實例包括每幀171個位、每幀80個位及每幀40個位。 用以編碼非活動幀的位速率的實例包括每幀16個位。在蜂窩式電話系統(尤其是依照如 由電信工業協會(維吉尼亞州,阿靈頓(Arlington,VA))發布的臨時標準(IS)_95(或類似 工業標準)的系統)的上下文中,這四個位速率還分別稱為「全速率」、「半速率」、「四分之一速率」及「八分之一速率」。

發明內容
此文件描述一種處理包括第一音頻上下文的數字音頻信號的方法。此方法包括抑 制來自所述數字音頻信號的第一音頻上下文,基於由第一麥克風產生的第一音頻信號來獲 得上下文受抑制信號。此方法還包括將第二音頻上下文與基於上下文受抑制信號的信號進 行混合以獲得上下文經增強信號。在此方法中,數字音頻信號是基於由不同於第一麥克風 的第二麥克風產生的第二音頻信號。此文件還描述與此方法有關的設備、裝置的組合及計 算機可讀媒體。此文件還描述一種處理基於從第一轉變器接收的信號的數字音頻信號的方法。此 方法包括抑制來自數字音頻信號的第一音頻上下文以獲得上下文受抑制信號;將第二音頻 上下文與基於上下文受抑制信號的信號進行混合以獲得上下文經增強信號;將基於(A)第 二音頻上下文及(B)上下文經增強信號中的至少一者的信號轉換為模擬信號;及使用第二 轉變器來產生基於模擬信號的可聽信號(audible signal) 0在此方法中,第一轉變器及第 二轉變器兩者位於共同外殼內。此文件還描述與此方法有關的設備、裝置的組合及計算機 可讀媒體。此文件還描述一種處理經編碼音頻信號的方法。此方法包括根據第一解碼方案 解碼經編碼音頻信號的第一多個經編碼幀以獲得包括話音分量及上下文分量的第一經解 碼音頻信號;根據第二解碼方案解碼經編碼音頻信號的第二多個經編碼幀以獲得第二經解 碼音頻信號;及基於來自第二經解碼音頻信號的信息,抑制來自基於第一經解碼音頻信號 的第三信號的上下文分量以獲得上下文受抑制信號。此文件還描述與此方法有關的設備、 裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數字音頻信號的方法。此方 法包括抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號;對基於上下文受 抑制信號的信號進行編碼以獲得經編碼音頻信號;選擇多個音頻上下文中的一者;及將與 所選音頻上下文有關的信息插入於基於經編碼音頻信號的信號中。此文件還描述與此方法 有關的設備、裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數字音頻信號的方法。此方 法包括抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號;對基於上下文受抑 制信號的信號進行編碼以獲得經編碼音頻信號;經由第一邏輯信道將經編碼音頻信號發送 到第一實體;及經由不同於第一邏輯信道的第二邏輯信道向第二實體發送(A)音頻上下文 選擇信息及(B)識別第一實體的信息。此文件還描述與此方法有關的設備、裝置的組合及 計算機可讀媒體。此文件還描述一種處理經編碼音頻信號的方法。此方法包括在移動用戶終端內解 碼經編碼音頻信號以獲得經解碼音頻信號;在移動用戶終端內產生音頻上下文信號;及在 移動用戶終端內,將基於音頻上下文信號的信號與基於經解碼音頻信號的信號進行混合。 此文件還描述與此方法有關的設備、裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數字音頻信號的方法。此方 法包括抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號;產生基於第一濾波器及第一多個序列的音頻上下文信號,所述第一多個序列中的每一者具有不同的時間分 辨率;及將基於所產生音頻上下文信號的第一信號與基於上下文受抑制信號的第二信號進 行混合以獲得上下文經增強信號。在此方法中,產生音頻上下文信號包括將第一濾波器應 用到第一多個序列中的每一者。此文件還描述與此方法有關的設備、裝置的組合及計算機 可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數字音頻信號的方法。此方 法包括抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號;產生音頻上下文 信號;將基於所產生音頻上下文信號的第一信號與基於上下文受抑制信號的第二信號進行 混合以獲得上下文經增強信號;及計算基於數字音頻信號的第三信號的電平。在此方法中, 產生及混合中的至少一者包括基於第三信號的所計算電平控制第一信號的電平。此文件還 描述與此方法有關的設備、裝置的組合及計算機可讀媒體。此文件還描述一種根據處理控制信號的狀態來處理數字音頻信號的方法,其中數 字音頻信號具有話音分量及上下文分量。此方法包括在處理控制信號具有第一狀態時以第 一位速率對缺少話音分量的數字音頻信號部分的幀進行編碼。此方法包括在處理控制信號 具有不同於第一狀態的第二狀態時抑制來自數字音頻信號的上下文分量以獲得上下文受 抑制信號。此方法包括在處理控制信號具有第二狀態時將音頻上下文信號與基於上下文受 抑制信號的信號進行混合以獲得上下文經增強信號。此方法包括在處理控制信號具有第二 狀態時以第二位速率對缺少話音分量的上下文經增強信號部分的幀進行編碼,其中第二位 速率高於第一位速率。此文件還描述與此方法有關的設備、裝置的組合及計算機可讀媒體。


圖1A展示話音編碼器X10的框圖。圖1B展示話音編碼器X10的實施方案X20的框圖。
圖2展示決策樹的一個實例。圖3A展示根據一般配置的設備X100的框圖。圖3B展示上下文處理器100的實施方案102的框圖。圖3C-圖3F展示可攜式或免提式裝置中兩個麥克風K10及K20的各種安裝配置, 且圖3G展示上下文處理器102的實施方案102A的框圖。圖4A展示設備X100的實施方案X102的框圖。圖4B展示上下文處理器104的實施方案106的框圖。圖5A說明音頻信號與編碼器選擇操作之間的各種可能的相關性。圖5B說明音頻信號與編碼器選擇操作之間的各種可能的相關性。圖6展示設備X100的實施方案XI10的框圖。圖7展示設備X100的實施方案X120的框圖。圖8展示設備X100的實施方案X130的框圖。圖9A展示上下文產生器120的實施方案122的框圖。圖9B展示上下文產生器122的實施方案124的框圖。圖9C展示上下文產生器122的另一實施方案126的框圖。圖9D展示用於產生所產生上下文信號S50的方法M100的流程圖。
圖10展示多分辨上下文合成的過程的圖。圖11A展示上下文處理器102的實施方案108的框圖。圖11B展示上下文處理器102的實施方案109的框圖。圖12A展示話音解碼器R10的框圖。圖12B展示話音解碼器R10的實施方案R20的框圖。圖13A展示上下文混合器190的實施方案192的框圖。圖13B展示根據一配置的設備R100的框圖。圖14A展示上下文處理器200的實施方案的框圖。圖14B展示設備R100的實施方案R110的框圖。圖15展示根據一配置的設備R200的框圖。圖16展示設備X100的實施方案X200的框圖。圖17展示設備X100的實施方案X210的框圖。圖18展示設備X100的實施方案X220的框圖。圖19展示根據所揭示配置的設備X300的框圖。圖20展示設備X300的實施方案X310的框圖。圖21A展示從伺服器下載上下文信息的實例。圖21B展示將上下文信息下載到解碼器的實例。圖22展示根據所揭示配置的設備R300的框圖。圖23展示設備R300的實施方案R310的框圖。圖24展示設備R300的實施方案R320的框圖。圖25A展示根據所揭示配置的方法A100的流程圖。圖25B展示根據所揭示配置的設備AM100的框圖。圖26A展示根據所揭示配置的方法B100的流程圖。圖26B展示根據所揭示配置的設備BM100的框圖。圖27A展示根據所揭示配置的方法C100的流程圖。圖27B展示根據所揭示配置的設備CM100的框圖。圖28A展示根據所揭示配置的方法D100的流程圖。圖28B展示根據所揭示配置的設備DM100的框圖。圖29A展示根據所揭示配置的方法E100的流程圖。圖29B展示根據所揭示配置的設備EM100的框圖。圖30A展示根據所揭示配置的方法E200的流程圖。圖30B展示根據所揭示配置的設備EM200的框圖。圖31A展示根據所揭示配置的方法F100的流程圖。圖31B展示根據所揭示配置的設備FM100的框圖。圖32A展示根據所揭示配置的方法G100的流程圖。圖32B展示根據所揭示配置的設備GM100的框圖。圖33A展示根據所揭示配置的方法H100的流程圖。圖33B展示根據所揭示配置的設備HM100的框圖。在這些圖中,相同參考標號指代相同或類似元件。
10
具體實施例方式儘管音頻信號的話音分量通常攜載主要信息,但上下文分量也在例如電話的語音 通信應用中起重要作用。由於上下文分量存在於活動及非活動幀兩者期間,所以其在非活 動幀期間的連續重現對於在接收器處提供連續性及連通性是重要的。上下文分量的重現質 量可能對於逼真度及整體所感知質量也是重要的,尤其對於嘈雜環境中使用的免提式終端 來說。例如蜂窩式電話的移動用戶終端允許語音通信應用擴展到比先前更多的位置。結 果,可能遭遇的不同音頻上下文的數目增加。現存語音通信應用通常將上下文分量視作噪 聲,但一些上下文比其它上下文更結構化,且可能更難可辨別地進行編碼。在一些情形下,可能需要抑制及/或掩蔽音頻信號的上下文分量。出於安全原因, 舉例來說,可能需要在傳輸或存儲之前從音頻信號移除上下文分量。或者,可能需要向音頻 信號添加不同上下文。舉例來說,可能需要造成揚聲器在不同位置處及/或在不同環境中 的錯覺。本文揭示的配置包括可應用於語音通信及/或存儲應用中以移除、增強及/或取 代現存音頻上下文的系統、方法及設備。明確地預期且特此揭示,本文揭示的配置可適合用 於包交換式網絡(舉例來說,根據例如VoIP的協議布置以攜載語音傳輸的有線及/或無線 網絡)及/或電路交換式網絡中。還死明確地預期且特此揭示,本文揭示的配置可適合用 於窄帶解碼系統(例如,編碼約四千赫茲或五千赫茲的音頻頻率範圍的系統)中及用於寬 帶解碼系統(例如,編碼大於五千赫茲的音頻頻率的系統)中,包括全頻帶解碼系統及分離 頻帶解碼系統。除非明確由其上下文限制,否則術語「信號」在本文中用來指示其普通意義中的任 一者,包括如導線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置的集合)的狀 態。除非明確由其上下文限制,否則術語「產生」在本文用來指示其普通意義中的任一者, 例如計算或以其它方式產生。除非明確由其上下文限制,否則術語「計算」在本文用來指示 其普通意義中的任一者,例如計算、估計及/或從一組值進行選擇。除非明確由其上下文限 制,否則術語「獲得」用來指示其普通意義中的任一者,例如計算、導出、接收(例如,從外部 裝置)及/或檢索(例如,從存儲元件陣列)。在術語「包含」用於本發明描述及權利要求 書中時,其並不排除其它元件或操作。術語「基於」(如在「A基於B」中)用來指示其普通 意義中的任一者,包括以下情形(i) 「至少基於」(例如,「A至少基於B」),及(ii) 「等同 於」(例如,"A等同於B」)(在特定上下文中適當的情況下)。除非另外指示,否則具有特定特徵的設備的操作的任何揭示內容還明確地打算 揭示具有類似特徵的方法(且反之亦然),且根據特定配置的設備的操作的任何揭示內容 也明確地打算揭示根據類似配置的方法(且反之亦然)。除非另外指示,否則術語「上下 文」(或「音頻上下文」)用來指示音頻信號的不同於話音分量且傳達來自揚聲器的周圍環 境的音頻信息的分量,且術語「噪聲」用來指示音頻信號中並非話音分量的部分且不傳達來 自揚聲器的周圍環境的信息的任何其它假象。出於話音解碼目的,話音信號通常經數位化(或量化)以獲得樣本流。可根據此 項技術中已知的各種方法(包括,例如,脈碼調製(PCM)、壓擴y律PCM及壓擴A律PCM)中 的任一者執行數位化處理。窄帶話音編碼器通常使用8kHz的取樣速率,而寬帶話音編碼器通常使用更高的取樣速率(例如,12或16kHz)。將經數位化的話音信號處理為一系列幀。此系列通常實施為非重疊系列,但處理 幀或幀片段(還稱為子幀)的操作還可包括其輸入中的一個或一個以上鄰近幀的片段。話 音信號的幀通常足夠短從而信號的頻譜包絡可預期在幀上保持相對固定。幀通常對應於話 音信號的5與35毫秒(或約40到200個樣本)之間,其中10、20及30毫秒為常見的幀大 小。通常所有幀具有相同的長度,且在本文描述的特定實例中假定均勻幀長度。然而,還明 確地預期且特此揭示,可使用非均勻幀長度。20毫秒的幀長度在七千赫茲(kHz)的取樣速率下對應於140個樣本,在8kHz的取 樣速率下對應於160個樣本,且在16kHz的取樣速率下對應於320個樣本,但可使用認為適 於特定應用的任何取樣速率。可用於話音解碼的取樣速率的另一實例為12. 8kHz,且另外的 實例包括從12. 8kHz到38. 4kHz的範圍中的其它速率。圖IA展示經配置以接收音頻信號SlO (例如,作為一系列幀)且產生對應經編碼 音頻信號S20(例如,作為一系列經編碼幀)的話音編碼器XlO的框圖。話音編碼器XlO包 括解碼方案選擇器20、活動幀編碼器30及非活動幀編碼器40。音頻信號SlO為包括話音 分量(即,主揚聲器語音的聲音)及上下文分量(即,周圍環境或背景聲音)的數字音頻信 號。音頻信號SlO通常為如由麥克風捕獲的模擬信號的經數位化版本。解碼方案選擇器20經配置以區分音頻信號SlO的活動幀與非活動幀。此種操作 還稱為「語音活動性檢測」或「話音活動性檢測」,且解碼方案選擇器20可經實施以包括語 音活動性檢測器或話音活動性檢測器。舉例來說,解碼方案選擇器20可經配置以輸出對於 活動幀為高且對於非活動幀為低的二進位值解碼方案選擇信號。圖IA展示其中使用由譯 碼方案選擇器20產生的解碼方案選擇信號來控制話音編碼器XlO的一對選擇器50a及50b 的實例。解碼方案選擇器20可經配置以基於幀的能量及/或頻譜內容的一個或一個以上 特性(例如幀能量、信噪比(SNR)、周期性、頻譜分布(例如,頻譜傾斜)及/或過零率)將 幀分類為活動或非活動。此種分類可包括將此種特性的值或量值與閾值進行比較,及/或 將此種特性的改變的量值(例如,相對於先前幀)與閾值進行比較。舉例來說,解碼方案選 擇器20可經配置以估計當前幀的能量,且如果能量值小於(或者,不大於)閾值,則將幀分 類為非活動。此種選擇器可經配置以將幀能量計算為幀樣本的平方和。解碼方案選擇器20的另一實施方案經配置以估計低頻帶(例如,300Hz到2kHz) 及高頻帶(例如,2kHz到4kHz)中的每一者中當前幀的能量,且在每一頻帶的能量值小於 (或者,不大於)相應閾值的情況下指示幀為非活動的。此種選擇器可經配置以通過將通 帶濾波器應用到幀及計算經濾波的幀的樣本的平方和而計算頻帶中的幀能量。此種語音 活動性檢測操作的一個實例描述於第三代合作夥伴計劃2 (3GPP2)標準文件C. S0014-C, vl. 0 (2007年1月)的章節4. 7中(以www. 3rpp2. org在線可得)。另外或在替代方案中,此種分類可基於來自一個或一個以上先前幀及/或一個或 一個以上隨後幀的信息。舉例來說,可能需要基於幀特性的關於兩個或兩個以上幀求平均 的值對幀進行分類。可能需要使用基於來自先前幀(例如,背景噪聲電平,SNR)的信息的 閾值對幀進行分類。還可能需要配置解碼方案選擇器20以將音頻信號SlO中遵循從活動 幀到非活動幀的過渡的第一幀中的一者或一者以上分類為活動的。在過渡之後以此種方式
12繼續先前分類狀態的動作還稱為「釋放延遲(hangover) 」。活動幀編碼器30經配置以編碼音頻信號的活動幀。編碼器30可經配置以根據例 如全速率、半速率或四分之一速率的位速率來編碼活動幀。編碼器30可經配置以根據例如 碼激勵線性預測(CELP)、原型波形內插(PWI)或原型間距周期(PPP)的解碼模式來編碼活 動幀。活動幀編碼器30的典型實施方案經配置以產生包括對頻譜信息的描述及對時間 信息的描述的經編碼幀。對頻譜信息的描述可包括線性預測解碼(LPC)係數值的一個或一 個以上向量,其指示經編碼話音的共振(還稱為「共振峰」)。對頻譜信息的描述通常經量 化,以使得LPC向量通常被轉換為可有效進行量化的形式,例如線頻譜頻率(LSF)、線頻譜 對(LSP)、導抗頻譜頻率(immittance spectral frequency,ISF)、導抗頻譜對(ISP)、倒頻 譜係數或對數面積比。對時間信息的描述可包括對也通常經量化的激勵信號的描述。非活動幀編碼器40經配置以編碼非活動幀。非活動幀編碼器40通常經配置而以 比活動幀編碼器30使用的位速率低的位速率來編碼非活動幀。在一個實例中,非活動幀編 碼器40經配置以使用噪聲激勵線性預測(NELP)解碼方案以八分之一速率來編碼非活動 幀。非活動幀編碼器40還可經配置以執行不連續傳輸(DTX),以使得經編碼幀(還稱為「靜 默描述」或SID幀)針對少於音頻信號S10的所有非活動幀進行傳輸。非活動幀編碼器40的典型實施方案經配置以產生包括對頻譜信息的描述及對時 間信息的描述的經編碼幀。對頻譜信息的描述可包括線性預測解碼(LPC)係數值的一個或 一個以上向量。對頻譜信息的描述通常經量化,以使得LPC向量通常轉換為如上文實例中 的可有效進行量化的形式。非活動幀編碼器40可經配置以執行具有比活動幀編碼器30執 行的LPC分析的階數低的階數的LPC分析,及/或非活動幀編碼器40可經配置以將對頻譜 信息的描述量化為比活動幀編碼器30產生的頻譜信息的量化描述少的位。對時間信息的 描述可包括對也通常經量化的時間包絡的描述(例如,包括幀的增益值及/或幀的一系列 子幀中的每一者的增益值)。注意,編碼器30及40可共享共同結構。舉例來說,編碼器30及40可共享LPC系 數值的計算器(可能經配置以產生針對活動幀與非活動幀具有不同階數的結果),但具有 分別不同的時間描述計算器。還注意,話音編碼器X10的軟體或固件實施方案可使用解碼 方案選擇器20的輸出以引導對幀編碼器中的一者或另一者的執行的流程,且此種實施方 案可能不包括針對選擇器50a及/或針對選擇器50b的模擬。可能需要配置解碼方案選擇器20以將音頻信號S10的每一活動幀分類為若干不 同類型中的一者。這些不同類型可包括有聲話音(例如,表示元音聲的話音)的幀、過渡幀 (例如,表示詞的開始或結束的幀)及無聲話音(例如,表示摩擦聲的話音)的幀。幀分類 可基於當前幀及/或一個或一個以上先前幀的一個或一個以上特徵,例如幀能量、兩個或 兩個以上不同頻帶中的每一者的幀能量、SNR、周期性、頻譜傾斜及/或過零率。此種分類可 包括將此種因數的值或量值與閾值進行比較及/或將此種因數的改變的量值與閾值進行 比較。可能需要配置話音編碼器X10以使用不同解碼位速率來編碼不同類型的活動幀 (例如,以平衡網絡需求與容量)。此種操作稱為「可變速率解碼」。舉例來說,可能需要配 置話音編碼器X10來以較高位速率(例如,全速率)編碼過渡幀,以較低位速率(例如,四分之一速率)編碼無聲幀,且以中間位速率(例如,半速率)或以更高位速率(例如,全速 率)編碼有聲幀。圖2展示解碼方案選擇器20的實施方案22可用以根據幀含有的話音的類型選擇 編碼特定幀的位速率的決策樹的一個實例。在其它情形下,針對特定幀所選擇的位速率還 可視例如所要平均位速率、在一系列幀上的所要位速率模式(其可用以支持所要平均位速 率)及/或針對先前幀所選擇的位速率等準則而定。另外或在替代方案中,可能需要配置話音編碼器X10以使用不同解碼模式來編碼 不同類型的話音幀。此種操作稱為「多模式解碼」。舉例來說,有聲話音的幀傾向於具有長 期(即,持續一個以上的幀周期)的周期性結構且與音高相關,且使用對此長期頻譜特徵的 描述進行編碼的解碼模式來編碼有聲幀(或有聲幀的序列)通常是更加有效的。此類解碼 模式的實例包括CELP、PWI及PPP。另一方面,無聲幀及非活動幀通常缺少任何顯著長期頻 譜特徵,且話音編碼器可經配置以使用例如NELP等不嘗試描述此特徵的解碼模式來編碼 這些幀。可能需要實施話音編碼器X10以使用多模式解碼,以使得根據基於(例如)周期 性或發音的分類使用不同模式來編碼幀。還可能需要實施話音編碼器X10以針對不同類 型的活動幀使用位速率與解碼模式的不同組合(還稱為「解碼方案」)。話音編碼器X10的 此種實施方案的一個實例針對含有有聲話音的幀及過渡幀使用全速率CELP方案,針對含 有無聲話音的幀使用半速率NELP方案,且針對非活動幀使用八分之一速率NELP方案。話 音編碼器X10的此類實施方案的其它實例支持針對一個或一個以上解碼方案的多個解碼 速率,例如全速率及半速率CELP方案及/或全速率及四分之一速率PPP方案。多方案編 碼器、解碼器及解碼技術的實例描述於(例如)標題為「用於維持話音解碼器中的目標位 速率的方法及設備(METHODS AND APPARATUS FOR MAINTAINING ATARGET BIT RATE IN A SPEECH CODER),,的美國專利第6,330, 532號中及標題為「可變速率話音解碼(VARIABLE RATE SPEECH CODING) 」的美國專利第6,691,084號中;及標題為「閉環可變速率多模式 預測話音解碼器(CLOSED-LOOP VARIABLE-RATEMULTIMODE PREDICTIVE SPEECH CODER) 」 的美國專利申請案第09/191,643號中及標題為「用於可變速率解碼器的任意平均數據速 率(ARBITRARY AVERAGE DATARATES FOR VARIABLE RATE CODERS) 」 的美國專利申請案第 11/625,788 號中。圖IB展示包括活動幀編碼器30的多個實施方案30a、30b的話音編碼器X10的實 施方案X20的框圖。編碼器30a經配置以使用第一解碼方案(例如,全速率CELP)來編碼 第一類活動幀(例如,有聲幀),且編碼器30b經配置以使用具有與第一解碼方案不同的位 速率及/或解碼模式的第二解碼方案(例如,半速率NELP)來編碼第二類活動幀(例如,無 聲幀)。在此情形下,選擇器52a及52b經配置以根據由解碼方案選擇器22產生的具有兩 個以上可能狀態的解碼方案選擇信號的狀態在各種幀編碼器中進行選擇。明確地揭示,話 音編碼器X20可以支持從活動幀編碼器30的兩個以上不同實施方案中進行選擇的方式進 行擴展。話音編碼器X20的幀編碼器中的一者或一者以上可共享共同結構。舉例來說,此 類編碼器可共享LPC係數值的計算器(可能經配置以針對不同類的幀產生具有不同階數的 結果),但具有分別不同的時間描述計算器。舉例來說,編碼器30a及30b可具有不同激勵信號計算器。如圖1B中所展示,話音編碼器X10還可經實施以包括噪聲抑制器10。噪聲抑制 器10經配置及布置以對音頻信號S10執行噪聲抑制操作。此種操作可支持解碼方案選擇 器20對活動與非活動幀之間的改進辨別及/或活動幀編碼器30及/或非活動幀編碼器 40的更佳編碼結果。噪聲抑制器10可經配置以將不同相應增益因數應用到音頻信號的兩 個或兩個以上不同頻率信道中的每一者,其中每一信道的增益因數可基於信道的噪聲能量 或SNR的估計。如與時域相對,可能需要在頻域中執行此種增益控制,且此種配置的一個實 例描述於上文提及的3GPP2標準文件C. S0014-C的章節4. 4. 3中。或者,噪聲抑制器10可 經配置以可能在頻域中將自適應濾波器應用到音頻信號。歐洲電信標準協會(ETSI)文件 ES 2020505 vl. 1. 5 (2007年1月,以www. etsi. org在線可得)的章節5. 1描述從非活動幀 估計噪聲頻譜且基於所計算的噪聲頻譜對音頻信號執行兩階段梅爾彎曲維納(meliarped Wiener)濾波的此種配置的實例。圖3A展示根據一般配置的設備X100的框圖(還稱為編碼器、編碼設備或用於編 碼的設備)。設備X100經配置以從音頻信號S10移除現存上下文且將其取代為可能類似 或不同於現存上下文的所產生上下文。設備X100包括經配置及布置以處理音頻信號S10 以產生上下文經增強音頻信號S15的上下文處理器100。設備X100還包括話音編碼器X10 的實施方案(例如,話音編碼器X20),其經布置以編碼上下文經增強音頻信號S15以產生 經編碼音頻信號S20。包括例如蜂窩式電話的設備X100的通信裝置可經配置以在將經編 碼音頻信號S20傳輸到有線、無線或光學傳輸信道(例如,通過一個或一個以上載波的射頻 調製)中之前對經編碼音頻信號S20執行進一步處理操作,例如錯誤校正、冗餘及/或協議 (例如,乙太網絡、TCP/IP、CDMA2000)解碼。圖3B展示上下文處理器100的實施方案102的框圖。上下文處理器102包括經配 置及布置以抑制音頻信號S10的上下文分量以產生上下文受抑制音頻信號S13的上下文抑 制器110。上下文處理器102還包括經配置以根據上下文選擇信號S40的狀態產生所產生 上下文信號S50的上下文產生器120。上下文處理器102還包括經配置及布置以將上下文 受抑制音頻信號S13與所產生上下文信號S50進行混合以產生上下文經增強音頻信號S15 的上下文混合器190。如圖3B中所示,上下文抑制器110經布置以在進行編碼之前從音頻信號抑制現 存上下文。上下文抑制器110可實施為如上文所描述的噪聲抑制器10的更加冒進的版本 (例如,通過使用一個或一個以上不同閾值)。替代地或另外,上下文抑制器110可經實施 以使用來自兩個或兩個以上麥克風的音頻信號以抑制音頻信號S10的上下文分量。圖3G 展示包括上下文抑制器110的此種實施方案110A的上下文處理器102的實施方案102A的 框圖。上下文抑制器110A經配置以抑制音頻信號S10的上下文分量,舉例來說,其基於由 第一麥克風產生的音頻信號。上下文抑制器110A經配置以通過使用基於由第二麥克風產 生的音頻信號的音頻信號SA1 (例如,另一數字音頻信號)而執行此種操作。多麥克風上下 文抑制的合適實例揭示於(例如)代理人案號為061521的標題為「噪聲及回音減少的設 備及方法(APPARATUS AND METHOD OF NOISE AND ECHOREDUCTION) 」 (超翼(Choy)等人) 的美國專利申請案第11/864,906號中,及代理人案號為080551的標題為「用於信號分離 的系統、方法及設備(SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION)」(維瑟(Visser)等人)的美國專利申請案第12/037,928號中。上下文抑制器110的多麥克風實 施方案還可經配置以向解碼方案選擇器20的對應實施方案提供信息,以用於根據(例如) 代理人案號為061497的標題為「多麥克風語音活動性檢測器(MULTIPLE MICROPHONE VOICE ACTIVITYDETECTOR) 」(超翼(Choy)等人)的美國專利申請案第11/864,897號中揭示的技 術而改進話音活動性檢測性能。圖3C到圖3F展示兩個麥克風KlO及K20在包括設備XlOO的此種實施方案的便 攜式裝置(例如蜂窩式電話或其它移動用戶終端)中或在經配置以經由到此種可攜式裝置 的有線或無線(例如,藍牙)連接進行通信的免提式裝置(例如耳機或頭戴式耳機)中的 各種安裝配置。在這些實例中,麥克風KlO經布置以產生主要含有話音分量(例如,音頻信 號SlO的模擬前體(analog precursor))的音頻信號,且麥克風K20經布置以產生主要含 有上下文分量(例如,音頻信號SAl的模擬前體)的音頻信號。圖3C展示其中麥克風KlO 安裝於裝置的正面之後且麥克風K20安裝於裝置的頂面之後的布置的一個實例。圖3D展 示其中麥克風KlO安裝於裝置的正面之後且麥克風K20安裝於裝置的側面之後的布置的一 個實例。圖3E展示其中麥克風KlO安裝於裝置的正面之後且麥克風K20安裝於裝置的底 面之後的布置的一個實例。圖3F展示其中麥克風KlO安裝於裝置的正面(或內面)之後 且麥克風K20安裝於裝置的背面(或外面)之後的布置的一個實例。上下文抑制器110可經配置以對音頻信號執行頻譜相減操作。頻譜相減可預期 抑制具有固定統計量的上下文分量,但對於抑制非固定的上下文可能無效。頻譜相減可 用於具有一個麥克風的應用中以及其中來自多個麥克風的信號可用的應用中。在典型實 例中,上下文抑制器110的此種實施方案經配置以分析音頻信號的非活動幀以導出對現 存上下文的統計學描述,例如若干頻率子帶(還稱為「頻率組(frequency bin)」)中的 每一者中的上下文分量的能量級,且將對應頻率選擇性增益應用到音頻信號(例如,以基 於對應上下文能量級衰減頻率子帶中的每一者上的音頻信號)。頻譜相減操作的其它實 例描述於S. F.波爾(S. F. Boll)的「使用頻譜相減抑制話音中的聲學噪聲(Suppression ofAcoustic Noise in Speech Using Spectral Subtraction),,(IEEE 匯幹丨J,聲學、話音及 信號處理(IEEE Trans. Acoustics, Speech and Signal Processing),27 (2) :112_120, 1979 年 4 月)中;R.穆凱(R. Mukai)、S.阿拉奇(S. Araki)、H.薩瓦達(H. Sawada)及 S.瑪奇諾(S. Makino)的「使用LMS濾波器移除盲源分離中的殘餘串音分量(Removal of residualcrosstalk components in blind source separation using LMS filters)」(關 於用於信號處理的神經網絡的第12屆IEEE專題討論會的會議記錄(Proc. of 12th IEEE Workshop on NeuralNetworks for Signal Processing),第 435-444 頁,瑞士,馬提尼 (Martigny, Switzerland),2002 年 9 月)中;及 R.穆凱(R. Mukai)、S.阿拉奇(S. Araki)、 H.薩瓦達(H. Sawada)及S.瑪奇諾(S. Makino)的「使用延時頻譜相減移除盲源分離中的殘 餘串音分量(Removalof residual cross-talk components in blind source separation using time-delayed spectralsubtraction) "(ICASSP 2002 白勺Hi己i (Proc· of ICASSP 2002),第 1789-1792 頁,2002 年 5 月)中。另外或在替代實施方案中,上下文抑制器110可經配置以對音頻信號執行盲源分 離(BSS,還稱為獨立分量分析)操作。盲源分離可用於來自一個或一個以上麥克風(除 了用於捕獲音頻信號SlO的麥克風之外)的信號可用的應用中。盲源分離可預期抑制固
16定的上下文以及具有非固定統計的上下文。描述於美國專利6,167,417(葩拉(Parra)等 人)中的BSS操作的一個實例使用梯度下降法來計算用以分離源信號的濾波器的係數。 BSS操作的其它實例描述於S.阿瑪裡(S.Amari)、A.斯超奇(A. Cichocki)及H. H.楊 (H. H. Yang)的「用於盲信號分離的新學習算法(A new learning algorithm for blind signalseparation),,(神經信息處理系統 8 的進步(Advances in Neural Information ProcessingSystems 8),MIT 出版社(MIT Press),1996 年)中;L.莫爾哥狄(L. Molgedey) 及H.G.斯庫斯特(H. G. Schuster)的「使用延時相關分離獨立信號的混合(Separation of amixture of independent signals using time delayed correlations),,(物理i平論'決 報(Phys. Rev. Lett.), 72 (23) :3634_3637,1994 年)中;及 L.葩拉(L. Parra)及 C.斯奔 思(C.Spence)的「非固定源的卷積盲源分離(Convolutive blind source separation of non-stationarysources),,(IEEE、匯幹(IEEE Trans.),論話音及音頻處理(on Speech and AudioProcessing),8(3) :320_327,2000年5月)中。另外或在上文論述的實施方案的替 代方案中,上下文抑制器100可經配置以執行波束成形操作。波束成形操作的實例揭示於 (例如)上文提及的美國專利申請案第11/864,897號(代理人案號061497)中及H.塞 盧瓦塔裡(H. Saruwatari)等人的「將獨立分量分析與波束成形組合的盲源分離(Blind SourceSeparation Combining Independent Component Analysis and Beamforming),,(關 於應用信號處理的 EURASIP 期刊(EURASIP Journal on Applied Signal Processing), 2003 :11,1135-1146(2003 年))中。彼此靠近地定位的麥克風(例如安裝於例如蜂窩式電話或免提式裝置的護罩的 共同外殼內的麥克風)可產生具有高瞬時相關的信號。所屬領域的技術人員還將認識到, 一個或一個以上麥克風可放置於共同外殼(即,整個裝置的護罩)內的麥克風外殼中。此 種相關可降級BSS操作的性能,且在此類情形下可能需要在BSS操作之前解相關音頻信號。 解相關還通常對於回音消除為有效的。解相關器可實施為具有五個或更少的抽頭(tap)或 甚至三個或更少的抽頭的濾波器(可能為自適應濾波器)。此種濾波器的抽頭權重可為固 定的,或可根據輸入音頻信號的相關特性進行選擇,且可能需要使用網格濾波器結構來實 施解相關濾波器。上下文抑制器110的此種實施方案可經配置以對音頻信號的兩個或兩個 以上不同頻率子帶中的每一者執行分離的解相關操作。上下文抑制器110的實施方案可經配置以在BSS操作之後至少對經分離話音分量 執行一個或一個以上額外處理操作。舉例來說,可能需要上下文抑制器110至少對經分離 話音分量執行解相關操作。可單獨地對經分離話音分量的兩個或兩個以上不同頻率子帶中 的每一者執行此種操作。另外或在替代方案中,上下文抑制器110的實施方案可經配置以基於經分離上下 文分量對經分離話音分量執行非線性處理操作,例如頻譜相減。可進一步從話音分量抑制 現存上下文的頻譜相減可根據經分離上下文分量的對應頻率子帶的電平而實施為隨時間 推移而變化的頻率選擇性增益。另外或在替代方案中,上下文抑制器110的實施方案可經配置以對經分離話音分 量執行中心削波操作。此種操作通常將增益應用到與信號電平及/或話音活動性電平成比 例地隨時間推移而變化的信號。中心削波操作的一個實例可表達為y[n] = {對於|X[n] <(,0;否則,1[11]},其中1[11]為輸入樣本,y[n]為輸出樣本,且C為削波閾值的值。中心削波操作的另一實例可表達為y[n] = {對於x[n] | <C,0 ;否則,Sgn(X[n]) (|x[n] -C)}, 其中sgn(x[n])指示x[n]的正負號。可能需要配置上下文抑制器110以大致上完全從音頻信號中移除現存上下文分 量。舉例來說,可能需要設備X100用不同於現存上下文分量的所產生上下文信號S50取代 現存上下文分量。在此種情形下,現存上下文分量的大致上完全移除可能有助於減少經解 碼音頻信號中現存上下文分量與取代上下文信號之間的可聽見的幹擾。在另一實例中,可 能需要設備X100經配置以隱藏現存上下文分量,不管是否還將所產生上下文信號S50相加 到音頻信號。可能需要將上下文處理器100實施為可在兩個或兩個以上不同操作模式之間配 置。舉例來說,可能需要提供(A)第一操作模式,其中上下文處理器100經配置以在現存 上下文分量大致上保持不變的情形下傳遞音頻信號;及(B)第二操作模式,其中上下文處 理器100經配置以大致上完全移除現存上下文分量(可能將其取代為所產生上下文信號 S50)。對此種第一操作模式的支持(其可配置為默認模式)可能對允許包括設備X100的 裝置的向後兼容性有用。在第一操作模式中,上下文處理器100可經配置以對音頻信號執 行噪聲抑制操作(例如,如上文關於噪聲抑制器10所描述)以產生噪聲受抑制音頻信號。上下文處理器100的另外實施方案可類似地經配置以支持兩個以上操作模式。舉 例來說,此另外實施方案可為可配置的以根據在從至少大致上無上下文抑制(例如,僅噪 聲抑制)到部分上下文抑制到至少大致上完全上下文抑制的範圍中的三個或三個以上模 式中的可選模式而改變抑制現存上下文分量的程度。圖4A展示包括上下文處理器100的實施方案104的設備X100的實施方案X102 的框圖。上下文處理器104經配置以根據處理控制信號S30的狀態而以上文描述的兩個或 兩個以上模式中的一者進行操作。處理控制信號S30的狀態可由用戶控制(例如,經由圖 形用戶接口、開關或其它控制接口),或者可由處理控制產生器340(如圖16中所說明)產 生處理控制信號S30,所述處理控制信號S30包括例如表等將一個或一個以上變量(例如, 物理位置、操作模式)的不同值與處理控制信號S30的不同狀態相關聯的加索引數據結構。 在一個實例中,處理控制信號S30被實施為二進位值信號(即,旗標),其狀態指示將傳遞還 是抑制現存上下文分量。在此種情形下,上下文處理器104可以第一模式進行配置以通過 停用其元件中的一者或一者以上及/或從信號路徑中移除此類元件(即,允許音頻信號繞 過所述元件)而傳遞音頻信號S10,且可以第二模式進行配置以通過啟用此類元件及/或將 其插入於信號路徑中而產生上下文經增強音頻信號S15。或者,上下文處理器104可以第一 模式進行配置以對音頻信號S10執行噪聲抑制操作(例如,如上文關於噪聲抑制器10所描 述),且可以第二模式進行配置以對音頻信號S10執行上下文取代操作。在另一實例中,處 理控制信號S30具有兩個以上可能狀態,每一狀態對應於上下文處理器的在從至少大致上 無上下文抑制(例如,僅噪聲抑制)到部分上下文抑制到至少大致上完全的上下文抑制的 範圍中的三個或三個以上操作模式中的一個不同模式。圖4B展示上下文處理器104的實施方案106的框圖。上下文處理器106包括上下 文抑制器110的實施方案112,其經配置以具有至少兩個操作模式第一操作模式,其中上 下文抑制器112經配置以在現存上下文分量大致上保持不變的情形下傳遞音頻信號S10, 及第二操作模式,其中上下文抑制器112經配置以大致上完全從音頻信號S10移除現存上下文分量(即,以產生上下文受抑制音頻信號S13)。可能需要實施上下文抑制器112以使 得第一操作模式為默認模式。可能需要實施上下文抑制器112以在第一操作模式中對音頻 信號執行噪聲抑制操作(例如,如上文關於噪聲抑制器10所描述)以產生噪聲受抑制音頻信號。上下文抑制器112可經實施以使得在其第一操作模式中,繞過經配置以對音頻信 號執行上下文抑制操作的一個或一個以上元件(例如,一個或一個以上軟體及/或固件例 行程序)。替代地或另外,上下文抑制器112可經實施以通過改變此種上下文抑制操作(例 如,頻譜相減及/或BSS操作)的一個或一個以上閾值而以不同模式進行操作。舉例來說, 上下文抑制器112可以第一模式進行配置以應用第一組閾值來執行噪聲抑制操作,且可以 第二模式進行配置以應用第二組閾值來執行上下文抑制操作。處理控制信號S30可用以控制上下文處理器104的一個或一個以上其它元件。圖 4B展示經配置以根據處理控制信號S30的狀態進行操作的上下文產生器120的實施方案 122的實例。舉例來說,可能需要根據處理控制信號S30的對應狀態將上下文產生器122實 施為經停用(例如,以減少功率消耗)或以其它方式防止上下文產生器122產生所產生的 上下文信號S50。另外或替代地,可能需要根據處理控制信號S30的對應狀態將上下文混合 器190實施為經停用或繞過,或以其它方式防止上下文混合器190將其輸入音頻信號與所 產生上下文信號S50進行混合。如上所述,話音編碼器X10可經配置以根據音頻信號S10的一個或一個以上特性 從兩個或兩個以上幀編碼器中進行選擇。同樣,在設備X100的實施方案內,可不同地實施 解碼方案選擇器20以根據音頻信號S10、上下文受抑制音頻信號S13及/或上下文經增強 音頻信號S15的一個或一個以上特性產生編碼器選擇信號。圖5A說明這些信號與話音編 碼器X10的編碼器選擇操作之間的各種可能的相關性。圖6展示設備X100的特定實施方 案XI10的框圖,其中解碼方案選擇器20經配置以基於上下文受抑制音頻信號S13 (如圖5A 中的點B所指示)的一個或一個以上特性(例如幀能量、兩個或兩個以上不同頻帶中的每 一者的幀能量、SNR、周期性、頻譜傾斜及/或過零率)產生編碼器選擇信號。明確地預期且 特此揭示,圖5A及圖6中建議的設備X100的各種實施方案中的任一者還可經配置以包括 根據處理控制信號S30 (例如,如關於圖4A、圖4B所描述)的狀態及/或三個或三個以上幀 編碼器(例如,如關於圖1B所描述)中的一者的選擇來控制上下文抑制器110。可能需要實施設備X100以將噪聲抑制及上下文抑制作為單獨操作而執行。舉例 來說,可能需要將上下文處理器100的實施方案添加到具有話音編碼器X20的現存實施方 案的裝置,而不移除、停用或繞過噪聲抑制器10。圖5B說明在包括噪聲抑制器10的設備 X100的實施方案中在基於音頻信號S10的信號與話音編碼器X20的編碼器選擇操作之間的 各種可能的相關性。圖7展示設備X100的特定實施方案X120的框圖,其中解碼方案選擇 器20經配置以基於噪聲受抑制音頻信號S12(如圖5B中的點A所指示)的一個或一個以 上特性(例如幀能量、兩個或兩個以上不同頻帶中的每一者的幀能量、SNR、周期性、頻譜傾 斜及/或過零率)產生編碼器選擇信號。明確地預期且特此揭示,圖5B及圖7中建議的設 備X100的各種實施方案中的任一者還可經配置以包括根據處理控制信號S30 (例如,如關 於圖4A、圖4B所描述)的狀態及/或三個或三個以上幀編碼器(例如,如關於圖1B所描 述)中的一者的選擇來控制上下文抑制器110。
上下文抑制器110還可經配置以包括噪聲抑制器10,或可以其它方式可選擇地進 行配置以對音頻信號SlO執行噪聲抑制。舉例來說,可能需要設備XlOO根據處理控制信號 S30的狀態執行上下文抑制(其中現存上下文大致上從音頻信號SlO完全移除)或者噪聲 抑制(其中現存上下文大致上保持不變)。一般來說,上下文抑制器110還可經配置以在執 行上下文抑制之前對音頻信號Sio及/或在執行上下文抑制之後對所得音頻信號執行一個 或一個以上其它處理操作(例如濾波操作)。如上所述,現存話音編碼器通常使用低位速率及/或DTX來編碼非活動幀。因此, 經編碼非活動幀通常含有極少上下文的信息。視由上下文選擇信號S40指示的特定上下 文及/或上下文產生器120的特定實施方案而定,所產生上下文信號S50的聲音質量及信 息內容可能大於原始上下文的聲音質量及信息內容。在此種情形下,可能需要使用比用來 編碼僅包括原始上下文的非活動幀的位速率高的位速率來編碼包括所產生上下文信號S50 的非活動幀。圖8展示包括至少兩個活動幀編碼器30a、30b及解碼方案選擇器20及選擇 器50a、50b的對應實施方案的設備XlOO的實施方案X130的框圖。在此實例中,設備X130 經配置以基於上下文經增強信號(即,在將所產生上下文信號S50相加到上下文受抑制音 頻信號之後)執行解碼方案選擇。儘管此種布置可能導致語音活動性的錯誤檢測,但其在 使用較高位速率來編碼上下文經增強靜默幀的系統中也可能是合意的。明確地指出,如關於圖8所描述的兩個或兩個以上活動幀編碼器及解碼方案選擇 器20及選擇器50a、50b的對應實施方案的特徵還可包括於本文揭示的設備XlOO的其它實 施方案中。上下文產生器120經配置以根據上下文選擇信號S40的狀態產生所產生上下文信 號S50。上下文混合器190經配置及布置以將上下文受抑制音頻信號S13與所產生上下文 信號S50進行混合以產生上下文經增強音頻信號S15。在一個實例中,上下文混合器190實 施為經布置以將所產生上下文信號S50相加到上下文受抑制音頻信號S13的加法器。可能 需要上下文產生器120以可與上下文受抑制音頻信號兼容的形式產生所產生上下文信號 S50。在設備XlOO的典型實施方案中,舉例來說,所產生上下文信號S50及由上下文抑制器 110產生的音頻信號兩者均為PCM樣本的序列。在此種情形下,上下文混合器190可經配 置以將所產生上下文信號S50與上下文受抑制音頻信號S13 (可能作為基於幀的操作)的 對應樣本對相加,但還可能實施上下文混合器190以對具有不同取樣解析度的信號進行相 加。音頻信號SlO通常還實施為PCM樣本的序列。在一些情形下,上下文混合器190經配 置以對上下文經增強信號執行一個或一個以上其它處理操作(例如濾波操作)。上下文選擇信號S40指示兩個或兩個以上上下文中的至少一者的選擇。在一個實 例中,上下文選擇信號S40指示基於現存上下文的一個或一個以上特徵的上下文選擇。舉 例來說,上下文選擇信號S40可基於與音頻信號SlO的一個或一個以上非活動幀的一個或 一個以上時間及/或頻率特性有關的信息。解碼模式選擇器20可經配置而以此種方式產 生上下文選擇信號S40。或者,設備XlOO可經實施以包括經配置而以此種方式產生上下 文選擇信號S40的上下文分類器320 (例如,如圖7中所展示)。舉例來說,上下文分類器 可經配置以執行基於現存上下文的線頻譜頻率(LSF)的上下文分類操作,例如埃爾-馬萊 赫(El-Maleh)等人的「移動環境中的幀級噪聲分類(Frame-level NoiseClassification in Mobile Environments),,(關於 ASSP 的 IEEE 國際會議的會議記錄(Proc. IEEE Int' 1Conf. ASSP),1999年,第I卷,第237-240頁);美國專利第6,782,361號(埃爾-馬 萊赫(El-Maleh)等人);及錢(Qian)等人的「用於有效聲音傳輸的分類舒適噪聲產生 (Classified Comfort Noise Generation for Efficient Voice Transmission),,(國際 語音學學術會議2006(Interspeech 2006),賓夕法尼亞州,匹茲堡(Pittsburgh, PA),第 225-228頁)中描述的那些操作。在另一實例中,上下文選擇信號S40指示基於例如與包括設備X100的裝置的物理 位置有關的信息(例如,基於從全球定位衛星(GPS)系統獲得,經由三角測量或其它測距操 作計算,及/或從基站收發器或其它伺服器接收的信息)的一個或一個以上其它準則的上 下文選擇、將不同時間或時間周期與對應上下文相關聯的時間表,及用戶選擇的上下文模 式(例如商務模式、舒緩模式、聚會模式)。在此類情形下,設備X100可經實施以包括上下 文選擇器330 (例如,如圖8中所展示)。上下文選擇器330可經實施以包括將不同上下文 與例如上文提及的準則的一個或一個以上變量的對應值相關聯的一個或一個以上加索引 數據結構(例如,表)。在另一實例中,上下文選擇信號S40指示兩個或兩個以上上下文的 列表中的一者的用戶選擇(例如,從例如菜單的圖形用戶接口)。上下文選擇信號S40的另 外的實例包括基於上文實例的任何組合的信號。圖9A展示包括上下文資料庫130及上下文產生引擎140的上下文產生器120的 實施方案122的框圖。上下文資料庫120經配置以存儲描述不同上下文的若干組參數值。 上下文產生引擎140經配置以根據根據上下文選擇信號S40的狀態而選擇的一組所存儲的 參數值來產生上下文。圖9B展示上下文產生器122的實施方案124的框圖。在此實例中,上下文產生引 擎140的實施方案144經配置以接收上下文選擇信號S40,且從上下文資料庫130的實施 方案134檢索對應組的參數值。圖9C展示上下文產生器122的另一實施方案126的框圖。 在此實例中,上下文資料庫130的實施方案136經配置以接收上下文選擇信號S40,且將對 應組的參數值提供到上下文產生引擎140的實施方案146。上下文資料庫130經配置以存儲兩個或兩個以上組的描述對應上下文的參數值。 上下文產生器120的其它實施方案可包括上下文產生引擎140的實施方案,上下文產生引 擎140的所述實施方案經配置以從例如伺服器的內容提供者(例如,使用會話起始協議 (SIP)的版本,如當前在RFC 3261中所描述,其以mm. ietf. org在線可得)或其它非本地 資料庫或從對等網絡下載對應於所選上下文的一組參數值(例如,如程(Cheng)等人的「協 作性保密性經增強的阿利必電話(A Collaborative Privacy-Enhanced AlibiPhone) 」, 關於網格和普適計算的國際會議的會議記錄(Proc. Int' 1 Conf. Grid andPervasive Computing),第 405-414 頁,臺灣,臺中(Taichung,Tff), 2006 年 5 月)中所描述)。上下文產生器120可經配置而以經取樣的數位訊號形式(例如,如PCM樣本的序 列)檢索或下載上下文。然而,由於存儲及/或位速率限制,此種上下文可能將遠遠短於典 型通信會話(例如,電話呼叫),從而要求在呼叫期間反覆不斷地重複相同上下文且導致對 於收聽者來說不可接受地分散注意力的結果。或者,可能將需要大量存儲及/或高位速率 下載連接以避免過度重複的結果。或者,上下文產生引擎140可經配置以從例如一組頻譜及/或能量參數值的所檢 索或所下載參數表示而產生上下文。舉例來說,上下文產生引擎140可經配置以基於如可包括於SID幀中的對頻譜包絡(例如,LSF值的向量)的描述及對激勵信號的描述而產生 上下文信號S50的多個幀。上下文產生引擎140的此種實施方案可經配置以逐幀地隨機化 所述組參數值以減小對所產生上下文的重複的覺察。可能需要上下文產生引擎140基於描述聲音紋理(sound texture)的模板產生所 產生上下文信號S50。在一個所述實例中,上下文產生引擎140經配置以基於包括多個不同 長度的自然顆粒的模板執行顆粒合成。在另一實例中,上下文產生引擎140經配置以基於 包括級聯時間頻率線性預測(CTFLP)分析(在CTFLP分析中,原始信號在頻域中使用線性 預測進行模型化,且此分析的剩餘部分接著在頻域中使用線性預測進行模型化)的時域及 頻域係數的模板執行CTFLP合成。在另一實例中,上下文產生引擎140經配置以基於包括 多分辨分析(MRA)樹的模板執行多分辨合成,所述多分辨分析(MRA)樹描述至少一個基底 函數在不同時間及頻率標度處的係數(例如,例如多貝西(Daubechies)比例縮放函數的比 例縮放函數的係數,及例如多貝西小波函數的小波函數的係數)。圖10展示基於平均係數 及詳細係數的序列的所產生上下文信號S50的多分辨合成的一個實例。可能需要上下文產生引擎140根據語音通信會話的預期長度產生所產生上下文 信號S50。在一個所述實例中,上下文產生引擎140經配置以根據平均電話呼叫長度產生所 產生上下文信號S50。平均呼叫長度的典型值在一到四分鐘的範圍內,且上下文產生引擎 140可經實施以使用可根據用戶選擇而變化的默認值(例如,兩分鐘)。可能需要上下文產生引擎140產生所產生上下文信號S50以包括基於相同模板的 若干或許多不同上下文信號削波。所要數目的不同削波可設定為默認值或由設備XlOO的 用戶選擇,且此數目的典型範圍為五到二十。在一個所述實例中,上下文產生引擎140經配 置以根據基於平均呼叫長度及不同削波的所要數目的削波長度計算不同削波中的每一者。 削波長度通常比幀長度大一、二或三個數量級。在一個實例中,平均呼叫長度值為兩分鐘, 不同削波的所要數目為十,且通過將兩分鐘除以十而計算削波長度為十二秒。在此類情形下,上下文產生引擎140可經配置以產生所要數目的不同削波(各自 基於相同模板且具有所計算的削波長度),且級聯或以其它方式組合這些削波以產生所產 生上下文信號S50。上下文產生引擎140可經配置以重複所產生上下文信號S50(如果必 要)(例如,假如通信的長度超過平均呼叫長度)。可能需要配置上下文產生引擎140以根 據音頻信號SlO從有聲到無聲幀的過渡產生新削波。圖9D展示用於產生所產生上下文信號S50的可由上下文產生引擎140的實施方 案執行的方法MlOO的流程圖。任務TlOO基於平均呼叫長度值及不同削波的所要數目計算 削波長度。任務T200基於模板產生所要數目的不同削波。任務T300將削波進行組合以產 生所產生上下文信號S50。任務T200可經配置以從包括MRA樹的模板產生上下文信號削波。舉例來說,任務 T200可經配置以通過產生統計學上類似於模板樹的新MRA樹且根據所述新樹合成上下文 信號削波而產生每一削波。在此種情形下,任務T200可經配置以將新MRA樹產生為模板樹 的複本,其中一個或一個以上(可能全部)序列的一個或一個以上(可能全部)係數由具有 類似祖系體(ancestor)(即,在較低解析度下的序列中)及/或前體(predecessor)(即, 在相同序列中)的模板樹的其它係數取代。在另一實例中,任務T200經配置以根據通過向 一組模板係數值的複本的每一值加上小隨機值而計算的一組新係數值產生每一削波。
任務T200可經配置以根據音頻信號SlO及/或基於其的信號(例如,信號S12及 /或S13)的一個或一個以上特徵而按比例縮放上下文信號削波中的一者或一者以上(可能 全部)。所述特徵可包括信號電平、幀能量、SNR、一個或一個以上梅爾頻率倒譜係數(MFCC) 及/或對信號的語音活動性檢測操作的一個或一個以上結果。對於任務T200經配置以從 所產生的MRA樹合成削波的情形來說,任務T200可經配置以對所產生MRA樹的係數執行此 種按比例縮放。上下文產生器120的實施方案可經配置以執行任務T200的此種實施方案。 另外或在替代方案中,任務T300可經配置以對經組合的所產生上下文信號執行此種按比 例縮放。上下文混合器190的實施方案可經配置以執行任務T300的此種實施方案。任務T300可經配置以根據相似性的測量組合上下文信號削波。任務T300可經配 置以級聯具有類似MFCC向量的削波(例如,根據候選削波組上的MFCC向量的相對相似性 級聯削波)。舉例來說,任務T200可經配置以最小化相鄰削波的MFCC向量之間的在經組合 削波串上計算的總距離。對於任務T200經配置以執行CTFLP合成的情形來說,任務T300 可經配置以級聯或以其它方式組合從類似係數產生的削波。舉例來說,任務T200可經配置 以最小化相鄰削波的LPC係數之間的在經組合削波串上計算的總距離。任務T300還可經 配置以串連具有類似邊界瞬變的削波(例如,避免從一個削波到下一削波的可聽見的不連 續性)。舉例來說任務T200可經配置以最小化相鄰削波的邊界區域上的能量之間的在經 組合削波串上計算的總距離。在這些實例中的任一者中,任務T300可經配置以使用疊加 (overlap-and-add)或交叉淡化(cross-fade)操作(而非級聯)來組合相鄰削波。如上文所描述,上下文產生引擎140可經配置以基於可以允許低存儲成本及擴 展非重複產生的緊密表示形式下載或檢索的對聲音紋理的描述而產生所產生上下文信號 S50。此等技術亦可應用於視頻或視聽應用。舉例來說,設備XlOO的具有視頻能力的實施 方案可經配置以執行多分辨合成操作以增強或取代視聽通信的視覺上下文(例如,背景及 /或照明特性)。上下文產生引擎140可經配置以貫穿通信會話(例如,電話呼叫)重複地產生隨 機MRA樹。由於可預期較大樹需要較長時間產生,所以可基於對延遲的容許度選擇MRA樹 的深度。在另一實例中,上下文產生引擎140可經配置以使用不同模板產生多個短MRA樹, 及/或選擇多個隨機MRA樹,且混合及/或級聯這些樹中的兩者或兩者以上以獲得樣本的 較長序列。可能需要配置設備XlOO以根據增益控制信號S90的狀態控制所產生上下文信號 S50的電平。舉例來說,上下文產生器120 (或其元件,例如上下文產生引擎140)可經配置 以根據增益控制信號S90的狀態(可能通過對所產生上下文信號S50或對信號S50的前體 執行按比例縮放操作(例如,對模板樹或從模板樹產生的MRA樹的係數))以特定電平產生 所產生上下文信號S50。在另一實例中,圖13A展示包括按比例縮放器(例如,乘法器)的 上下文混合器190的實施方案192的框圖,所述按比例縮放器經布置以根據增益控制信號 S90的狀態對所產生上下文信號S50執行按比例縮放操作。上下文混合器192還包括經配 置以將經按比例縮放的上下文信號相加到上下文受抑制音頻信號S13的加法器。包括設備XlOO的裝置可經配置以根據用戶選擇來設定增益控制信號S90的狀態。 舉例來說,此種裝置可裝備有音量控制(例如,開關或旋鈕,或提供此種功能性的圖形用戶 接口),裝置的用戶可通過所述音量控制選擇所產生上下文信號S50的所要電平。在此情形下,裝置可經配置以根據所選電平設定增益控制信號S90的狀態。在另一實例中,此種音量 控制可經配置以允許用戶選擇所產生上下文信號S50相對於話音分量的(例如,上下文受 抑制音頻信號S13的)電平的所要電平。圖IlA展示包括增益控制信號計算器195的上下文處理器102的實施方案108的 框圖。增益控制信號計算器195經配置以根據可隨時間推移而改變的信號S13的電平計算 增益控制信號S90。舉例來說,增益控制信號計算器195可經配置以基於信號S13的活動幀 的平均能量來設定增益控制信號S90的狀態。另外或在任一此種情形的替代方案中,包括 設備XlOO的裝置可裝備有音量控制,所述音量控制經配置以允許用戶直接控制話音分量 (例如,信號S13)或上下文經增強音頻信號S15的電平,或間接控制此種電平(例如,通過 控制前驅信號的電平)。設備XlOO可經配置以控制所產生上下文信號S50相對於音頻信號S10、S12及S13 中的一者或一者以上的電平的電平,其可隨時間推移而變化。在一個實例中,設備Xioo經 配置以根據音頻信號Sio的原始上下文的電平控制所產生上下文信號S50的電平。設備 Xioo的此種實施方案可包括經配置以根據在活動幀期間上下文抑制器110的輸入電平與 輸出電平之間的關係(例如,差別)來計算增益控制信號S90的增益控制信號計算器195 的實施方案。舉例來說,此種增益控制計算器可經配置以根據音頻信號SlO的電平與上下 文受抑制音頻信號S13的電平之間的關係(例如,差別)來計算增益控制信號S90。此種增 益控制計算器可經配置以根據音頻信號SlO的可從信號SlO及S13的活動幀的電平而計算 的SNR來計算增益控制信號S90。此種增益控制信號計算器可經配置以基於隨時間推移而 平滑化(例如,平均化)的輸入電平來計算增益控制信號S90,及/或可經配置以輸出隨時 間推移而平滑化(例如,平均化)的增益控制信號S90。在另一實例中,設備XlOO經配置以根據所要SNR控制所產生上下文信號S50的電 平。可特徵化為上下文經增強音頻信號S15的活動幀中的話音分量(例如,上下文受抑制音 頻信號S13)的電平與所產生上下文信號S50的電平之間的比率的SNR還可稱為「信號上下 文比(signal-to-context ratio)」。所要SNR值可為用戶選擇的,及/或在不同所產生上 下文中不同。舉例來說,不同所產生上下文信號S50可與不同對應所要SNR值相關聯。所 要SNR值的典型範圍為20dB到25dB。在另一實例中,設備XlOO經配置以控制所產生上下 文信號S50(例如,背景信號)的電平為小於上下文受抑制音頻信號S13(例如,前景信號) 的電平。圖IlB展示包括增益控制信號計算器195的實施方案197的上下文處理器102的 實施方案109的框圖。增益控制計算器197經配置及布置以根據㈧所要SNR值與⑶信 號S13與S50的電平之間的比率之間的關係來計算增益控制信號S90。在一個實例中,如 果所述比率小於所要SNR值,則增益控制信號S90的對應狀態致使上下文混合器192以較 高電平混合所產生上下文信號S50 (例如,以在將所產生上下文信號S50相加到上下文受抑 制信號S13之前提高所產生上下文信號S50的電平),且如果所述比率大於所要SNR值,則 增益控制信號S90的對應狀態致使上下文混合器192以較低電平混合所產生上下文信號 S50 (例如,以在將信號S50相加到信號S13之前降低信號S50的電平)。如上文所描述,增益控制信號計算器195經配置以根據一個或一個以上輸入信號 (例如,S10、S13、S50)中的每一者的電平來計算增益控制信號S90的狀態。增益控制信號計算器195可經配置以將輸入信號的電平計算為在一個或一個以上活動幀上進行平均的 信號振幅。或者,增益控制信號計算器195可經配置以將輸入信號的電平計算為在一個或 一個以上活動幀上進行平均的信號能量。通常,幀的能量計算為幀的平方樣本的和。可能 需要配置增益控制信號計算器195以對所計算電平及/或增益控制信號S90中的一者或一 者以上進行濾波(例如,平均化或平滑化)。舉例來說,可能需要配置增益控制信號計算器 195以計算例如SlO或S13的輸入信號的幀能量的運行平均值(例如,通過將一階或更高階 的有限脈衝響應或無限脈衝響應濾波器應用到信號的經計算的幀能量),且使用平均能量 來計算增益控制信號S90。同樣,可能需要配置增益控制信號計算器195以在將增益控制信 號S90輸出到上下文混合器192及/或上下文產生器120之前將此種濾波器應用到增益控 制信號S90。音頻信號SlO的上下文分量的電平可能獨立於話音分量的電平而改變,且在此種 情形下,可能需要對應地改變所產生上下文信號S50的電平。舉例來說,上下文產生器120 可經配置以根據音頻信號SlO的SNR改變所產生上下文信號S50的電平。以此種方式,上 下文產生器120可經配置以控制所產生上下文信號S50的電平從而接近音頻信號SlO中的 原始上下文的電平。為維持獨立於話音分量的上下文分量的錯覺,可能需要即使信號電平改變也要維 持恆定上下文電平。舉例來說,歸因於說話者的嘴對於麥克風的方位的改變或歸因於例如 音量調製或另一表達性效果的說話者語音的改變而可能發生信號電平的改變。在此種情形 下,可能需要所產生上下文信號S50的電平在通信會話(例如,電話呼叫)的持續時間內保 持恆定。如本文描述的設備XlOO的實施方案可包括於經配置用於語音通信或存儲的任何 類型的裝置中。此種裝置的實例可包括(但不限於)以下各物電話、蜂窩式電話、頭戴式 耳機(例如,經配置以經由Bluetooth 無線協議的版本與移動用戶終端全雙工地進行通 信的耳機)、個人數字助理(PDA)、膝上型計算機、語音記錄器、遊戲機、音樂播放器、數字相 機。所述裝置還可配置為用於無線通信的移動用戶終端,以使得如本文所描述的設備XlOO 的實施方案可包括於其內,或可以其它方式經配置以向裝置的發射器或收發器部分提供經 編碼音頻信號S20。用於語音通信的系統(例如用於有線及/或無線電話的系統)通常包括若干發射 器及接收器。發射器及接收器可經集成或以其它方式作為收發器一起實施於共同外殼內。 可能需要將設備XlOO實施為對發射器或收發器的具有足夠可用處理、存儲及可升級性的 升級。舉例來說,可通過將上下文處理器100的元件(例如,在固件更新中)添加到已包括 話音編碼器Xio的實施方案的裝置而實現設備XlOO的實施方案。在一些情形下,可執行此 種升級而不改變通信系統的任何其它部分。舉例來說,可能需要升級通信系統中的發射器 中的一者或一者以上(例如,用於無線蜂窩式電話的系統中的一個或一個以上移動用戶終 端中的每一者的發射器部分)以包括設備Xioo的實施方案,而不對接收器作出任何對應改 變。可能需要以使得所得裝置保持為向後可兼容(例如,以使得裝置保持為能夠執行全部 或大致上全部的不涉及上下文處理器100的使用的其先前操作)的方式執行升級。對於設備XlOO的實施方案用以將所產生上下文信號S50插入於經編碼音頻信號 S20中的情形來說,可能需要說話者(S卩,包括設備XlOO的實施方案的裝置的用戶)能夠監視傳輸。舉例來說,可能需要說話者能夠聽到所產生上下文信號S50及/或上下文經增強 音頻信號S15。此種能力對於所產生上下文信號S50不同於現存上下文的情形來說可為尤 其需要的。因此,包括設備XlOO的實施方案的裝置可經配置以將所產生上下文信號S50及上 下文經增強音頻信號S15中的至少一者反饋到耳機、揚聲器或位於裝置的外殼內的其它音 頻轉變器;到位於裝置的外殼內的音頻輸出插口 ;及/或到位於裝置的外殼內的短程無線 發射器(例如,如符合由藍牙技術聯盟(Bluetooth Special Interest Group)在華盛頓州 (WA)的貝爾維尤(Bellevue)發布的藍牙協議的版本及/或另一個人區域網絡協議的發射 器)。此種裝置可包括經配置及布置以從所產生上下文信號S50或上下文經增強音頻信號 S15產生模擬信號的數/模轉換器(DAC)。此種裝置還可經配置以在將模擬信號應用到插 口及/或轉變器之前對其執行一個或一個以上模擬處理操作(例如,濾波、均等化及/或放 大)。設備XlOO可能(但不必)經配置以包括此種DAC及/或模擬處理路徑。在語音通信的解碼器端處(例如,在接收器處或在檢索後),可能需要以類似於上 文描述的編碼器側技術的方式取代或增強現存上下文。還可能需要實施此種技術而不要求 改變對應發射器或編碼設備。圖12A展示經配置以接收經編碼音頻信號S20且產生對應經解碼音頻信號SllO 的話音解碼器RlO的框圖。語音解碼器RlO包括解碼方案檢測器60、活動幀解碼器70及非 活動幀解碼器80。經編碼音頻信號S20為可由話音編碼器XlO產生的數位訊號。解碼器70 及80可經配置以對應於如上文所描述的話音編碼器XlO的編碼器,以使得活動幀解碼器70 經配置以解碼已由活動幀編碼器30進行編碼的幀,且非活動幀解碼器80經配置以解碼已 由非活動幀編碼器40進行編碼的幀。語音解碼器RlO通常還包括經配置以處理經解碼音 頻信號SllO以減少量化噪聲(例如,通過強調共振峰頻率及/或衰減頻譜谷值)的後濾波 器(postfilter),且還可包括自適應增益控制。包括解碼器RlO的裝置可包括經配置及布 置以從經解碼音頻信號SllO產生模擬信號以供輸出到耳機、揚聲器或其它音頻轉變器及/ 或位於裝置的外殼內的音頻輸出插口的數/模轉換器(DAC)。此種裝置還可經配置以在將 模擬信號應用到插口及/或轉變器之前對其執行一個或一個以上模擬處理操作(例如,濾 波、均等化及/或放大)。解碼方案檢測器60經配置以指示對應於經編碼音頻信號S20的當前幀的解碼方 案。適當的解碼位速率及/或解碼模式可由幀的格式指示。解碼方案檢測器60可經配置以 執行速率檢測或從設備(話音解碼器RlO嵌埋於其內)的另一部分(例如多路復用子層) 接收速率指示。舉例來說,解碼方案檢測器60可經配置以從多路復用子層接收指示位速率 的包類型指示符。或者,解碼方案檢測器60可經配置以從例如幀能量的一個或一個以上參 數確定經編碼幀的位速率。在一些應用中,解碼系統經配置以針對特定位速率僅使用一個 解碼模式,以使得經編碼幀的位速率還指示解碼模式。在其它情形下,經編碼幀可包括例如 一組一個或一個以上位的識別對幀進行編碼所根據的解碼模式的信息。此種信息(還稱為 「解碼索引」)可明確地或隱含地指示解碼模式(例如,通過指示對於其它可能的解碼模式 來說無效的值)。圖12A展示由解碼方案檢測器60產生的解碼方案指示用以控制話音解碼器RlO 的一對選擇器90a及90b以選擇活動幀解碼器70及非活動幀解碼器80中的一者的實例。注意,話音解碼器RlO的軟體或固件實施方案可使用解碼方案指示來引導對幀解碼器中的 一者或另一者的執行的流程,且此種實施方案可能不包括針對選擇器90a及/或選擇器90b 的模擬。圖12B展示支持對以多個解碼方案進行編碼的活動幀的解碼的話音解碼器RlO 的實施方案R20的實例,其特徵可包括於本文描述的其它話音解碼器實施方案中的任一者 中。語音解碼器R20包括解碼方案檢測器60的實施方案62 ;選擇器90a、90b的實施方案 92a、92b ;及活動幀解碼器70的實施方案70a、70b,其經配置以使用不同解碼方案(例如, 全速率CELP及半速率NELP)來解碼經編碼的幀。活動幀解碼器70或非活動幀解碼器80的典型實施方案經配置以從經編碼幀提取 LPC係數值(例如,經由反量化,繼之以經反量化向量向LPC係數值形式的轉換),且使用那 些值來配置合成濾波器。根據來自經編碼幀的其它值及/或基於偽隨機噪聲信號計算或產 生的激勵信號用以激勵合成濾波器以再現對應經解碼幀。注意,兩個或兩個以上的幀解碼器可共享共同結構。舉例來說,解碼器70及80 (或 解碼器70a、70b及80)可共享LPC係數值的計算器,其可能經配置以產生針對活動幀與非 活動幀具有不同階數的結果,但具有分別不同的時間描述計算器。還注意,話音解碼器RlO 的軟體或固件實施方案可使用解碼方案檢測器60的輸出來引導對幀解碼器中的一者或另 一者的執行的流程,且此種實施方案可能不包括針對選擇器90a及/或選擇器90b的模擬。圖13B展示根據一般配置的設備RlOO (還稱為解碼器、解碼設備或用於解碼的設 備)的框圖。設備RlOO經配置以從經解碼音頻信號SllO移除現存上下文且將其取代為可 能類似於或不同於現存上下文的所產生上下文。除話音解碼器RlO的元件之外,設備RlOO 包括經配置及布置以處理音頻信號SllO以產生上下文經增強音頻信號Sl 15的上下文處理 器100的實施方案200。包括設備RlOO的例如蜂窩式電話的通信裝置可經配置以對從有 線、無線或光學傳輸信道(例如,經由一個或一個以上載波的射頻解調製)接收的信號執行 處理操作,例如錯誤校正、冗餘及/或協議(例如,乙太網絡、TCP/IP、CDMA2000)解碼,以獲 得經編碼音頻信號S20。如圖14A中所展示,上下文處理器200可經配置以包括上下文抑制器110的例子 210,上下文產生器120的例子220及上下文混合器190的例子290,其中所述例子根據上 文關於圖3B及圖4B描述的各種實施方案中的任一者進行配置(除上下文抑制器110的使 用來自如上文所描述的多個麥克風的信號的實施方案可能不適合用於設備RlOO中以外)。 舉例來說,上下文處理器200可包括經配置以對音頻信號SllO執行如上文關於噪聲抑制器 10所描述的噪聲抑制操作的冒進實施方案(例如維納(Wiener)濾波操作)以獲得上下文 受抑制音頻信號S113的上下文抑制器110的實施方案。在另一實例中,上下文處理器200 包括上下文抑制器110的實施方案,上下文抑制器110的所述實施方案經配置以根據如上 文所描述的現存上下文(例如,音頻信號SllO的一個或一個以上非活動幀的)的統計學描 述對音頻信號SllO執行頻譜相減操作以獲得上下文受抑制音頻信號S113。另外或在對於 任一此種情形的替代方案中,上下文處理器200可經配置以對音頻信號SllO執行如上文所 描述的中心削波操作。如上文關於上下文抑制器100所描述,可能需要將上下文抑制器200實施為可在 兩個或兩個以上不同操作模式中進行配置(例如,從無上下文抑制到大致上完全上下文抑 制的範圍)。圖14B展示包括經配置以根據處理控制信號S30的例子S130的狀態進行操作
27的上下文抑制器112的例子212及上下文產生器122的例子222的設備RlOO的實施方案 RllO的框圖。上下文產生器220經配置以根據上下文選擇信號S40的例子S140的狀態產生所 產生上下文信號S50的例子S150。控制兩個或兩個以上上下文中的至少一者的選擇的上下 文選擇信號S140的狀態可能是基於一個或一個以上準則,例如與包括設備RlOO的裝置的 物理位置有關的信息(例如,基於GPS及/或上文論述的其它信息)、將不同時間或時間周 期與對應上下文相關聯的時間表、呼叫者的身份(例如,如經由呼叫號碼識別(CNID)進行 確定,還稱為「自動號碼識別」(ANI)或呼叫者ID信令)、用戶選擇的設定或模式(例如商 務模式、舒緩模式、聚會模式),及/或兩個或兩個以上上下文的列表中的一者的用戶選擇 (例如,經由例如菜單的圖形用戶接口)。舉例來說,設備RlOO可經實施以包括如上文所描 述的將此種準則的值與不同上下文相關聯的上下文選擇器330的例子。在另一實例中,設 備RlOO經實施以包括如上文所描述的經配置以基於音頻信號SllO的現存上下文的一個或 一個以上特性(例如,與音頻信號SllO的一個或一個以上非活動幀的一個或一個以上時間 及/或頻率特性有關的信息)產生上下文選擇信號S140的上下文分類器320的例子。上 下文產生器220可根據如上文所描述的上下文產生器120的各種實施方案中的任一者進行 配置。舉例來說,上下文產生器220可經配置以從本地存儲裝置檢索描述所選上下文的參 數值,或從例如伺服器的外部裝置下載所述參數值(例如,經由SIP)。可能需要配置上下 文產生器220以分別使產生上下文選擇信號S50的起始及終止與通信會話(例如,電話呼 叫)的開始及結束同步。處理控制信號S130控制上下文抑制器212的操作以啟用或停用上下文抑制(即, 以輸出具有音頻信號Slio的現存上下文或者取代上下文的音頻信號)。如圖14B中所展 示,處理控制信號S130還可經布置以啟用或停用上下文產生器222。或者,上下文選擇信號 S140可經配置以包括選擇上下文產生器220的空值輸出的狀態,或者上下文混合器290可 經配置以將處理控制信號S130接收為如上文關於上下文混合器190所描述的啟用/停用 控制輸入。處理控制信號S130可經實施以具有一個以上狀態,以使得其可用以改變由上下 文抑制器212執行的抑制的電平。設備RlOO的另外的實施方案可經配置以根據接收器處 周圍聲音的電平控制上下文抑制的電平及/或所產生上下文信號S150的電平。舉例來說, 此種實施方案可經配置以控制音頻信號S115的SNR與周圍聲音的電平成反比關係(例如, 如使用來自包括設備RlOO的裝置的麥克風的信號進行感測)。還明確地指出,當選擇使用 人工上下文時可將非活動幀解碼器80斷電。一般來說,設備RlOO可經配置以通過根據適當解碼方案解碼每一幀、抑制現存上 下文(可能達可變的程度)及根據某一電平添加所產生上下文信號S150而處理活動幀。對 於非活動幀來說,設備RlOO可經實施以解碼每一幀(或每一 SID幀)及添加所產生上下文 信號S150。或者,設備RlOO可經實施以忽略或丟棄非活動幀,且將其取代為所產生上下文 信號S150。舉例來說,圖15展示經配置以在選擇上下文抑制時丟棄非活動幀解碼器80的 輸出的設備R200的實施方案。此實例包括經配置以根據處理控制信號S130的狀態選擇所 產生上下文信號S150及非活動幀解碼器80的輸出中的一者的選擇器250。設備RlOO的另外的實施方案可經配置以使用來自經解碼音頻信號的一個或一個 以上非活動幀的信息來改進由上下文抑制器210應用的用於活動幀中的上下文抑制的噪聲模型。另外或在替代方案中,設備RlOO的所述另外的實施方案可經配置以使用來自經解 碼音頻信號的一個或一個以上非活動幀的信息來控制所產生上下文信號S150的電平(例 如,以控制上下文經增強音頻信號S115的SNR)。設備RlOO還可經實施以使用來自經解 碼音頻信號的非活動幀的上下文信息來補充經解碼音頻信號的一個或一個以上活動幀及/ 或經解碼音頻信號的一個或一個以上其它非活動幀內的現存上下文。舉例來說,此種實施 方案可用以取代已歸因於如發射器處的過度冒進噪聲抑制及/或不足的解碼速率或SID傳 輸速率的因素而丟失的現存上下文。如上所述,設備RlOO可經配置以在產生經編碼音頻信號S20的編碼器不作用及/ 或不改變的情形下執行上下文增強或取代。設備RlOO的此種實施方案可包括於經配置以 在對應發射器(從其處接收信號S20)不作用及/或不改變的情形下執行上下文增強或取 代的接收器內。或者,設備RlOO可經配置以獨立地或根據編碼器控制而下載上下文參數值 (例如,從SIP伺服器),及/或此種接收器可經配置以獨立地或根據發射器控制而下載上 下文參數值(例如,從SIP伺服器)。在所述情形下,SIP伺服器或其它參數值源可經配置 以使得編碼器或發射器的上下文選擇優先於解碼器或接收器的上下文選擇。可能需要根據本文描述的原理(例如,根據設備XlOO及RlOO的實施方案)實施在 上下文增強及/或取代的操作中進行協作的話音編碼器及解碼器。在此種系統內,可將指 示所要上下文的信息傳送到呈若干不同形式中的任一者的解碼器。在第一類實例中,將上 下文信息傳送為描述,所述描述包括一組參數值,例如LSF值及對應能量值序列的向量(例 如,靜默描述符或SID),或例如平均序列及對應組的詳細序列(如圖10的MRA樹實例中所 展示)。一組參數值(例如,向量)可經量化以供傳輸為一個或一個以上碼簿索引。在第二類實例中,將上下文信息作為一個或一個以上上下文識別符(還稱為「上 下文選擇信息」)傳送到解碼器。可將上下文識別符實施為對應於兩個或兩個以上不同音 頻上下文的列表中的特定條目的索引。在所述情形下,加索引列表條目(其可存儲於本地 或存儲於解碼器外部)可包括包括一組參數值的對對應上下文的描述。另外或在一個或一 個以上上下文識別符的替代方案中,音頻上下文選擇信息可包括指示編碼器的物理位置及 /或上下文模式的信息。在這些類別中的任一者中,可直接及/或間接地將上下文信息從編碼器傳送到解 碼器。在直接傳輸中,編碼器將上下文信息在經編碼音頻信號S20內(即,經由相同邏輯信 道及經由與話音分量相同的協議堆棧)及/或經由單獨傳輸信道(例如,可使用不同協議 的數據信道或其它單獨邏輯信道)發送到解碼器。圖16展示經配置以經由不同邏輯信道 (例如,在相同無線信號內或在不同信號內)傳輸所選音頻上下文的話音分量及經編碼(例 如,經量化)參數值的設備XlOO的實施方案X200的框圖。在此特定實例中,設備X200包 括如上文所描述的處理控制信號產生器340的例子。圖16中展示的設備X200的實施方案包括上下文編碼器150。在此實例中,上下文 編碼器150經配置以產生基於上下文描述(例如,一組上下文參數值S70)的經編碼上下文 信號S80。上下文編碼器150可經配置以根據認為適於特定應用的任何解碼方案產生經編 碼上下文信號S80。此種解碼方案可包括例如霍夫曼(Huffman)解碼、算術解碼、範圍編碼 及遊程長度編碼(rim-length-encoding)的一個或一個以上壓縮操作。此種解碼方案可為 有損及/或無損的。此種解碼方案可經配置以產生具有固定長度的結果及/或具有可變長度的結果。此種解碼方案可包括量化上下文描述的至少一部分。上下文編碼器150還可經配置以執行上下文信息的協議編碼(例如,在運輸層及 /或應用層處)。在此種情形下,上下文編碼器150可經配置以執行例如包形成及/或信號 交換的一個或一個以上相關操作。甚至可能需要配置上下文編碼器150的此種實施方案以 發送上下文信息而不執行任何其它編碼操作。圖17展示經配置以將識別或描述所選上下文的信息編碼為經編碼音頻信號S20 的對應於音頻信號SlO的非活動幀的幀周期的設備XlOO的另一實施方案X210的框圖。所 述幀周期在本文還稱為「經編碼音頻信號S20的非活動幀」。在一些情形下,可能在解碼器 處導致延遲,直到已針對上下文產生接收對所選上下文的足夠量的描述。在相關實例中,設備X210經配置以發送對應於本地地存儲於解碼器處及/或從例 如伺服器的另一裝置下載的上下文描述(例如,在呼叫建立期間)的初始上下文識別符,且 還經配置以發送對所述上下文描述的隨後更新(例如,經由經編碼音頻信號S20的非活動 幀)。圖18展示經配置以將音頻上下文選擇信息(例如,所選上下文的識別符)編碼為經 編碼音頻信號S20的非活動幀的設備XlOO的相關實施方案X220的框圖。在此種情形下, 設備X220可經配置以在通信會話的過程期間(甚至從一個幀到下一幀)更新上下文識別 符。圖18中展示的設備X220的實施方案包括上下文編碼器150的實施方案152。上 下文編碼器152經配置以產生基於音頻上下文選擇信息(例如,上下文選擇信號S40)的經 編碼上下文信號S80的例子S82,其可包括一個或一個以上上下文識別符及/或其它例如物 理位置及/或上下文模式的指示的信息。如上文關於上下文編碼器150所描述,上下文編 碼器152可經配置以根據認為適於特定應用及/或可經配置以執行上下文選擇信息的協議 編碼的任何解碼方案產生經編碼上下文信號S82。經配置以將上下文信息編碼為經編碼音頻信號S20的非活動幀的設備XlOO的實 施方案可經配置以編碼每一非活動幀內的此種上下文信息或不連續地編碼此種上下文信 息。在不連續傳輸(DTX)的一個實例中,設備XlOO的此種實施方案經配置以根據規則間隔 (例如每五秒或十秒,或每128或256個幀)將識別或描述所選上下文的信息編碼為經編碼 音頻信號S20的一個或一個以上非活動幀的序列。在不連續傳輸(DTX)的另一實例中,設 備XlOO的此種實施方案經配置以根據例如不同上下文的選擇的某一事件將此種信息編碼 為經編碼音頻信號S20的一個或一個以上非活動幀的序列。設備X210及X220經配置以根據處理控制信號S30的狀態執行現存上下文的編碼 (即,遺留操作)或上下文取代。在這些情形下,經編碼音頻信號S20可包括指示非活動幀 是否包括現存上下文或與取代上下文有關的信息的旗標(例如,可能包括於每一非活動幀 中的一個或一個以上位)。圖19及圖20展示配置為在非活動幀期間不支持現存上下文的 傳輸的對應設備(分別為設備X300及設備X300的實施方案X310)的框圖。在圖19的實 例中,活動幀編碼器30經配置以產生第一經編碼音頻信號S20a,且解碼方案選擇器20經 配置以控制選擇器50b將經編碼上下文信號S80插入於第一經編碼音頻信號S20a的非活 動幀中以產生第二經編碼音頻信號S20b。在圖20的實例中,活動幀編碼器30經配置以產 生第一經編碼音頻信號S20a,且解碼方案選擇器20經配置以控制選擇器50b將經編碼上 下文信號S82插入於第一經編碼音頻信號S20a的非活動幀中以產生第二經編碼音頻信號S20b。在所述實例中,可能需要配置活動幀編碼器30而以包化形式(例如,作為一系列經 編碼幀)產生第一經編碼音頻信號20a。在所述情形下,選擇器50b可經配置以如解碼方案 選擇器20所指示將經編碼上下文信號插入於第一經編碼音頻信號S20a的對應於上下文受 抑制信號的非活動幀的包(例如,經編碼幀)內的適當位置處,或者選擇器50b可經配置以 如解碼方案選擇器20所指示將由上下文編碼器150或152產生的包(例如,經編碼幀)插 入於第一經編碼音頻信號S20a內的適當位置處。如上所述,經編碼上下文信號S80可包括 與經編碼上下文信號S80有關的信息(例如描述所選音頻上下文的一組參數值),且經編碼 上下文信號S82可包括與經編碼上下文信號S80有關的信息(例如識別一組音頻上下文中 的所選一者的上下文識別符)。在間接傳輸中,解碼器不僅經由與經編碼音頻信號S20不同的邏輯信道而且還從 例如伺服器的不同實體接收上下文信息。舉例來說,解碼器可經配置以使用編碼器的識別 符(例如,統一資源識別符(URI)或統一資源定位符(URL) JnRFC 3986中所描述,以www. ietf. org在線可得)、解碼器的識別符(例如,URL)及/或特定通信會話的識別符來請求 來自伺服器的上下文信息。圖21A展示解碼器根據經由協議堆棧P20及經由第一邏輯信道 從編碼器接收的信息而經由協議堆棧PlO (例如,在上下文產生器220及/或上下文解碼器 252內)及經由第二邏輯信道從伺服器下載上下文信息的實例。堆棧PlO及P20可為分離 的或可共享一個或一個以上層(例如,物理層、媒體接入控制層及邏輯鏈路層中的一者或 一者以上)。可使用例如SIP的協議執行可以類似於下載鈴聲或音樂文件或流的方式執行 的上下文信息從伺服器到解碼器的下載。在其它實例中,可通過直接與間接傳輸的某一組合將上下文信息從編碼器傳送到 解碼器。在一個一般實例中,編碼器將上下文信息以一種形式(例如,如音頻上下文選擇 信息)發送到系統內的例如伺服器的另一裝置,且其它裝置將對應上下文信息以另一形式 (例如,作為上下文描述)發送到解碼器。在此種傳送的特定實例中,伺服器經配置以將上 下文信息輸送到解碼器而不接收針對來自解碼器的信息的請求(還稱為「推送」)。舉例來 說,伺服器可經配置以在呼叫建立期間將上下文信息推送到解碼器。圖21B展示伺服器根 據編碼器經由協議堆棧P30(例如,在上下文編碼器152內)及經由第三邏輯信道發送的可 包括解碼器的URL或其它識別符的信息將上下文信息經由第二邏輯信道下載到解碼器的 實例。在此種情形下,可使用例如SIP的協議執行從編碼器到伺服器的傳送及/或從服務 器到解碼器的傳送。此實例還說明經編碼音頻信號S20經由協議堆棧P40及經由第一邏輯 信道從編碼器到解碼器的傳輸。堆棧P30及P40可為分離的,或可共享一個或一個以上層 (例如,物理層、媒體接入控制層及邏輯鏈路層中的一者或一者以上)。如圖21B中所展示的編碼器可經配置以通過在呼叫建立期間將INVITE消息發送 到伺服器而起始SIP會話。在一個此種實例中,編碼器將例如上下文識別符或物理位置(例 如,作為一組GPS坐標)的音頻上下文選擇信息發送到伺服器。編碼器還可將例如解碼器 的URI及/或編碼器的URI的實體識別信息發送到伺服器。如果伺服器支持所選音頻上下 文,則其將ACK消息發送到編碼器,且SIP會話結束。編碼器_解碼器系統可經配置以通過抑制編碼器處的現存上下文或通過抑制解 碼器處的現存上下文而處理活動幀。可通過在編碼器處(而非解碼器處)執行上下文抑制 來實現一個或一個以上潛在優點。舉例來說,活動幀編碼器30可預期實現對上下文受抑制音頻信號比對現存上下文未經抑制的音頻信號的更好的解碼結果。更好的抑制技術也可能 在編碼器處可用,例如使用來自多個麥克風的音頻信號的技術(例如,盲源分離)。還可能 需要說話者能夠聽到與收聽者將聽到的上下文受抑制話音分量相同的上下文受抑制話音 分量,且在編碼器處執行上下文抑制可用以支持此種特徵。當然,在編碼器及解碼器兩者處 實施上下文抑制也是可能的。可能需要在編碼器_解碼器系統內所產生上下文信號S150在編碼器及解碼器兩 者處均可用。舉例來說,可能需要說話者能夠聽到與收聽者將聽到的上下文經增強音頻信 號相同的上下文經增強音頻信號。在此種情形下,對所選上下文的描述可存儲於及/或下 載到編碼器及解碼器兩者。此外,可能需要配置上下文產生器220以確定地產生所產生上 下文信號S150,以使得待在解碼器處執行的上下文產生操作可在編碼器處進行複製。舉例 來說,上下文產生器220可經配置以使用對於編碼器及解碼器兩者均已知的一個或一個以 上值(例如,經編碼音頻信號S20的一個或一個以上值)以計算可用於產生操作中的任何 隨機值或信號(例如用於CTFLP合成的隨機激勵信號)。編碼器-解碼器系統可經配置而以若干不同方式中的任一者處理非活動幀。舉例 來說,編碼器可經配置以將現存上下文包括於經編碼音頻信號S20內。包括現存上下文對 於支持遺留操作可能為需要的。此外,如上文所論述,解碼器可經配置以使用現存上下文來 支持上下文抑制操作。或者,編碼器可經配置以使用經編碼音頻信號S20的非活動幀中的一者或一者以 上來攜載與所選上下文有關的信息(例如一個或一個以上上下文識別符及/或描述)。如 圖19中所展示的設備X300為不傳輸現存上下文的編碼器的一個實例。如上所述,非活動 幀中的上下文識別符的編碼可用以在例如電話呼叫的通信會話期間支持更新所產生的上 下文信號S150。對應解碼器可經配置以快速且甚至可能逐幀地執行此種更新。在另一替代方案中,編碼器可經配置以在非活動幀期間傳輸極少或不傳輸位,其 可允許編碼器針對活動幀使用較高解碼速率而不增加平均位速率。視系統而定,編碼器可 能需要在每一非活動幀期間包括某一最小數目的位以便維持連接。可能需要例如設備XlOO的實施方案(例如,設備X200、X210或X220)或X300的 編碼器發送所選音頻上下文的電平隨時間推移的改變的指示。此種編碼器可經配置以在經 編碼上下文信號S80內及/或經由不同邏輯信道將此種信息發送為參數值(例如,增益參 數值)。在一個實例中,對所選上下文的描述包括描述上下文的頻譜分布的信息,且編碼器 經配置以將與上下文的音頻電平隨時間推移的改變有關的信息發送為單獨時間描述(其 可以與頻譜描述不同的速率進行更新)。在另一實例中,對所選上下文的描述描述上下文在 第一時間標度(例如,在幀或類似長度的其它間隔上)上的頻譜及時間特性兩者,且編碼器 經配置以將與上下文的音頻電平在第二時間標度(例如,例如從幀到幀的較長時間標度) 上的改變有關的信息發送為單獨時間描述。可使用包括針對每一幀的上下文增益值的單獨 時間描述來實施此種實例。在可應用到上文兩個實例中的任一者中的另一實例中,使用不連續傳輸(在經編 碼音頻信號S20的非活動幀內或經由第二邏輯信道)發送對所選上下文的描述的更新,且 還使用不連續傳輸(在經編碼音頻信號S20的非活動幀內,經由第二邏輯信道,或經由另一 邏輯信道)發送對單獨時間描述的更新,兩個描述以不同間隔及/或根據不同事件進行更新。舉例來說,此種編碼器可經配置以比單獨時間描述更不頻繁地更新所選上下文的描述 (例如,每512、1024或2048個幀對每四個、八個或十六個幀)。此種編碼器的另一實例經 配置以根據現存上下文的一個或一個以上頻率特性的改變(及/或根據用戶選擇)而更新 對所選上下文的描述,且經配置以根據現存上下文的電平的改變而更新單獨時間描述。圖22、圖23及圖24說明經配置以執行上下文取代的用於解碼的設備的實例。圖 22展示包括經配置以根據上下文選擇信號S140的狀態產生所產生上下文信號S150的上 下文產生器220的例子的設備R300的框圖。圖23展示包括上下文抑制器210的實施方案 218的設備R300的實施方案R310的框圖。上下文抑制器218經配置以使用來自非活動幀 的現存上下文信息(例如,現存上下文的頻譜分布)來支持上下文抑制操作(例如,頻譜相 減)。圖22及圖23中展示的設備R300及R310的實施方案還包括上下文解碼器252。 上下文解碼器252經配置以執行經編碼上下文信號S80的數據及/或協議解碼(例如,與 上文關於上下文編碼器152描述的編碼操作互補)以產生上下文選擇信號S140。替代地或 另外,設備R300及R310可經實施以包括與如上文所描述的上下文編碼器150互補的上下 文解碼器250,其經配置以基於經編碼上下文信號S80的對應例子產生上下文描述(例如, 一組上下文參數值)。圖24展示包括上下文產生器220的實施方案228的話音解碼器R300的實施方案 R320的框圖。上下文產生器228經配置以使用來自非活動幀的現存上下文信息(例如,與 現存上下文的能量在時域及/或頻域中的分布有關的信息)來支持上下文產生操作。如本文描述的用於編碼的設備(例如,設備XlOO及X300)及用於解碼的設備(例 如,設備R100、R200及R300)的實施方案的各種元件可實施為駐留於(例如)同一晶片上 或晶片組中的兩個或兩個以上晶片中的電子及/或光學裝置,但還可預期沒有此種限制的 其它布置。此種設備的一個或一個以上元件可整個地或部分地實施為經布置以在邏輯元 件(例如,電晶體、門)的一個或一個以上固定或可編程陣列上執行的一個或一個以上指令 集,所述邏輯元件例如微處理器、嵌埋式處理器、IP核心、數位訊號處理器、FPGA (現場可編 程門陣列)、ASSP (專用標準產品)及ASIC (專用集成電路)。此種設備的實施方案的一個或一個以上元件用以執行任務或執行與設備的操作 不直接有關的其它指令集(例如與設備所嵌埋於其中的裝置或系統的另一操作有關的任 務)是可能的。此種設備的實施方案的一個或一個以上元件具有共同結構(例如,用以執 行在不同時間對應於不同元件的代碼部分的處理器,經執行以執行在不同時間對應於不同 元件的任務的指令集,或在不同時間執行不同元件的操作的電子及/或光學裝置的布置) 也是可能的。在一個實例中,上下文抑制器110、上下文產生器120及上下文混合器190實 施為經布置以在同一處理器上執行的指令集。在另一實例中,上下文處理器100及話音編 碼器XlO經實施為經布置以在同一處理器上執行的指令集。在另一實例中,上下文處理器 200及話音解碼器RlO實施為經布置以在同一處理器上執行的指令集。在另一實例中,上下 文處理器100、話音編碼器XlO及話音解碼器RlO實施為經布置以在同一處理器上執行的指 令集。在另一實例中,活動幀編碼器30及非活動幀編碼器40經實施以包括在不同時間執 行的相同指令集。在另一實例中,活動幀解碼器70及非活動幀解碼器80經實施以包括在 不同時間執行的相同指令集。
用於無線通信的裝置(例如蜂窩式電話或具有此種通信能力的其它裝置)可經配 置以包括編碼器(例如,設備XlOO或X300的實施方案)及解碼器(例如,設備R100、R200 或R300的實施方案)兩者。在此種情形下,編碼器及解碼器具有共同結構是可能的。在一 個此種實例中,編碼器及解碼器經實施以包括經布置以在同一處理器上執行的指令集。本文描述的各種編碼器及解碼器的操作還可視作信號處理方法的特定實例。此種 方法可實施為一組任務,其一者或一者以上(可能全部)可由邏輯元件(例如,處理器、微 處理器、微控制器或其它有限狀態機)的一個或一個以上陣列執行。任務中的一者或一者 以上(可能全部)還可實施為可由一個或一個以上邏輯元件陣列執行的代碼(例如,一個 或一個以上指令集),代碼可有形地體現於數據存儲媒體中。圖25A展示根據所揭示配置的處理包括第一音頻上下文的數字音頻信號的方法 AlOO的流程圖。方法AlOO包括任務AllO及A120。基於第一麥克風產生的第一音頻信號, 任務Al 10抑制來自數字音頻信號的第一音頻上下文以獲得上下文受抑制信號。任務A120 將第二音頻上下文與基於上下文受抑制信號的信號進行混合以獲得上下文經增強信號。在 此方法中,數字音頻信號是基於由不同於第一麥克風的第二麥克風產生的第二音頻信號。 舉例來說,可通過如本文描述的設備XlOO或X300的實施方案執行方法A100。圖25B展示根據所揭示配置用於處理包括第一音頻上下文的數字音頻信號的設 備AM100的框圖。設備AM100包括用於執行方法AlOO的各種任務的裝置。設備AM100包 括用於基於由第一麥克風產生的第一音頻信號抑制來自數字音頻信號的第一音頻上下文 以獲得上下文受抑制信號的裝置AM10。設備AM100包括用於將第二音頻上下文與基於上下 文受抑制信號的信號進行混合以獲得上下文經增強信號的裝置AM20。在此設備中,數字音 頻信號是基於由不同於第一麥克風的第二麥克風產生的第二音頻信號。可使用能夠執行所 述任務的任何結構實施設備AM100的各種元件,所述結構包括用於執行本文揭示的所述任 務的結構中的任一者(例如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。 設備AM100的各種元件的實例在本文中揭示於設備XlOO及X300的描述中。圖26A展示根據所揭示配置的根據處理控制信號的狀態處理數字音頻信號的方 法BlOO的流程圖,所述數字音頻信號具有話音分量及上下文分量。方法BlOO包括任務 B110、B120、B130及B140。任務BllO在處理控制信號具有第一狀態時以第一位速率編碼缺 少話音分量的數字音頻信號部分的幀。任務B120在處理控制信號具有不同於第一狀態的 第二狀態時抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號。任務B130在 處理控制信號具有第二狀態時將音頻上下文信號與基於上下文受抑制信號的信號進行混 合以獲得上下文經增強信號。任務B140在處理控制信號具有第二狀態時以第二位速率編 碼缺少話音分量的上下文經增強信號部分的幀,第二位速率高於第一位速率。舉例來說,可 通過如本文描述的設備XlOO的實施方案執行方法B100。圖26B展示根據所揭示配置的用於根據處理控制信號的狀態處理數字音頻信號 的設備BM100的框圖,所述數字音頻信號具有話音分量及上下文分量。設備BM100包括用 於在處理控制信號具有第一狀態時以第一位速率編碼缺少話音分量的數字音頻信號部分 的幀的裝置BM10。設備BM100包括用於在處理控制信號具有不同於第一狀態的第二狀態時 抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號的裝置BM20。設備BM100包 括用於在處理控制信號具有第二狀態時將音頻上下文信號與基於上下文受抑制信號的信號進行混合以獲得上下文經增強信號的裝置BM30。設備BM100包括用於在處理控制信號具 有第二狀態時以第二位速率編碼缺少話音分量的上下文經增強信號部分的幀的裝置BM40, 第二位速率高於第一位速率。可使用能夠執行此類任務的任何結構實施設備BM100的各種 元件,所述結構包括用於執行本文揭示的所述任務的結構中的任一者(例如,一個或一個 以上指令集、一個或一個以上邏輯元件陣列等)。設備BM100的各種元件的實例在本文中揭 示於設備XlOO的描述中。圖27A展示根據所揭示配置的處理基於從第一轉變器接收的信號的數字音頻信 號的方法ClOO的流程圖。方法ClOO包括任務Clio、C120、C130及C140。任務CllO抑制 來自數字音頻信號的第一音頻上下文以獲得上下文受抑制信號。任務C120將第二音頻上 下文與基於上下文受抑制信號的信號進行混合以獲得上下文經增強信號。任務C130將基 於(A)第二音頻上下文與(B)上下文經增強信號中的至少一者的信號轉換為模擬信號。任 務C140從第二轉變器產生基於所述模擬信號的可聽信號。在此方法中,第一轉變器及第二 轉變器兩者位於共同外殼內。舉例來說,可通過如本文描述的設備XlOO或X300的實施方 案執行方法ClOO。圖27B展示根據所揭示配置的用於處理基於從第一轉變器接收的信號的數字音 頻信號的設備CM100的框圖。設備CM100包括用於執行方法ClOO的各種任務的裝置。設備 CM100包括用於抑制來自數字音頻信號的第一音頻上下文以獲得上下文受抑制信號的裝置 CMllO0設備CM100包括用於將第二音頻上下文與基於上下文受抑制信號的信號進行混合 以獲得上下文經增強信號的裝置CM120。設備CM100包括用於將基於(A)第二音頻上下文 與(B)上下文經增強信號中的至少一者的信號轉換為模擬信號的裝置CM130。設備CM100 包括用於從第二轉變器產生基於模擬信號的可聽信號的裝置CM140。在此設備中,第一轉 變器及第二轉變器兩者位於共同外殼內。可使用能夠執行所述任務的任何結構實施設備 CM100的各種元件,所述結構包括用於執行本文揭示的所述任務的結構中的任一者(例如, 一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設備CM100的各種元件的實例 在本文中揭示於設備XlOO及X300的描述中。圖28A展示根據所揭示配置的處理經編碼音頻信號的方法DlOO的流程圖。方法 DlOO包括任務D110、D120及D130。任務DllO根據第一解碼方案解碼經編碼音頻信號的第 一多個經編碼幀以獲得包括話音分量及上下文分量的第一經解碼音頻信號。任務D120根 據第二解碼方案解碼經編碼音頻信號的第二多個經編碼幀以獲得第二經解碼音頻信號。基 於來自第二經解碼音頻信號的信息,任務D130抑制來自基於第一經解碼音頻信號的第三 信號的上下文分量以獲得上下文受抑制信號。舉例來說,可通過如本文描述的設備R100、 R200或R300的實施方案執行方法DlOO。圖28B展示根據所揭示配置的用於處理經編碼音頻信號的設備DM100的框圖。設 備DM100包括用於執行方法DlOO的各種任務的裝置。設備DM100包括用於根據第一解碼 方案解碼經編碼音頻信號的第一多個經編碼幀以獲得包括話音分量及上下文分量的第一 經解碼音頻信號的裝置DMlO。設備DM100包括用於根據第二解碼方案解碼經編碼音頻信號 的第二多個經編碼幀以獲得第二經解碼音頻信號的裝置DM20。設備DM100包括用於基於 來自第二經解碼音頻信號的信息抑制來自基於第一經解碼音頻信號的第三信號的上下文 分量以獲得上下文受抑制信號的裝置DM30。可使用能夠執行所述任務的任何結構實施設備DM100的各種元件,所述結構包括用於執行本文揭示的所述任務的結構中的任一者(例 如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設備DM100的各種元件的 實例在本文中揭示於設備R100、R200及R300的描述中。圖29A展示根據所揭示配置的處理包括話音分量及上下文分量的數字音頻信號 的方法ElOO的流程圖。方法ElOO包括任務E110、E120、E130及E140。任務EllO抑制來自 數字音頻信號的上下文分量以獲得上下文受抑制信號。任務E120編碼基於上下文受抑制 信號的信號以獲得經編碼音頻信號。任務E130選擇多個音頻上下文中的一者。任務E140 將與所選音頻上下文有關的信息插入於基於所述經編碼音頻信號的信號中。舉例來說,可 通過如本文描述的設備XlOO或X300的實施方案執行方法ElOO。圖29B展示根據所揭示配置的用於處理包括話音分量及上下文分量的數字音頻 信號的設備EM100的框圖。設備EM100包括用於執行方法ElOO的各種任務的裝置。設 備EM100包括用於抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 EM10。設備EM100包括用於編碼基於上下文受抑制信號的信號以獲得經編碼音頻信號的裝 置EM20。設備EM100包括用於選擇多個音頻上下文中的一者的裝置EM30。設備EM100包 括用於將與所選音頻上下文有關的信息插入於基於所述經編碼音頻信號的信號中的裝置 EM40。可使用能夠執行所述任務的任何結構實施設備EM100的各種元件,所述結構包括用 於執行本文揭示的所述任務的結構中的任一者(例如,一個或一個以上指令集、一個或一 個以上邏輯元件陣列等)。設備EM100的各種元件的實例在本文中揭示於設備XlOO及X300 的描述中。圖30A展示根據所揭示配置的處理包括話音分量及上下文分量的數字音頻信號 的方法E200的流程圖。方法E200包括任務E110、E120、E150及E160。任務E150將經編 碼音頻信號經由第一邏輯信道發送到第一實體。任務E160向第二實體且經由不同於第一 邏輯信道的第二邏輯信道發送(A)音頻上下文選擇信息及(B)識別第一實體的信息。舉例 來說,可通過如本文描述的設備XlOO或X300的實施方案執行方法E200。圖30B展示根據所揭示配置的用於處理包括話音分量及上下文分量的數字音頻 信號的設備EM200的框圖。設備EM200包括用於執行方法E200的各種任務的裝置。設備 EM200包括如上文所描述的裝置EMlO及EM20。設備EM100包括用於將編碼音頻信號經由 第一邏輯信道發送到第一實體的裝置EM50。設備EM100包括用於向第二實體且經由不同 於第一邏輯信道的第二邏輯信道發送(A)音頻上下文選擇信息及(B)識別第一實體的信息 的裝置EM60。可使用能夠執行所述任務的任何結構實施設備EM200的各種元件,所述結構 包括用於執行本文揭示的所述任務的結構中的任一者(例如,一個或一個以上指令集、一 個或一個以上邏輯元件陣列等)。設備EM200的各種元件的實例在本文中揭示於設備XlOO 及X300的描述中。圖31A展示根據所揭示配置的處理經編碼音頻信號的方法FlOO的流程圖。方法 FlOO包括任務F110、F120及F130。在移動用戶終端內,任務FllO解碼經編碼音頻信號以 獲得經解碼音頻信號。在移動用戶終端內,任務F120產生音頻上下文信號。在移動用戶終 端內,任務F130將基於音頻上下文信號的信號與基於經解碼音頻信號的信號進行混合。舉 例來說,可通過如本文描述的設備R100、R200或R300的實施方案執行方法F100。圖31B展示根據所揭示配置的用於處理經編碼音頻信號且位於移動用戶終端內的設備FM100的框圖。設備FM100包括用於執行方法FlOO的各種任務的裝置。設備FM100 包括用於解碼經編碼音頻信號以獲得經解碼音頻信號的裝置FM10。設備FM100包括用於產 生音頻上下文信號的裝置FM20。設備FM100包括用於將基於音頻上下文信號的信號與基於 經解碼音頻信號的信號進行混合的裝置FM30。可使用能夠執行所述任務的任何結構實施設 備FM100的各種元件,所述結構包括用於執行本文揭示的所述任務的結構中的任一者(例 如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設備FM100的各種元件的 實例在本文中揭示於設備R100、R200及R300的描述中。圖32A展示根據所揭示配置的處理包括話音分量及上下文分量的數字音頻信號 的方法GlOO的流程圖。方法GlOO包括任務G110、G120及G130。任務GlOO抑制來自數字音 頻信號的上下文分量以獲得上下文受抑制信號。任務G120產生基於第一濾波器及第一多 個序列的音頻上下文信號,所述第一多個序列中的每一者具有不同時間解析度。任務G120 包括將第一濾波器應用到第一多個序列中的每一者。任務G130將基於所產生音頻上下文 信號的第一信號與基於上下文受抑制信號的第二信號進行混合以獲得上下文經增強信號。 舉例來說,可通過如本文描述的設備X100、X300、R100、R200或R300的實施方案執行方法 G100。圖32B展示根據所揭示配置的用於處理包括話音分量及上下文分量的數字音頻 信號的設備GM100的框圖。設備GM100包括用於執行方法GlOO的各種任務的裝置。設 備GM100包括用於抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 GM10。設備GM100包括用於產生基於第一濾波器及第一多個序列的音頻上下文信號的裝置 GM20,所述第一多個序列中的每一者具有不同時間解析度。裝置GM20包括用於將第一濾波 器應用到第一多個序列中的每一者的裝置。設備GM100包括用於將基於所產生音頻上下文 信號的第一信號與基於上下文受抑制信號的第二信號進行混合以獲得上下文經增強信號 的裝置GM30。可使用能夠執行所述任務的任何結構實施設備GM100的各種元件,所述結構 包括用於執行本文揭示的所述任務的結構中的任一者(例如,一個或一個以上指令集、一 個或一個以上邏輯元件陣列等)。設備GM100的各種元件的實例在本文中揭示於設備X100、 X300、R100、R200 及 R300 的描述中。圖33A展示根據所揭示配置的處理包括話音分量及上下文分量的數字音頻信號 的方法HlOO的流程圖。方法HlOO包括任務H110、H120、H130、H140及H150。任務HllO抑 制來自數字音頻信號的上下文分量以獲得上下文受抑制信號。任務H120產生音頻上下文 信號。任務H130將基於所產生音頻上下文信號的第一信號與基於上下文受抑制信號的第 二信號進行混合以獲得上下文經增強信號。任務H140計算基於數字音頻信號的第三信號 的電平。任務H120及H130中的至少一者包括基於第三信號的所計算電平控制第一信號的 電平。舉例來說,可通過如本文描述的設備X100、X300、R100、R200或R300的實施方案執 行方法HlOO。圖33B展示根據所揭示配置的用於處理包括話音分量及上下文分量的數字音頻 信號的設備HM100的框圖。設備HM100包括用於執行方法HlOO的各種任務的裝置。設 備HM100包括用於抑制來自數字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 HM10。設備HM100包括用於產生音頻上下文信號的裝置HM20。設備HM100包括用於將基於 所產生音頻上下文信號的第一信號與基於上下文受抑制信號的第二信號進行混合以獲得上下文經增強信號的裝置HM30。設備HM100包括用於計算基於數字音頻信號的第三信號的 電平的裝置HM40。裝置HM20及HM30中的至少一者包括用於基於第三信號的所計算電平控 制第一信號的電平的裝置。可使用能夠執行所述任務的任何結構實施設備HM100的各種元 件,所述結構包括用於執行本文揭示的所述任務的結構中的任一者(例如,一個或一個以 上指令集、一個或一個以上邏輯元件陣列等)。設備HM100的各種元件的實例在本文中揭示 於設備X100、X300、R100、R200及R300的描述中。提供所描述配置的前文陳述以使得任何所屬領域的技術人員能夠製造或使用本 文揭示的方法及其它結構。本文展示且描述的流程圖、框圖及其它結構僅為實例,且這些結 構的其它變體也在本發明的範圍內。對這些配置的各種修改是可能的,且還可將本文呈現 的一般原理應用到其它配置。舉例來說,強調本發明的範圍不限於所說明的配置。而是, 明確地預期且特此揭示,對於如本文描述的不同特定配置的特徵彼此不矛盾的任何情形來 說,可組合所述特徵以產生包括於本發明的範圍內的其它配置。舉例來說,可組合上下文抑 制、上下文產生及上下文混合的各種配置中的任一者,只要此種組合與對本文中那些元件 的描述不矛盾即可。還明確地預期且特此揭示,在連接描述為在設備的兩個或兩個以上元 件之間的情況下,可能存在一個或一個以上介入元件(例如濾波器),且在連接描述為在方 法的兩個或兩個以上任務之間的情況下,可能存在一個或一個以上介入任務或操作(例如 濾波操作)。可與如本文描述的編碼器及解碼器一起使用或適合於與所述編碼器及解碼器一 起使用的編解碼器的實例包括如描述於上文提及的3GPP2文件C. S0014-C中的經增強可 變速率編解碼器(EVRC);如描述於ETSI文件TS 126 092 V6. 0. 0 (第6章,2004年12月) 中的自適應多速率(AMR)話音編解碼器;及如描述於ETSI文件TS 126 192 V6. 0. 0.(第6 章,2004年12月)中的AMR寬帶話音編解碼器。可與如本文描述的編碼器及解碼器一起使 用的無線電協議的實例包括臨時標準95 (IS-95)及CDMA2000 (如由電信產業協會((TIA), 維吉尼亞州,阿靈頓(Arlington, VA))發布的規範中所描述)、AMR(如ETSI文件TS 26. 101 中所描述)、GSM(全球移動通信系統,如ETSI發布的規範中所描述)、UMTS (全球移動電信 系統,如ETSI發布的規範中所描述)及W-CDMA(寬帶碼分多址,如由國際電信聯盟發布的 規範中所描述)。本文描述的配置可部分或整體地實施為硬連線電路、製造於專用集成電路中的電 路配置,或加載於非易失性存儲裝置中的固件程序或作為機器可讀代碼從計算機可讀媒體 加載或加載於計算機可讀媒體中的軟體程序,此種代碼為可由例如微處理器或其它數字信 號處理單元的邏輯元件的陣列執行的指令。計算機可讀媒體可為例如半導體存儲器(其 可包括(但不限於)動態或靜態RAM(隨機存取存儲器)、R0M(只讀存儲器)及/或快閃 RAM)或鐵電存儲器、磁電阻存儲器、雙向存儲器、聚合物存儲器或相變存儲器的存儲元件的 陣列;例如磁碟或光碟的碟片媒體;或用於數據存儲的任何其它計算機可讀媒體。術語「軟 件」應理解為包括原始碼、彙編語言代碼、機器代碼、二進位代碼、固件、宏代碼、微代碼、可 由邏輯元件的陣列執行的任何一個或一個以上指令集或序列,及所述實例的任何組合。本文揭示的方法中的每一者還可有形地體現為(舉例來說,在上文列舉的一個或 一個以上計算機可讀媒體中)可由包括邏輯元件的陣列的機器(例如,處理器、微處理器、 微控制器或其它有限狀態機)讀取及/或執行的一個或一個以上指令集。因此,不希望本
38發明限於上文展示的配置,而應賦予其與本文中以任何方式揭示的原理及新穎特徵(包括 於形成原始揭示內容的一部分的所申請的附加權利要求書中)相一致的最廣泛範圍。
權利要求
一種處理數字音頻信號的方法,所述數字音頻信號包括話音分量及上下文分量,所述方法包含抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號;產生音頻上下文信號;將基於所述所產生音頻上下文信號的第一信號與基於所述上下文受抑制信號的第二信號進行混合以獲得上下文經增強信號;以及計算基於所述數字音頻信號的第三信號的電平,其中所述產生及所述混合中的至少一者包括基於所述第三信號的所述所計算電平控制所述第一信號的電平。
2.根據權利要求1所述的處理數字音頻信號的方法,其中所述第三信號包含一系列 幀,且其中所述第三信號的所述所計算電平是基於所述第三信號的在至少一個幀上的平均能量°
3.根據權利要求1所述的處理數字音頻信號的方法,其中所述第三信號是基於所述數 字音頻信號的一系列活動幀,且其中所述方法包含計算基於所述數字音頻信號的一系列非活動幀的第四信號的電平,且其中所述控制所述第一信號的電平是基於所述第三與第四信號的所述所計算電平之 間的關係。
4.根據權利要求1所述的處理數字音頻信號的方法,其中所述產生所述音頻上下文信 號是基於多個係數,且其中所述控制所述第一信號的電平包括基於所述第三信號的所述所計算電平按比例 縮放所述多個係數中的至少一者。
5 根據權利要求1所述的處理數字音頻信號的方法,其中所述抑制來自所述數字音頻 信號的所述上下文分量是基於來自位於共同外殼內的兩個不同麥克風的信息。
6.根據權利要求1所述的處理數字音頻信號的方法,其中所述對所述第一信號與所述 第二信號進行混合包含將所述第一與第二信號相加以獲得所述上下文經增強信號。
7.根據權利要求1所述的處理數字音頻信號的方法,其中所述方法包含對基於所述上 下文經增強信號的第四信號進行編碼以獲得經編碼音頻信號,其中所述經編碼音頻信號包含一系列幀,所述系列幀中的每一者包括描述激勵信號的 fn息ο
8.根據權利要求1所述的方法,其根據處理控制信號的狀態處理數字音頻信號,所述 數字音頻信號具有話音分量及上下文分量,所述方法進一步包含當所述處理控制信號具有第一狀態時,以第一位速率對缺少所述話音分量的所述數字 音頻信號的一部分的幀進行編碼;且當所述處理控制信號具有不同於所述第一狀態的第二狀態時,(A)抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號;(B)將音頻上下文信號與基於所述上下文受抑制信號的信號進行混合以獲得上下文經 增強信號;以及(C)以高於所述第一位速率的第二位速率對缺少所述話音分量的所述上下文經增強信 號的一部分的幀進行編碼。
9.根據權利要求8所述的處理數字音頻信號的方法,其中所述處理控制信號的所述狀 態是基於與執行所述方法所在的物理位置有關的信息。
10.根據權利要求8所述的處理數字音頻信號的方法,其中所述第一位速率是八分之 一速率。
11.一種用於處理數字音頻信號的設備,所述數字音頻信號包括話音分量及上下文分 量,所述設備包含上下文抑制器,其經配置以抑制來自所述數字音頻信號的所述上下文分量以獲得上下 文受抑制信號;上下文產生器,其經配置以產生音頻上下文信號;上下文混合器,其經配置以將基於所述音頻上下文信號的第一信號與基於所述上下文 受抑制信號的第二信號進行混合以產生上下文經增強信號;以及增益控制信號計算器,其經配置以計算基於所述數字音頻信號的第三信號的電平,其中所述上下文產生器及所述上下文混合器中的至少一者經配置以基於所述第三信 號的所述所計算電平控制所述第一信號的電平。
12.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述第三信號包含一 系列幀,且其中所述第三信號的所述所計算電平是基於所述第三信號的在至少一個幀上的平均能量°
13.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述第三信號是基於 所述數字音頻信號的一系列活動幀,且其中所述增益控制信號計算器經配置以計算基於所述數字音頻信號的一系列非活動 幀的第四信號的電平,且其中所述上下文產生器及所述上下文混合器中的所述至少一者經配置以基於所述第 三與第四信號的所述所計算電平之間的關係來控制所述第一信號的電平。
14.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述上下文產生器經 配置以基於多個係數產生所述音頻上下文信號,且其中所述上下文產生器經配置以通過基於所述第三信號的所述所計算電平按比例縮 放所述多個係數中的至少一者來控制所述第一信號的電平。
15.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述上下文抑制器經 配置以基於來自位於共同外殼內的兩個不同麥克風的信息來抑制來自所述數字音頻信號 的所述上下文分量。
16.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述上下文混合器經 配置以將所述第一與第二信號相加以產生所述上下文經增強信號。
17.根據權利要求11所述的用於處理數字音頻信號的設備,其中所述設備包含經配置 以對基於所述上下文經增強信號的第四信號進行編碼以獲得經編碼音頻信號的編碼器,其中所述經編碼音頻信號包含一系列幀,所述系列幀中的每一者包括描述激勵信號的 fn息o
18.根據權利要求11所述的設備,其用於根據處理控制信號的狀態處理數字音頻信 號,所述數字音頻信號具有話音分量及上下文分量,所述設備進一步包含第一幀編碼器,其經配置以在所述處理控制信號具有第一狀態時以第一位速率對缺少 所述話音分量的所述數字音頻信號的一部分的幀進行編碼;上下文抑制器,其經配置以在所述處理控制信號具有不同於所述第一狀態的第二狀態 時抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號;上下文混合器,其經配置以在所述處理控制信號具有所述第二狀態時將音頻上下文信 號與基於所述上下文受抑制信號的信號進行混合以獲得上下文經增強信號;以及第二幀編碼器,其經配置以在所述處理控制信號具有所述第二狀態時以第二位速率對 缺少所述話音分量的所述上下文經增強信號的一部分的幀進行編碼,所述第二位速率高於 所述第一位速率。
19.根據權利要求18所述的用於處理數字音頻信號的設備,其中所述處理控制信號的 所述狀態是基於與所述設備的物理位置有關的信息。
20.根據權利要求18所述的用於處理數字音頻信號的設備,其中所述第一位速率是八 分之一速率。
21.一種用於處理數字音頻信號的設備,所述數字音頻信號包括話音分量及上下文分 量,所述設備包含用於抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號的裝置;用於產生音頻上下文信號的裝置;用於將基於所述所產生音頻上下文信號的第一信號與基於所述上下文受抑制信號的 第二信號進行混合以獲得上下文經增強信號的裝置;以及用於計算基於所述數字音頻信號的第三信號的電平的裝置,其中所述用於產生的裝置及所述用於混合的裝置中的至少一者包括用於基於所述第 三信號的所述所計算電平控制所述第一信號的電平的裝置。
22.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述第三信號包含一 系列幀,且其中所述第三信號的所述所計算電平是基於所述第三信號的在至少一個幀上的平均能量°
23.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述第三信號是基於 所述數字音頻信號的一系列活動幀,且其中所述用於計算的裝置經配置以計算基於所述數字音頻信號的一系列非活動幀的 第四信號的電平,且其中所述用於產生的裝置及所述用於混合的裝置中的所述至少一者經配置以基於所 述第三與第四信號的所述所計算電平之間的關係來控制所述第一信號的電平。
24.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述用於產生的裝置 經配置以基於多個係數產生所述音頻上下文信號,且其中所述用於產生的裝置包括經配置以通過基於所述第三信號的所述所計算電平按 比例縮放所述多個係數中的至少一者來控制所述第一信號的電平的所述用於控制的裝置。
25.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述用於抑制的裝置 經配置以基於來自位於共同外殼內的兩個不同麥克風的信息來抑制來自所述數字音頻信 號的所述上下文分量。
26.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述用於混合的裝置 經配置以將所述第一與第二信號相加以獲得所述上下文經增強信號。
27.根據權利要求21所述的用於處理數字音頻信號的設備,其中所述設備包含用於對 基於所述上下文經增強信號的第四信號進行編碼以獲得經編碼音頻信號的裝置,其中所述經編碼音頻信號包含一系列幀,所述系列幀中的每一者包括描述激勵信號的 fn息o
28.根據權利要求21所述的設備,其用於根據處理控制信號的狀態處理數字音頻信 號,所述數字音頻信號具有話音分量及上下文分量,所述設備進一步包含用於在所述處理控制信號具有第一狀態時以第一位速率對缺少所述話音分量的所述 數字音頻信號的一部分的幀進行編碼的裝置;用於在所述處理控制信號具有不同於所述第一狀態的第二狀態時抑制來自所述數字 音頻信號的所述上下文分量以獲得上下文受抑制信號的裝置;用於在所述處理控制信號具有所述第二狀態時將音頻上下文信號與基於所述上下文 受抑制信號的信號進行混合以獲得上下文經增強信號的裝置;以及用於在所述處理控制信號具有所述第二狀態時以第二位速率對缺少所述話音分量的 所述上下文經增強信號的一部分的幀進行編碼的裝置,所述第二位速率高於所述第一位速 率。
29.根據權利要求28所述的用於處理數字音頻信號的設備,其中所述處理控制信號的 所述狀態是基於與所述設備的物理位置有關的信息。
30.根據權利要求28所述的用於處理數字音頻信號的設備,其中所述第一位速率是八 分之一速率。
31.一種計算機可讀媒體,其包含用於處理數字音頻信號的指令,所述數字音頻信號包 括話音分量及上下文分量,當由處理器執行時所述指令致使所述處理器抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號;產生音頻上下文信號;將基於所述所產生音頻上下文信號的第一信號與基於所述上下文受抑制信號的第二 信號進行混合以獲得上下文經增強信號;以及計算基於所述數字音頻信號的第三信號的電平,其中(A)當由處理器執行時致使所述處理器進行產生的所述指令與(B)當由處理器執 行時致使所述處理器進行混合的所述指令中的至少一者包括當由處理器執行時致使所述 處理器基於所述第三信號的所述所計算電平來控制所述第一信號的電平的指令。
32.根據權利要求31所述的計算機可讀媒體,其中所述第三信號包含一系列幀,且其中所述第三信號的所述所計算電平是基於所述第三信號的在至少一個幀上的平均能量°
33.根據權利要求31所述的計算機可讀媒體,其中所述第三信號是基於所述數字音頻 信號的一系列活動幀,且其中所述媒體包含當由處理器執行時致使所述處理器計算基於所述數字音頻信號的 一系列非活動幀的第四信號的電平的指令,且其中當由處理器執行時致使所述處理器控制所述第一信號的電平的所述指令經配置 以致使所述處理器基於所述第三與第四信號的所述所計算電平之間的關係來控制所述電平。
34.根據權利要求31所述的計算機可讀媒體,其中當由處理器執行時致使所述處理器 產生所述音頻上下文信號的所述指令經配置以致使所述處理器基於多個係數產生所述音 頻上下文信號,且其中當由處理器執行時致使所述處理器控制所述第一信號的電平的所述指令經配置 以致使所述處理器通過基於所述第三信號的所述所計算電平按比例縮放所述多個係數中 的至少一者來控制所述電平。
35.根據權利要求31所述的計算機可讀媒體,其中當由處理器執行時致使所述處理器 抑制所述上下文分量的所述指令經配置以致使所述處理器基於來自位於共同外殼內的兩 個不同麥克風的信息來抑制所述上下文分量。
36.根據權利要求31所述的計算機可讀媒體,其中當由處理器執行時致使所述處理器 將所述第一信號與所述第二信號進行混合的所述指令經配置以致使所述處理器將所述第 一與第二信號相加以獲得所述上下文經增強信號。
37.根據權利要求31所述的計算機可讀媒體,其中所述媒體包含當由處理器執行時致 使所述處理器對基於所述上下文經增強信號的第四信號進行編碼以獲得經編碼音頻信號 的指令,其中所述經編碼音頻信號包含一系列幀,所述系列幀中的每一者包括描述激勵信號的 fn息o
38.根據權利要求31所述的計算機可讀媒體,其包含用於根據處理控制信號的狀態處 理數字音頻信號的指令,所述數字音頻信號具有話音分量及上下文分量,當由處理器執行 時所述指令致使所述處理器在所述處理控制信號具有第一狀態時以第一位速率對缺少所述話音分量的所述數字 音頻信號的一部分的幀進行編碼;以及在所述處理控制信號具有不同於所述第一狀態的第二狀態時,(A)抑制來自所述數字音頻信號的所述上下文分量以獲得上下文受抑制信號;(B)將音頻上下文信號與基於所述上下文受抑制信號的信號進行混合以獲得上下文經 增強信號;以及(C)以高於所述第一位速率的第二位速率對缺少所述話音分量的所述上下文經增強信 號的一部分的幀進行編碼。
39.根據權利要求38所述的計算機可讀媒體,其中所述處理控制信號的所述狀態是基 於與所述處理器的物理位置有關的信息。
40.根據權利要求38所述的計算機可讀媒體,其中所述第一位速率是八分之一速率。
全文摘要
本發明揭示的配置包括可應用於語音通信及/或存儲應用中以移除、增強及/或取代現存上下文的系統、方法及設備。
文檔編號G10L21/02GK101896969SQ200880119860
公開日2010年11月24日 申請日期2008年9月30日 優先權日2008年1月28日
發明者哈立德·希勒米·埃爾-馬勒, 埃迪·L·T·喬伊, 納根德拉·納加拉賈 申請人:高通股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀