新四季網

用於加強可懂度的系統、方法、設備和電腦程式產品的製作方法

2023-06-17 12:11:11

專利名稱:用於加強可懂度的系統、方法、設備和電腦程式產品的製作方法
技術領域:
本發明涉及語音處理。
背景技術:
聲環境常為有噪聲的,使得難以聽到所要信息信號。可將噪聲定義為幹擾所關注 的信號或使所關注的信號降級的所有信號的組合。此噪聲傾向於屏蔽所要的再生音頻信 號,例如電話會談中的遠端信號。舉例來說,某人可能希望使用話音通信信道與另一人通 信。所述信道可(例如)由移動無線手持機或頭戴式耳機、對講機、雙向無線電、車載設備 或另一通信裝置提供。聲環境可具有與正由通信裝置再生的遠端信號競爭的許多不可控制 的噪聲源。此噪聲可造成令人不滿意的通信體驗。除非可將遠端信號與背景噪聲區分開, 否則可能難以對其進行可靠且有效率的使用。

發明內容
一種根據通用配置的處理再生音頻信號的方法包括對所述再生音頻信號進行濾 波以獲得第一多個時域子帶信號;和基於來自所述第一多個時域子帶信號的信息計算多個 第一子帶功率估計。此方法包括對多通道所感測音頻信號執行空間選擇性處理操作以產 生源信號和噪聲參考;對所述噪聲參考進行濾波以獲得第二多個時域子帶信號;和基於來 自所述第二多個時域子帶信號的信息計算多個第二子帶功率估計。此方法包括基於來自所 述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率估計的信息使所述再 生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一個其它頻率子帶提升。一種根據通用配置的處理再生音頻信號的方法包括對多通道所感測音頻信號執 行空間選擇性處理操作以產生源信號和噪聲參考;和計算對所述再生音頻信號的多個子帶 中的每一者的第一子帶功率估計。此方法包括計算對所述噪聲參考的多個子帶中的每一 者的第一噪聲子帶功率估計;和計算對基於來自所述多通道所感測音頻信號的信息的第二 噪聲參考的多個子帶中的每一者的第二噪聲子帶功率估計。此方法包括針對所述再生音頻 信號的所述多個子帶中的每一者計算基於所述對應的第一和第二噪聲子帶功率估計中的 最大者的第二子帶功率估計。此方法包括基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率估計的信息使所述再生音頻信號的至少一個頻率子帶相對 於所述再生音頻信號的至少一個其它頻率子帶提升。—種根據通用配置的用於處理再生音頻信號的設備包括第一子帶信號產生器, 其經配置以對所述再生音頻信號進行濾波以獲得第一多個時域子帶信號;和第一子帶功率 估計計算器,其經配置以基於來自所述第一多個時域子帶信號的信息計算多個第一子帶功 率估計。此設備包括空間選擇性處理濾波器,其經配置以對多通道所感測音頻信號執行空 間選擇性處理操作以產生源信號和噪聲參考;和第二子帶信號產生器,其經配置以對噪聲 參考進行濾波以獲得第二多個時域子帶信號。此設備包括第二子帶功率估計計算器,其經 配置以基於來自所述第二多個時域子帶信號的信息計算多個第二子帶功率估計;和子帶濾 波器陣列,其經配置以基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第 二子帶功率估計的信息使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信 號的至少一個其它頻率子帶提升。一種根據通用配置的計算機可讀媒體,其包括在由處理器執行時使所述處理器執 行處理再生音頻信號的方法的指令。這些指令包括在由處理器執行時使所述處理器進行以 下操作的指令對所述再生音頻信號進行濾波以獲得第一多個時域子帶信號;和基於來自 所述第一多個時域子帶信號的信息計算多個第一子帶功率估計。所述指令還包括在由處理 器執行時使所述處理器進行以下操作的指令對多通道所感測音頻信號執行空間選擇性處 理操作以產生源信號和噪聲參考;和對所述噪聲參考進行濾波以獲得第二多個時域子帶信 號。所述指令還包括在由處理器執行時使所述處理器進行以下操作的指令基於來自所述 第二多個時域子帶信號的信息計算多個第二子帶功率估計;和基於來自所述多個第一子帶 功率估計的信息且基於來自所述多個第二子帶功率估計的信息使所述再生音頻信號的至 少一個頻率子帶相對於所述再生音頻信號的至少一個其它頻率子帶提升。一種根據通用配置的用於處理再生音頻信號的設備,其包括用於對多通道所感測 音頻信號執行方向性處理操作以產生源信號和噪聲參考的裝置。此設備還包括用於均衡所 述再生音頻信號以產生經均衡的音頻信號的裝置。在此設備中,所述用於均衡的裝置經配 置以基於來自所述噪聲參考的信息使所述再生音頻信號的至少一個頻率子帶相對於所述 再生音頻信號的至少一個其它頻率子帶提升。



圖8展示頭戴式耳機的不同操作配置的範圍的圖。圖9展示免提車載設備的圖。圖IOA到圖IOC展示媒體播放裝置的實例。圖11展示空間選擇性性處理(SSP)濾波器SSlO的一個實例的波束圖。圖12A展示SSP濾波器SSlO的實施方案SS20的框圖。圖12B展示設備AlOO的實施方案A105的框圖。圖12C展示SSP濾波器SSlO的實施方案SSllO的框圖。圖12D展示SSP濾波器SS20和SSllO的實施方案SS120的框圖。圖13展示設備AlOO的實施方案AllO的框圖。圖14展示音頻預處理器APlO的實施方案AP20的框圖。圖15A展示回音消除器EClO的實施方案EC12的框圖。圖15B展示回音消除器EC20a的實施方案EC22a的框圖。圖16A展示包括設備AllO的例子的通信裝置DlOO的框圖。圖16B展示通信裝置DlOO的實施方案D200的框圖。圖17展示均衡器EQlO的實施方案EQ20的框圖。圖18A展示子帶信號產生器SG200的框圖。圖18B展示子帶信號產生器SG300的框圖。圖18C展示子帶功率估計計算器ECllO的框圖。圖18D展示子帶功率估計計算器ECl20的框圖。圖19包括指示一組七個巴克標度子帶的邊緣的一行點。圖20展示子帶濾波器陣列SG30的實施方案SG32的框圖。圖21A說明通用無限脈衝響應(IIR)濾波器實施方案的轉置直接形式II。圖21B說明UR濾波器的雙二階實施方案的轉置直接形式II結構。圖22展示IIR濾波器的雙二階實施方案的一個實例的幅度和相位響應曲線。圖23展示一連串七個雙二階濾波器的幅度和相位響應。圖24A展示子帶增益因子計算器GC100的實施方案GC200的框圖。圖24B展示子帶增益因子計算器GC100的實施方案GC300的框圖。圖25A展示偽碼列表。圖25B展示圖25A的偽碼列表的修改。圖26A和圖26B分別展示圖25A和圖25B的偽碼列表的修改。圖27展示子帶濾波器陣列FA100的包括並聯布置的一組帶通濾波器的實施方案 FAllO的框圖。圖28A展示子帶濾波器陣列FA100的其中帶通濾波器串聯布置的實施方案FA120 的框圖。圖^B展示IIR濾波器的雙二階實施方案的另一實例。圖四展示設備AlOO的實施方案A120的框圖。圖30A和圖30B分別展示圖^A和圖26B的偽碼列表的修改。圖31A和圖31B分別展示圖^A和圖^B的偽碼列表的其它修改。圖32展示設備AlOO的實施方案A130的框圖。
圖33展示均衡器EQ20的包括峰值限制器LlO的實施方案EQ40的框圖。圖34展示設備AlOO的實施方案A140的框圖。圖35A展示描述峰值限制操作的一個實例的偽碼列表。圖35B展示圖35A的偽碼列表的另一型式。圖36展示設備AlOO的包括分離評估器EVlO的實施方案A200的框圖。圖37展示設備A200的實施方案A210的框圖。圖38展示均衡器EQ100 (和均衡器EQ20)的實施方案EQllO的框圖。圖39展示均衡器EQ100 (和均衡器EQ20)的實施方案EQ120的框圖。圖40展示均衡器EQ100 (和均衡器EQ20)的實施方案EQ130的框圖。圖41A展示子帶信號產生器EC210的框圖。圖41B展示子帶信號產生器EC220的框圖。圖42展示均衡器EQ130的實施方案EQ140的框圖。圖43A展示均衡器EQ20的實施方案EQ50的框圖。圖4 展示均衡器EQ20的實施方案EQMO的框圖。圖43C展示設備AlOO的實施方案A250的框圖。圖43D展示均衡器EQMO的實施方案EQ250的框圖。圖44展示包括話音活動檢測器V20的設備A200的實施方案A220。圖45展示設備AlOO的實施方案A300的框圖。圖46展示設備A300的實施方案A310的框圖。圖47展示設備A310的實施方案A320的框圖。圖48展示設備A310的實施方案A330的框圖。圖49展示設備AlOO的實施方案A400的框圖。圖50展示設計方法MlO的流程圖。圖51展示經配置用於記錄訓練數據的消聲腔室的實例。圖52A展示自適應濾波器結構FSlO的雙通道實例的框圖。圖52B展示濾波器結構FSlO的實施方案FS20的框圖。圖53說明無線電話系統。圖M說明經配置以支持包交換數據通信的無線電話系統。圖55展示根據一配置的方法MllO的流程圖。圖56展示根據一配置的方法M120的流程圖。圖57展示根據一配置的方法M210的流程圖。圖58展示根據一配置的方法M220的流程圖。圖59A展示根據通用配置的方法M300的流程圖。圖59B展示任務T820的實施方案T822的流程圖。圖60A展示任務T840的實施方案T842的流程圖。圖60B展示任務T840的實施方案T844的流程圖。圖60C展示任務T820的實施方案T8M的流程圖。圖60D展示方法M300的實施方案M310的流程圖。圖61展示根據一配置的方法M400的流程圖。12
圖62A展示根據通用配置的設備FlOO的框圖。圖62B展示裝置F120的實施方案F122的框圖。圖63A展示根據通用配置的方法VlOO的流程圖。圖6 展示根據通用配置的設備WlOO的框圖。圖64A展示根據通用配置的方法V200的流程圖。圖64B展示根據通用配置的設備W200的框圖。在這些圖式中,除非上下文另有規定,否則使用相同標記指示相同結構的例子。
具體實施例方式如PDA和電話等手持機正作為特別好的移動語音通信裝置而快速湧現,從而充當 對蜂窩式網絡和網際網路的移動接入的平臺。先前在安靜的辦公室或家庭環境中在桌上型 計算機、膝上型計算機和辦公室電話上執行的越來越多的功能正在如汽車、街道、咖啡館或 機場等日常情形下執行。此趨勢意味著大量的話音通信正發生於用戶被其它人包圍的環境 中,在所述環境中伴隨有通常在人群傾向於聚集處所遇到的種類的噪聲內容。可用於在這 些環境中的話音通信和/或音頻再生的其它裝置包括有線和/或無線頭戴式耳機、音頻或 視聽媒體播放裝置(例如,MP3或MP4播放器)和類似可攜式或移動器具。如本文中描述的系統、方法和設備可用以支持所接收的或以其它方式再生的音頻 信號的增加的可懂度,尤其在有噪聲環境中。這些技術可大體應用於任何收發和/或音頻 再生應用中,尤其是這些應用中的移動例子或其它可攜式例子。舉例來說,本文中揭示的配 置的範圍包括駐留於經配置以使用碼分多址(CDMA)無線接口的無線電話通信系統中的通 信裝置。然而,所屬領域的技術人員應理解,具有如本文中所描述的特徵的方法和設備可駐 留於使用由所屬領域的技術人員已知的各種各樣的技術的各種通信系統中的任一者中,所 述通信系統例如是經由有線和/或無線(例如,CDMA、TDMA、FDMA和/或TD-SCDMA)發射信 道使用IP話音(VoIP)的系統。明確期望且於此揭示本文中所揭示的通信裝置可適於在為包交換(例如,經布置 以根據例如VoIP的協議載運音頻發射的有線和/或無線網絡)和/或電路交換的網絡中 使用。還明確期望且於此揭示本文中所揭示的通信裝置可適於在窄帶編碼系統(例如,對 約為四或五千赫的音頻頻率範圍進行編碼的系統)中使用,和/或在寬帶編碼系統(例如, 對大於五千赫的音頻頻率進行編碼的系統)中使用,寬帶編碼系統包括完整帶寬帶編碼系 統和分割帶寬帶編碼系統。除非明確受其上下文限制,否則術語「信號」在本文中用以指示其普通意義中的任 一者,包括如在電線、總線或其它傳輸媒體上表示的存儲器位置(或存儲器位置的集合)的 狀態。除非明確受其上下文限制,否則術語「產生」在本文中用以指示其普通意義中的任一 者,例如計算或以其它方式產生。除非明確受其上下文限制,否則術語「計算」在本文中用以 指示其普通意義中的任一者,例如計算、評估、平滑和/或從多個值中選擇。除非明確受其 上下文限制,否則術語「獲得」用以指示其普通意義中的任一者,例如計算、導出、接收(例 如,從外部裝置)和/或檢索(例如,從存儲元件的陣列)。在術語「包含」用於本描述和權 利要求書中時,其並不排除其它元件或操作。術語「基於」(如在「A基於B」中)用以指示 其普通意義中的任一者,包括以下情況(i) 「至少基於」(例如,"A是至少基於B」),和在特定情況下適當時,(ii) 「等於」(例如,「A等於B」)。類似地,術語「響應於」用以指示其 普通意義中的任一者,包括「至少響應於」。除非另有指示,否則對具有特定特徵的設備的操作的任何揭示還明確地希望揭示 具有相似特徵的方法(且反之亦然),且對根據特定配置的設備的操作的任何揭示還明確 地希望揭示根據相似配置的方法(且反之亦然)。如由其特定上下文所指示,術語「配置」 可參考方法、設備和/或系統來使用。除非特定上下文另有指示,否則一般地且可互換地使 用術語「方法」、「過程」、「程序」和「技術」。除非特定上下文另有指示,否則還一般地且可互 換地使用術語「設備」與「裝置」。術語「元件」和「模塊」通常用以指示較大配置的一部分。 通過引用文檔的一部分而進行的任何併入還應理解為併入有所述部分內所提及的術語或 變量的定義(其中這些定義出現在文檔中的別處)以及所述併入部分中所提及的任何圖。可互換地使用術語「編碼器」、「編解碼器」和「編碼系統」以表示一系統,所述系統 包括經配置以接收且編碼音頻信號的幀(可能在例如感知加權和/或其它濾波操作的一個 或一個以上預處理操作後)的至少一個編碼器和經配置以產生所述幀的解碼表示的對應 解碼器。此編碼器和解碼器通常部署於通信鏈路的相對終端處。為了支持全雙工通信,編 碼器和解碼器兩者的例子通常部署於此鏈路的每一端處。在此描述中,術語「所感測音頻信號」表示經由一個或一個以上麥克風接收的信 號,且術語「再生音頻信號」表示從從存儲裝置檢索和/或經由到另一裝置的有線或無線連 接接收到的信息來再生的信號。例如通信或播放裝置的音頻再生裝置可經配置以將再生音 頻信號輸出到裝置的一個或一個以上揚聲器。或者,此裝置可經配置以將再生音頻信號輸 出到聽筒、其它頭戴式耳機或經由電線或無線地耦合到所述裝置的外部揚聲器。參考用於 例如電話的話音通信的收發器應用,所感測音頻信號為待由收發器發射的近端信號,且再 生音頻信號為由收發器接收到(例如,經由無線通信鏈路)的遠端信號。參考例如所記錄 的音樂或語音(例如,MP3、音頻圖書、播客)的播放或此內容的流式傳輸(streaming)的移 動音頻再生應用,再生音頻信號為正被播放或流式傳輸的音頻信號。再生語音信號的可懂度可相對於信號的頻譜特性而變化。舉例來說,圖1的清晰 度指數曲線展示對語音可懂度的相對貢獻(relative contribution)隨音頻頻率變化的方 式。此曲線圖說明在IkHz與4kHz之間的頻率分量對於可懂度尤其重要,其中相對重要峰 值為約^iHz。圖2展示在典型窄帶電話應用中的再生語音信號的功率譜。此圖說明此信號的能 量隨著頻率增加超過500Hz而迅速減少。然而,如圖1中所展示,高達4kHz的頻率對於語 音可懂度來說可為非常重要的。因此,可預期人工提升在500Hz與4000Hz之間的頻帶中的 能量以改進此電話應用中的再生語音信號的可懂度。因為高於4kHz的音頻頻率對可懂度來說通常不如IkHz到4kHz帶來得重要,所以 在典型帶限通信信道上發射窄帶信號通常足以具有可懂的會談。然而,對於通信信道支持 寬帶信號的發射的情況,可預期個人語音特點的增加的清晰性和較好的傳達。在話音電話 情形中,術語「窄帶」指從約0-500HZ (例如,0Hz、50Hz、100Hz或200Hz)到約3_5kHz (例如, 3500Hz、4000Hz或4500Hz)的頻率範圍,且術語「寬帶」指從約0_500Hz (例如,0Hz、50Hz、 IOOHz 或 200Hz)到約 7-8kHz (例如,7000Hz、7500Hz 或 8000Hz)的頻率範圍。可能需要通過提升語音信號的選定部分來增加語音可懂度。舉例來說,在助聽器應用中,可使用動態範圍壓縮技術,通過提升再生音頻信號中的特定頻率子帶來補償所述 子帶中的已知聽力損失(hearing loss)。真實世界充滿著多種噪聲源(包括單點噪聲源),其常侵入到多個聲音中造成回 響。背景聲噪聲可包括由一般環境產生的眾多噪聲信號和由其它人的背景會談產生的幹擾 信號,以及從所述信號中的每一者產生的反射和迴響。環境噪聲可影響再生音頻信號(例如,遠端語音信號)的可懂度。對於通信發生 於有噪聲環境中的應用,可能希望使用語音處理方法來將語音信號與背景噪聲區分開且加 強其可懂度。此處理在日常通信的許多領域中可能是重要的,因為在真實世界條件下幾乎 總存在噪聲。自動增益控制(AGC,也被稱作自動音量控制或AVC)為可用以增加在有噪聲環境 中再生的音頻信號的可懂度的處理方法。自動增益控制技術可用以將信號的動態範圍壓縮 到有限振幅帶中,藉此提升信號的具有低功率的區段,並減少具有高功率的區段中的能量。 圖3展示典型語音功率譜(其中自然語音功率滾降使功率隨頻率而減小)和典型噪聲功率 譜(其中功率大體上在至少語音頻率範圍上恆定)的實例。在此情況下,語音信號的高頻 分量可具有比噪聲信號的對應分量少的能量,此導致對高頻語音帶的屏蔽。圖4A說明AVC 對此實例的應用。AVC模塊通常經實施以無區別地提升語音信號的所有頻帶,如此圖中所展 示。此方法可能需要放大信號的大動態範圍以實現高頻功率中的適度提升。通常,背景噪聲淹沒高頻語音內容比淹沒低頻內容快得多,因為高頻帶中的語音 功率通常遠小於低頻帶中的語音功率。因此,簡單地提升信號的總音量將不必要地提升低 於IkHz的低頻內容,這可能不會顯著地有助於可懂度。可能需要替代地調整音頻頻率子帶 功率以補償對再生音頻信號的噪聲屏蔽效應。舉例來說,可能需要與噪聲語音子帶功率的 比率成反比地提升語音功率且在高頻子帶中不相稱地提升語音功率,以補償語音功率朝著 高頻率的固有滾降。可能需要補償在由環境噪聲佔主導的頻率子帶中的低話音功率。舉例來說,如圖 4B中所展示,可能需要對選定子帶作用以通過將不同增益提升應用到語音信號的不同子帶 (例如,根據語音對噪聲比)來提升可懂度。與圖4A中所展示的AVC實例相比,可預期此均 衡提供較清楚且較可懂的信號,同時避免低頻分量的不必要的提升。為了以此方式選擇性地提升語音功率,可能需要獲得對環境噪聲電平的可靠和同 時的估計。然而,在實際應用中,可能難以使用傳統的單一麥克風或固定的波束成形類型的 方法來根據所感測音頻信號為環境噪聲建模。雖然圖3表明噪聲電平隨頻率而恆定,但在 通信裝置或媒體播放裝置的實際應用中,環境噪聲電平通常隨時間和頻率兩者顯著且迅速 地變化。在典型環境中,聲噪聲可包括混串音噪聲(babble noise)、機場噪聲、街道噪聲、 競爭交談者的話音和/或來自幹擾源(例如,電視機或收音機)的聲音。因此,此噪聲通常 為非固定的,且可具有接近用戶自身話音的頻譜的平均頻譜。根據單一麥克風信號計算出 的噪聲功率參考信號通常僅為大致固定的噪聲估計。此外,此計算通常必然伴有噪聲功率 估計延遲,使得可僅在顯著延遲後執行對子帶增益的對應調整。可能需要獲得環境噪聲的 可靠且同時的估計。圖5展示根據通用配置的經配置以處理音頻信號的設備AlOO的框圖,所述設備包括空間選擇性處理濾波器SS 10和均衡器EQ10。空間選擇性處理(SSP)濾波器SSlO經配 置以對M通道所感測音頻信號SlO (其中M為大於一的整數)執行空間選擇性處理操作以 產生源信號S20和噪聲參考S30。均衡器EQlO經配置以基於來自噪聲參考S30的信息動態 地更改再生音頻信號S40的頻譜特性以產生經均衡的音頻信號S50。舉例來說,均衡器EQlO 可經配置以使用來自噪聲參考S30的信息使再生音頻信號S40的至少一個頻率子帶相對於 再生音頻信號S40的至少一個其它頻率子帶提升以產生經均衡的音頻信號S50。在設備AlOO的典型應用中,所感測音頻信號SlO的每一通道基於來自M個麥克風 的陣列中的對應一者的信號。可經實施以包括設備AlOO的具有此麥克風陣列的實施方案 的音頻再生裝置的實例包括通信裝置和音頻或視聽播放裝置。這些通信裝置的實例包括 (但不限於)電話手持機(例如,蜂窩式電話手持機)、有線和/或無線頭戴式耳機(例如, 藍牙頭戴式耳機)和免提車載設備。這些音頻或視聽播放裝置的實例包括(但不限於)經 配置以再生流式傳輸或預記錄的音頻或視聽內容的媒體播放器。所述M個麥克風的陣列可經實施以具有兩個麥克風MClO和MC20 (例如,立體聲陣 列)或兩個以上麥克風。所述陣列的每一麥克風可具有全向、雙向或單向(例如,心形線) 的響應。可使用的各種類型的麥克風包括(但不限於)壓電式麥克風、動圈式麥克風和駐 極體麥克風。可經建構以包括設備AlOO的實施方案的音頻再生裝置的一些實例說明於圖 6A到圖IOC中。圖6A展示在第一操作配置中的雙麥克風手持機H100(例如,翻蓋型 (clamshell-type)蜂窩式電話手持機)的圖。手持機HlOO包括主要麥克風MClO和次要麥 克風MC20。在此實例中,手持機HlOO還包括主要揚聲器SPlO和次要揚聲器SP20。當手持 機HlOO處於第一操作配置中時,主要揚聲器SPlO是活動的,且次要揚聲器SP20可停用或 否則靜音。在此配置中可能需要主要麥克風MClO和次要麥克風MC20兩者均保持活動以支 持用於語音加強和/或噪聲減少的空間選擇性處理技術。圖6B展示手持機HlOO的第二操作配置。在此配置中,主要麥克風MClO為關閉的, 次要揚聲器SP20是活動的,且主要揚聲器SPlO可停用或否則靜音。同樣,在此配置中可能 需要主要麥克風MClO和次要麥克風MC20兩者均保持活動(例如,以支持空間選擇性處理 技術)。手持機HlOO可包括一個或一個以上開關或類似致動器,其狀態指示裝置的當前操作配置。設備AlOO可經配置以接收具有兩個以上通道的所感測音頻信號SlO的例子。舉 例來說,圖7A展示手持機HlOO的包括第三麥克風MC30的實施方案HllO的圖。圖7B展示 手持機Hl 10的兩個其它視圖,其展示各種轉換器沿著裝置的軸的放置。具有M個麥克風的聽筒或其它頭戴式耳機為可包括設備AlOO的實施方案的另一 種類的可攜式通信裝置。此頭戴式耳機可為有線或無線的。舉例來說,無線頭戴式耳機可 經配置以經由與例如蜂窩式電話手持機的電話裝置的通信(例如,使用如由藍牙技術聯盟 (Bluetooth Special Interest Group)公司,華盛頓州貝爾維尤市)發布的Bluetooth 協 議的版本)來支持半雙工或全雙工電話。圖8展示如經安裝用於在用戶的耳朵65上使用 的此頭戴式耳機63的不同操作配置的範圍66的圖。頭戴式耳機63包括在使用期間可以 不同方式相對於用戶的嘴巴64定向的主要(例如,端射式)和次要(例如,側向式)麥克 風的陣列67。此頭戴式耳機還通常包括用於再生遠端信號的揚聲器(未圖示),其可設置於頭戴式耳機的耳塞處。在另一實例中,包括設備AlOO的實施方案的手持機經配置以經由 有線和/或無線通信鏈路(例如,使用Bluetooth 協議的版本)從具有M個麥克風的頭戴 式耳機接收所感測音頻信號SlO且將經均衡的音頻信號S50輸出到手持機。具有M個麥克風的免提車載設備為可包括設備AlOO的實施方案的另一種類的移 動通信裝置。圖9展示此裝置83的其中M個麥克風84布置成線性陣列(在此特定實例中, M等於四)的實例的圖。此裝置的聲環境可包括風噪聲、滾動噪聲和/或引擎噪聲。可包括 設備AlOO的實施方案的通信裝置的其它實例包括用於音頻或視聽會議的通信裝置。此會 議裝置的典型用途可涉及多個所要聲源(例如,各參與者的嘴巴)。在此情況下,可能需要 麥克風的陣列包括兩個以上麥克風。具有M個麥克風的媒體播放裝置為可包括設備AlOO的實施方案的一種音頻或視 聽播放裝置。此裝置可經配置用於播放經壓縮的音頻或視聽信息,例如根據標準壓縮格式 (例如,移動圖片專家組(MPEG)-I音頻層3(MP3)、MPEG-4第14部分(MP4)、視窗媒體音頻 /視頻(WMA/WMV)(微軟公司,華盛頓州雷蒙德市)的版本、高級音頻編碼(AAC)、國際電信 聯盟(ITU)-T H.沈4,或其類似者)編碼的文件或流。圖IOA展示包括設置於裝置的正面處 的顯示屏幕SClO和揚聲器SPlO的此裝置的實例。在此實例中,麥克風MClO和MC20設置 於裝置的相同面處(例如,在頂面的相對側上)。圖IOB展示此裝置的其中麥克風設置於裝 置的相對面處的實例。圖IOC展示此裝置的其中麥克風設置於裝置的相鄰面處的實例。如 圖IOA到圖IOC中展示的媒體播放裝置還可經設計,使得較長的軸在所希望的使用期間為 水平的。空間選擇性處理濾波器SSlO經配置以對所感測音頻信號SlO執行空間選擇性處 理操作以產生源信號S20和噪聲參考S30。舉例來說,SSP濾波器SSlO可經配置以將所感測 音頻信號SlO的方向性所要分量(例如,用戶的話音)與所述信號的一個或一個以上其它 分量(例如,方向性幹擾分量和/或漫射噪聲分量)分離開。在此情況下,SSP濾波器SSlO 可經配置以集中方向性所要分量的能量,使得源信號S20包括比所感測音頻通道SlO的每 一通道包括的方向性所要分量的能量多的方向性所要分量的能量(也就是說,使得源信號 S20包括比所感測音頻通道SlO的任一個別通道包括的方向性所要分量的能量多的方向性 所要分量的能量)。圖11展示SSP濾波器SSlO的此實例的波束圖,其表明濾波器響應相對 於麥克風陣列的軸的方向性。空間選擇性處理濾波器SSio可用以提供對環境噪聲的可靠 且同時的估計(歸因於與單一麥克風噪聲減少系統相比的減少的延遲,也被稱作「瞬時」噪 聲估計)。空間選擇性處理濾波器SSlO通常經實施以包括由濾波器係數值的一個或一個以 上矩陣表徵的固定濾波器FF10。可使用如以下更詳細描述的波束成形、盲源分離(BSS)或 組合的BSS/波束成形方法來獲得這些濾波器係數值。空間選擇性處理濾波器SSlO還可 經實施以包括一個以上的級。圖12A展示SSP濾波器SSlO的此實施方案SS20的框圖,實 施方案SS20包括固定濾波器級FFlO和自適應濾波器級AF10。在此實例中,固定濾波器級 FFlO經布置以對所感測音頻信號SlO的通道S10-1和S10-2進行濾波以產生經濾波的通道 S15-1和S15-2,且自適應濾波器級AFlO經布置以對通道S15-1和S15-2進行濾波以產生 源信號S20和噪聲參考S30。在此情況下,可能需要使用固定濾波器級FFlO產生用於自適 應濾波器級AFlO的初始條件,如下更詳細地描述。還可能需要對到SSP濾波器SSlO的輸入執行自適應縮放(例如,以確保IIR固定或自適應濾波器組的穩定性)。可能需要實施SSP濾波器SSlO以包括多個固定濾波器級,其經布置使得可在操 作期間選擇所述固定濾波器級中的適當一者(例如,根據各種固定濾波器級的相對分離性 能)。此結構揭示於(例如)2008年XXX月XX日所申請的題為「用於實現基於多麥克風的 語音加強的系統、方法和設備(SYSTEMS,METHODS, AND APPARATUS FOR MULT I-MICROPHONE BASED SPEECH ENHANCEMENT) 」的第12/XXX, XXX號美國專利申請案(代理人案號080426) 中。可能需要在SSP濾波器SSlO或SS20後跟有噪聲減少級,所述噪聲減少級經配置 以應用噪聲參考S30以進一步減少源信號S20中的噪聲。圖12B展示設備AlOO的包括此 噪聲減少級NRlO的實施方案A105的框圖。噪聲減少級NRlO可實施為維納濾波器(Wiener filter),其濾波器係數值基於來自源信號S20和噪聲參考S30的信號和噪聲功率信息。在 此情況下,噪聲減少級NRlO可經配置以基於來自噪聲參考S30的信息估計噪聲頻譜。或者, 噪聲減少級NRlO可經實施以基於來自噪聲參考S30的頻譜對源信號S20執行頻譜相減操 作。或者,可將噪聲減少級NRlO實施為卡爾曼濾波器(Kalman filter),其中噪聲協方差基 於來自噪聲參考S30的信息。在經配置以執行方向性處理操作的替代方案或除了經配置以執行方向性處理操 作外,SSP濾波器SSlO可經配置以執行距離處理操作。圖12C和圖12D分別展示SSP濾波 器SSlO的實施方案SSllO和SS120的框圖,所述實施方案包括經配置以執行此操作的距離 處理模塊DSlO。距離處理模塊DSlO經配置以產生距離指示信號DIlO (作為距離處理操作 的結果),所述信號指示多通道所感測音頻信號SlO的分量的源相對於麥克風陣列的距離。 距離處理模塊DSlO通常經配置以產生距離指示信號DI10作為兩個狀態分別指示近場源和 遠場源的二元值指示信號,但產生連續和/或多值信號的配置也是可能的。在一個實例中,距離處理模塊DSlO經配置使得距離指示信號DIlO的狀態基於麥 克風信號的功率梯度之間的類似程度。距離處理模塊DSlO的此實施方案可經配置以根據 (A)麥克風信號的功率梯度之間的差與(B)閾值之間的關係來產生距離指示信號DI10。可 將一個此關係表達為
其中θ表示距離指示信號DIlO的當前狀態,Vp表示主要麥克風信號(例如, 麥克風信號DM10-1)的功率梯度的當前值,Vs表示次要麥克風信號(例如,麥克風信號 DM10-2)的功率梯度的當前值,且Td表示閾值,其可為固定的或自適應的(例如,基於所述 麥克風信號中的一者或一者以上的當前電平)。在此特定實例中,距離指示信號DIlO的狀 態1指示遠場源且狀態0指示近場源,但當然,在需要時可使用相反實施方案(即,使得狀 態1指示近場源且狀態0指示遠場源)。可能需要實施距離處理模塊DSlO以將功率梯度的值計算為在連續幀上的對應麥 克風信號的能量之間的差。在一個此實例中,距離處理模塊DSlO經配置以將功率梯度Vp 和▽ s中的每一者的當前值計算為對應麥克風信號的當前幀的值的平方的和與麥克風信號 的先前幀的值的平方的和之間的差。在另一此實例中,距離處理模塊DSlO經配置以將功率18梯度▽ p和^s中的每一者的當前值計算為對應麥克風信號的當前幀的值的量值的和與麥 克風信號的先前幀的值的量值的和之間的差。另外或在替代方案中,距離處理模塊DSlO可經配置使得距離指示信號DIlO的狀 態基於在一系列頻率上主要麥克風信號的相位與次要麥克風信號的相位之間的相關程度。 距離處理模塊DSlO的此實施方案可經配置以根據(A)麥克風信號的相位向量之間的相關 性與(B)閾值之間的關係產生距離指示信號DI10。可將一個此關係表達為
權利要求
1.一種處理再生音頻信號的方法,所述方法包含在經配置以處理音頻信號的裝置內執 行下列動作中的每一者對所述再生音頻信號進行濾波以獲得第一多個時域子帶信號; 基於來自所述第一多個時域子帶信號的信息,計算多個第一子帶功率估計; 對多通道所感測音頻信號執行空間選擇性處理操作以產生源信號和噪聲參考; 對所述噪聲參考進行濾波以獲得第二多個時域子帶信號; 基於來自所述第二多個時域子帶信號的信息,計算多個第二子帶功率估計;以及 基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率估計 的信息,使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一個其 它頻率子帶提升。
2.根據權利要求1所述的處理再生音頻信號的方法,其中所述方法包括對基於來自 所述多通道所感測音頻信號的信息的第二噪聲參考進行濾波,以獲得第三多個時域子帶信 號,且其中所述計算多個第二子帶功率估計是基於來自所述第三多個時域子帶信號的信息。
3.根據權利要求2所述的處理再生音頻信號的方法,其中所述第二噪聲參考為未經分 離的所感測音頻信號。
4.根據權利要求3所述的處理再生音頻信號的方法,其中所述計算多個第二子帶功率 估計包括基於來自所述第二多個時域子帶信號的信息,計算多個第一噪聲子帶功率估計; 基於來自所述第三多個時域子帶信號的信息,計算多個第二噪聲子帶功率估計; 以及識別所述所計算的多個第二噪聲子帶功率估計中的最小者,且其中所述多個第二子帶功率估計中的至少兩者的值是基於所述經識別的最小者。
5.根據權利要求2所述的處理再生音頻信號的方法,其中所述第二噪聲參考是基於所 述源信號。
6.根據權利要求2所述的處理再生音頻信號的方法,其中所述計算多個第二子帶功率 估計包括基於來自所述第二多個時域子帶信號的信息,計算多個第一噪聲子帶功率估計;以及 基於來自所述第三多個時域子帶信號的信息,計算多個第二噪聲子帶功率估計,且 其中所述多個第二子帶功率估計中的每一者是基於以下各者中的最大者(A)所述多 個第一噪聲子帶功率估計中的對應一者,和(B)所述多個第二噪聲子帶功率估計中的對應「"者 ο
7.根據權利要求1所述的處理再生音頻信號的方法,其中所述執行空間選擇性處理操 作包括將所述多通道所感測音頻信號的方向性分量的能量集中到所述源信號中。
8.根據權利要求1所述的處理再生音頻信號的方法,其中所述多通道所感測音頻信號 包括方向性分量和噪聲分量,且其中所述執行空間選擇性處理操作包括將所述方向性分量的能量與所述噪聲分量的 能量分離,使得所述源信號含有比所述多通道所感測音頻信號的每一通道含有的所述方向 性分量的所述能量多的所述方向性分量的所述能量。
9.根據權利要求1所述的處理再生音頻信號的方法,其中所述對所述再生音頻信號進 行濾波以獲得第一多個時域子帶信號包括通過使所述再生音頻信號的對應子帶的增益相 對於所述再生音頻信號的其它子帶提升來獲得所述第一多個時域子帶信號中的每一者。
10.根據權利要求1所述的處理再生音頻信號的方法,其中所述方法包括針對所述多 個第一子帶功率估計中的每一者計算所述第一子帶功率估計與所述多個第二子帶功率估 計中的對應一者的比率;且其中所述使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少 一個其它頻率子帶提升包括針對所述多個第一子帶功率估計中的每一者,將基於所述對應 的所計算比率的增益因子應用到所述再生音頻信號的對應頻率子帶。
11.根據權利要求10所述的處理再生音頻信號的方法,其中所述使所述再生音頻信號 的至少一個頻率子帶相對於所述再生音頻信號的至少一個其它頻率子帶提升包括使用濾 波器級的級聯對所述再生音頻信號進行濾波,且其中針對所述多個第一子帶功率估計中的每一者,所述將增益因子應用到所述再生音 頻信號的對應頻率子帶包含將所述增益因子應用到所述級聯的對應濾波器級。
12.根據權利要求10所述的處理再生音頻信號的方法,其中針對所述多個第一子帶功 率估計中的至少一者,通過基於所述再生音頻信號的當前電平的至少一個界限來約束所述 對應增益因子的當前值。
13.根據權利要求10所述的處理再生音頻信號的方法,其中所述方法包括針對所述多 個第一子帶功率估計中的至少一者,根據所述對應比率的值隨時間的改變,使所述對應增 益因子的值隨時間而平滑。
14.根據權利要求1所述的處理再生音頻信號的方法,其中所述方法包括對多個麥克 風信號執行回音消除操作以獲得所述多通道所感測音頻信號,其中所述執行回音消除操作是基於來自由所述使所述再生音頻信號的至少一個頻率 子帶相對於所述再生音頻信號的至少一個其它頻率子帶提升所產生的音頻信號的信息。
15.一種處理再生音頻信號的方法,所述方法包含在經配置以處理音頻信號的裝置內 執行下列動作中的每一者對多通道所感測音頻信號執行空間選擇性處理操作以產生源信號和噪聲參考;針對所述再生音頻信號的多個子帶中的每一者,計算第一子帶功率估計;針對所述噪聲參考的多個子帶中的每一者,計算第一噪聲子帶功率估計;針對基於來自所述多通道所感測音頻信號的信息的第二噪聲參考的多個子帶中的每 一者,計算第二噪聲子帶功率估計;針對所述再生音頻信號的所述多個子帶中的每一者,計算基於所述對應第一和第二噪 聲子帶功率估計中的最大者的第二子帶功率估計;以及基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率估計 的信息,使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一個其 它頻率子帶提升。
16.根據權利要求15所述的方法,其中所述第二噪聲參考為未經分離的所感測音頻信號。
17.根據權利要求15所述的方法,其中所述第二噪聲參考是基於所述源信號。
18.一種用於處理再生音頻信號的設備,所述設備包含第一子帶信號產生器,其經配置以對所述再生音頻信號進行濾波以獲得第一多個時域 子帶信號;第一子帶功率估計計算器,其經配置以基於來自所述第一多個時域子帶信號的信息計 算多個第一子帶功率估計;空間選擇性處理濾波器,其經配置以對多通道所感測音頻信號執行空間選擇性處理操 作以產生源信號和噪聲參考;第二子帶信號產生器,其經配置以對所述噪聲參考進行濾波以獲得第二多個時域子帶 信號;第二子帶功率估計計算器,其經配置以基於來自所述第二多個時域子帶信號的信息計 算多個第二子帶功率估計;以及子帶濾波器陣列,其經配置以基於來自所述多個第一子帶功率估計的信息且基於來自 所述多個第二子帶功率估計的信息,使所述再生音頻信號的至少一個頻率子帶相對於所述 再生音頻信號的至少一個其它頻率子帶提升。
19.根據權利要求18所述的用於處理再生音頻信號的設備,其中所述設備包括第三子 帶信號產生器,所述第三子帶信號產生器經配置以對基於來自所述多通道所感測音頻信號 的信息的第二噪聲參考進行濾波以獲得第三多個時域子帶信號,且其中所述第二子帶功率估計計算器經配置以基於來自所述第三多個時域子帶信號的 信息計算所述多個第二子帶功率估計。
20.根據權利要求19所述的用於處理再生音頻信號的設備,其中所述第二噪聲參考為 未經分離的所感測音頻信號。
21.根據權利要求19所述的用於處理再生音頻信號的設備,其中所述第二噪聲參考是 基於所述源信號。
22.根據權利要求19所述的用於處理再生音頻信號的設備,其中所述第二子帶功率估 計計算器經配置以(A)基於來自所述第二多個時域子帶信號的信息,計算多個第一噪聲子 帶功率估計,和(B)基於來自所述第三多個時域子帶信號的信息,計算多個第二噪聲子帶 功率估計,且其中所述第二子帶功率估計計算器經配置以基於以下各者中的最大者來計算所述多 個第二子帶功率估計中的每一者(A)所述多個第一噪聲子帶功率估計中的對應一者,和 (B)所述多個第二噪聲子帶功率估計中的對應一者。
23.根據權利要求18所述的用於處理再生音頻信號的設備,其中所述多通道所感測音 頻信號包括方向性分量和噪聲分量,且其中所述空間選擇性處理濾波器經配置以將所述方向性分量的能量與所述噪聲分量 的能量分離,使得所述源信號含有比所述多通道所感測音頻信號的每一通道含有的所述方 向性分量的所述能量多的所述方向性分量的所述能量。
24.根據權利要求18所述的用於處理再生音頻信號的設備,其中所述第一子帶信號產 生器經配置以通過使所述再生音頻信號的對應子帶的增益相對於所述再生音頻信號的其 它子帶提升來獲得所述第一多個時域子帶信號中的每一者。
25.根據權利要求18所述的用於處理再生音頻信號的設備,其中所述設備包括子帶增益因子計算器,所述子帶增益因子計算器經配置以針對所述多個第一子帶功率估計中的每 一者,計算所述第一子帶功率估計與所述多個第二子帶功率估計中的對應一者的比率;且其中所述子帶濾波器陣列經配置以針對所述多個第一子帶功率估計中的每一者,將基 於所述對應所計算的比率的增益因子應用到所述再生音頻信號的對應頻率子帶。
26.根據權利要求25所述的用於處理再生音頻信號的設備,其中所述子帶濾波器陣列 包括濾波器級的級聯,且其中所述子帶濾波器陣列經配置以將所述多個增益因子中的每一者應用到所述級聯 的對應濾波器級。
27.根據權利要求25所述的用於處理再生音頻信號的設備,其中所述子帶增益因子計 算器經配置以針對所述多個第一子帶功率估計中的至少一者,通過基於所述再生音頻信號 的當前電平的至少一個界限來約束所述對應增益因子的當前值。
28.根據權利要求25所述的用於處理再生音頻信號的設備,其中所述第一子帶增益因 子計算器經配置以針對所述多個第一子帶功率估計中的至少一者,根據所述對應比率的值 隨時間的改變,使所述對應增益因子的值隨時間而平滑。
29.一種計算機可讀媒體,其包含在由處理器執行時使所述處理器執行處理再生音頻 信號的方法的指令,所述指令包含在由處理器執行時使所述處理器進行以下操作的指令對所述再生音頻信號進行濾波以獲得第一多個時域子帶信號; 基於來自所述第一多個時域子帶信號的信息,計算多個第一子帶功率估計; 對多通道所感測音頻信號執行空間選擇性處理操作以產生源信號和噪聲參考; 對所述噪聲參考進行濾波以獲得第二多個時域子帶信號; 基於來自所述第二多個時域子帶信號的信息,計算多個第二子帶功率估計;以及 基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率估計 的信息,使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一個其 它頻率子帶提升。
30.根據權利要求四所述的計算機可讀媒體,其中所述媒體包括在由處理器執行時使 所述處理器對基於來自所述多通道所感測音頻信號的信息的第二噪聲參考進行濾波以獲 得第三多個時域子帶信號的指令,且其中在由處理器執行時使所述處理器計算多個第二子帶功率估計的所述指令在由所 述處理器執行時使所述處理器基於來自所述第三多個時域子帶信號的信息計算所述多個 第二子帶功率估計。
31.根據權利要求30所述的計算機可讀媒體,其中所述第二噪聲參考為未經分離的所感測音頻信號。
32.根據權利要求30所述的計算機可讀媒體,其中所述第二噪聲參考是基於所述源信號。
33.根據權利要求30所述的計算機可讀媒體,其中在由處理器執行時使所述處理器計 算多個第二子帶功率估計的所述指令包括在由處理器執行時使所述處理器進行以下操作 的指令基於來自所述第二多個時域子帶信號的信息,計算多個第一噪聲子帶功率估計;以及 基於來自所述第三多個時域子帶信號的信息,計算多個第二噪聲子帶功率估計,且其中在由處理器執行時使所述處理器計算多個第二子帶功率估計的所述指令在由所 述處理器執行時使所述處理器基於以下各者中的最大者來計算所述多個第二子帶功率估 計中的每一者(A)所述多個第一噪聲子帶功率估計中的對應一者,和(B)所述多個第二噪 聲子帶功率估計中的對應一者。
34.根據權利要求四所述的計算機可讀媒體,其中所述多通道所感測音頻信號包括方 向性分量和噪聲分量,且其中在由處理器執行時使所述處理器執行空間選擇性處理操作的所述指令包括在由 處理器執行時使所述處理器將所述方向性分量的能量與所述噪聲分量的能量分離使得所 述源信號含有比所述多通道所感測音頻信號的每一通道含有的所述方向性分量的所述能 量多的所述方向性分量的所述能量的指令。
35.根據權利要求四所述的計算機可讀媒體,其中在由處理器執行時使所述處理器對 所述再生音頻信號進行濾波以獲得第一多個時域子帶信號的所述指令包括在由處理器執 行時使所述處理器通過使所述再生音頻信號的對應子帶的增益相對於所述再生音頻信號 的其它子帶提升來獲得所述第一多個時域子帶信號中的每一者的指令。
36.根據權利要求四所述的計算機可讀媒體,其中所述媒體包括在由處理器執行時使 所述處理器針對所述多個第一子帶功率估計中的每一者基於(A)所述第一子帶功率估計 與(B)所述多個第二子帶功率估計中的對應一者的比率來計算增益因子的指令;且其中在由處理器執行時使所述處理器使所述再生音頻信號的至少一個頻率子帶相對 於所述再生音頻信號的至少一個其它頻率子帶提升的所述指令包括在由處理器執行時使 所述處理器針對所述多個第一子帶功率估計中的每一者將基於所述對應的所計算比率的 增益因子應用到所述再生音頻信號的對應頻率子帶的指令。
37.根據權利要求36所述的計算機可讀媒體,其中在由處理器執行時使所述處理器使 所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一個其它頻率子 帶提升的所述指令包括在由處理器執行時使所述處理器使用濾波器級的級聯對所述再生 音頻信號進行濾波的指令,且其中在由處理器執行時使所述處理器針對所述多個第一子帶功率估計中的每一者將 增益因子應用到所述再生音頻信號的對應頻率子帶的所述指令包括在由處理器執行時使 所述處理器將所述增益因子應用到所述級聯的對應濾波器級的指令。
38.根據權利要求36所述的計算機可讀媒體,其中在由處理器執行時使所述處理器計 算增益因子的所述指令包括在由處理器執行時使所述處理器針對所述多個第一子帶功率 估計中的至少一者通過基於所述再生音頻信號的當前電平的至少一個界限來約束所述對 應增益因子的當前值的指令。
39.根據權利要求36所述的計算機可讀媒體,其中在由處理器執行時使所述處理器計 算增益因子的所述指令包括在由處理器執行時使所述處理器針對所述多個第一子帶功率 估計中的至少一者根據所述對應比率的值隨時間的改變使所述對應增益因子的值隨時間 而平滑的指令。
40.一種用於處理再生音頻信號的設備,所述設備包含用於對所述再生音頻信號進行濾波以獲得第一多個時域子帶信號的裝置;用於基於來自所述第一多個時域子帶信號的信息計算多個第一子帶功率估計的裝置;用於對多通道所感測音頻信號執行空間選擇性處理操作以產生源信號和噪聲參考的 裝置;用於對所述噪聲參考進行濾波以獲得第二多個時域子帶信號的裝置;用於基於來自所述第二多個時域子帶信號的信息計算多個第二子帶功率估計的裝置;以及用於基於來自所述多個第一子帶功率估計的信息且基於來自所述多個第二子帶功率 估計的信息使所述再生音頻信號的至少一個頻率子帶相對於所述再生音頻信號的至少一 個其它頻率子帶提升的裝置。
41.根據權利要求40所述的用於處理再生音頻信號的設備,其中所述設備包括用於對 基於來自所述多通道所感測音頻信號的信息的第二噪聲參考進行濾波以獲得第三多個時 域子帶信號的裝置,且其中所述用於計算多個第二子帶功率估計的裝置經配置以基於來自所述第三多個時 域子帶信號的信息計算所述多個第二子帶功率估計。
42.根據權利要求41所述的用於處理再生音頻信號的設備,其中所述第二噪聲參考為 未經分離的所感測音頻信號。
43.根據權利要求41所述的用於處理再生音頻信號的設備,其中所述第二噪聲參考是 基於所述源信號。
44.根據權利要求41所述的用於處理再生音頻信號的設備,其中所述用於計算多個第 二子帶功率估計的裝置經配置以(A)基於來自所述第二多個時域子帶信號的信息,計算多 個第一噪聲子帶功率估計,和(B)基於來自所述第三多個時域子帶信號的信息,計算多個 第二噪聲子帶功率估計,且其中所述用於計算多個第二子帶功率估計的裝置經配置以基於以下各者中的最大者 來計算所述多個第二子帶功率估計中的每一者(A)所述多個第一噪聲子帶功率估計中的 對應一者,和(B)所述多個第二噪聲子帶功率估計中的對應一者。
45.根據權利要求40所述的用於處理再生音頻信號的設備,其中所述多通道所感測音 頻信號包括方向性分量和噪聲分量,且其中所述用於執行空間選擇性處理操作的裝置經配置以將所述方向性分量的能量與 所述噪聲分量的能量分離,使得所述源信號含有比所述多通道所感測音頻信號的每一通道 含有的所述方向性分量的所述能量多的所述方向性分量的所述能量。
46.根據權利要求40所述的用於處理再生音頻信號的設備,其中所述用於對所述再生 音頻信號進行濾波的裝置經配置以通過使所述再生音頻信號的對應子帶的增益相對於所 述再生音頻信號的其它子帶提升來獲得所述第一多個時域子帶信號中的每一者。
47.根據權利要求40所述的用於處理再生音頻信號的設備,其中所述設備包括用於針 對所述多個第一子帶功率估計中的每一者基於(A)所述第一子帶功率估計與(B)所述多個 第二子帶功率估計中的對應一者的比率來計算增益因子的裝置;且其中所述用於提升的裝置經配置以針對所述多個第一子帶功率估計中的每一者,將基 於所述對應所計算的比率的增益因子應用到所述再生音頻信號的對應頻率子帶。
48.根據權利要求47所述的用於處理再生音頻信號的設備,其中所述用於提升的裝置包括濾波器級的級聯,且其中所述用於提升的裝置經配置以將所述多個增益因子中的每一者應用到所述級聯 的對應濾波器級。
49.根據權利要求47所述的用於處理再生音頻信號的設備,其中所述用於計算增益因 子的裝置經配置以針對所述多個第一子帶功率估計中的至少一者,通過基於所述再生音頻 信號的當前電平的至少一個界限來約束所述對應增益因子的當前值。
50.根據權利要求47所述的用於處理再生音頻信號的設備,其中所述用於計算增益因 子的裝置經配置以針對所述多個第一子帶功率估計中的至少一者,根據所述對應比率的值 隨時間的改變,使所述對應增益因子的值隨時間而平滑。
全文摘要
本文中描述的技術包括使用均衡技術來改進再生音頻信號(例如,遠端語音信號)的可懂度。
文檔編號G10L21/02GK102057427SQ200980121001
公開日2011年5月11日 申請日期2009年7月17日 優先權日2008年7月18日
發明者埃裡克·維瑟, 傑裡米·託曼 申請人:高通股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀