使用音頻信號水平的隨時間變化的估計概率密度的隨時間變化的音頻信號水平的製作方法
2023-05-31 17:05:46
專利名稱:使用音頻信號水平的隨時間變化的估計概率密度的隨時間變化的音頻信號水平的製作方法
技術領域:
本發明涉及音頻信號處理。具體而言,本發明涉及通過平滑音頻信號的短期水平來計算出隨時間變化的對音頻信號的水平的度量,其中至少部分地通過隨時間變化的對短期水平的概率密度的估計來控制平滑處理的參數。
弓I用文獻且該文獻通過弓I用結合於此 在Alan Jeffrey Seefeldt等人的國際專利申請公布WO 2004/111994A2 (於2004年12月23日公布,題為"Method, Apparatus and ComputerProgr咖for Calculating andAdjusting the Perceived Loudness of anAudio Signal")中禾口在Alan Seefeldt等人的文章(Audio EngineeringSociety(音頻工程協會)大會論文6236, 2004年10月28日舊金山,題為"A New 0bj ective Measure of Perceived Loudness")中描述了在更好地理解本發明時有用的用於度量感知的(心理聲學)響度的一些技術。所述申請WO 2004/111994A2和所述文章通過整體引用而結合於此。
背景技術:
在音頻信號處理中,生成隨時間變化的對音頻信號水平的度量常常是必要的(這裡術語"水平" 一般地指代水平的度量,諸如峰水平、均方根水平、響度水平等)。例如,響度計可以顯示隨時間變化的對音頻信號的感知響度的度量,其中該度量被明顯地平滑以便表明在過去數秒內的平均響度。在另一例子中,自動增益控制(Automatic Gain Control,AGC)處理可以計算隨時間變化的對音頻信號水平的高度平滑的度量、然後使用所得度量來生成緩慢變化的增益,該增益在應用於音頻信號時可以將音頻的平均水平自動移動到更接近希望的目標水平。 在許多例子中的這兩個例子中,通過將某一形式的平滑濾波器應用於對短期水平的度量來計算出平滑的水平度量。("短期"的意思是在比執行後續的平滑處理的間隔明顯更短的時間間隔內進行計算。)例如,如在申請W0 2004/111994 A2中所述,可以在數十毫秒的間隔內計算信號的均方根水平或者感知響度水平以生成短期水平。然後,後續的對該短期水平的平滑可以涉及到數秒量級的時間常數。在以下討論中,將該隨時間變化的對短期水平的度量表示為信號L[t],而將後續的平滑後的水平度量表示為[[t],其中t表示離散的時間索引。 許多類型的平滑濾波器可以應用於L[t]以生成[[t]。可以使用有限衝激響應(Finite Impulse Response, FIR)濾波器或者多極無限衝激響應(Infinite ImpulseResponse, IIR)濾波器。所用具體濾波器不是關鍵的。出於示例目的,可以考慮常用的快速上升/緩慢釋放的單極IIR平滑器。利用這樣的濾波器,可以根據以下方程來更新平滑後的水平度量C[t]
則
(1)
a上升丄0 _ 1] + (1 — 上升)丄|>] 丄|>] _丄[t -1 ] > 0"釋放Z[f — 1] + (1 一 《釋放)丄P] — Z[t -1] s 0
可以選擇平滑係數a上升和a釋放使得a上升< a釋放。這意味著[[t]在L[t]增加(上升)時比在L[t]減少(釋放)時更快速地跟蹤L[t]。對於AGC,例如可以選擇與一秒的時間常數對應的a ±#和與四秒的時間常數對應的a k。這樣,[[t]隨時間很緩慢變化,結果,修改音頻的對應增益也緩慢變化,由此維持原音頻的短期動態性。然而,當使用這樣大的時間常數時可能出現問題。假設為了在節目之間和在各種頻道之間維持一致的平均水平,使用這樣的AGC對電視機的音頻進行操作。在這樣的情形中,AGC處理的音頻信號的內容可能驟然改變(例如在頻道改變時),而相關的音頻信號的平均水平因此也可能驟然改變。然而,AGC由於它的時間常數大而需要大量時間來收斂至新水平和使所處理的音頻的修改水平符合希望的目標水平。在這樣的調整時間期間,電視的觀看者可以感覺到音頻的水平太響或者太低。結果,觀看者可能快速去拿遙控器以調節音量——而沒有想到自己只是在AGC收斂時與它對抗。 現有技術通常使用基於短期水平L[t]與平滑水平[[t]的相對關係來改變的時間常數來解決剛才描述的問題。例如,如果信號的短期水平明顯大於或者少於由平滑水平周圍的一些閾值邊界所限定的平滑水平,則平滑操作分別向較快的上升時間常數和/或釋放時間常數切換,直至短期水平回落至平滑水平周圍的閾值邊界內。隨後,系統切換回原來較慢時間常數。可以修改方程l以通過包括四種情況而不是兩種情況來實施這一更複雜的平滑技術
a快上升丄1> _ + (1 _ a快上升)丄1>]"上升Z[f —1] + (l-a;上升)丄[f]
Z[,-1] + (l-a釋放)朋
釋放
丄W-丄[t]〉AL,決
0〈i:[f] — Z[t]sAL快
(2)
快釋放
丄[f —1] + (1_ 快釋放)
化]_訓《-M
快 在方禾呈2中,a快上升< a上升禾口 a快釋放< a釋放意b未著a快上升禾口 a快釋放分另lJX寸應於比a上升和a釋放更快的時間常數。如果a上升和a釋放分別對應於1秒和4秒的時間常數,則可以選擇例如分別與0. 1秒和0. 4秒的時間常數(快至十倍)對應的a ^^和a ttffiK。必須合理地選擇快速時間常數閾值ALft,使得向這些較快的時間常數的切換沒有太頻繁地出現,造成不希望的平滑後的水平[[t]的不穩定。例如,如果水平度量L[t]和[[t]表示以分貝為單位的均方根水平,則可以將ALft設置為10dB,約為感知響度的兩倍。
雖然相對於方程1中的平滑帶來了改善,但是方程2的平滑對於許多信號仍然有次優表現。 一般而言,對於任意合理閾值ALft,可以存在如下信號,對於這些信號而言,短期水平L[t]的原來希望的動態性在平均水平[[t]周圍的閾值邊界以外波動,因此使平滑處理錯誤地向快速上升或者釋放模式切換。 為了更好地理解其中方程2的平滑如希望的那樣表現以及其中該平滑表現不充分的情況,可以設想短期水平L[t]隨時間的分布。可以將這一分布設想為隨時間變化的如下概率密度,該概率密度預測在當前時間索引t附近的時間間隔內遇到短期水平L的任何特定值的概率。這一間隔的持續時間應當與方程2的平滑濾波器中所用的較慢的一組時間常數相當。 現在針對之前描述的電視頻道改變的例子來考慮這種概率密度的行為。假定針對給定頻道的短期水平的動態範圍有些限制,那麼短期水平L[t]的概率密度函數呈現為位於平滑水平[[t]周圍的相當窄的峰的形式。當頻道改變時,假設新頻道的平均水平明顯高於原頻道,那麼概率密度函數將開始改變新峰增長到位於新頻道的更高平均水平周圍,而原峰降低。 圖l描繪了在描述的轉變開始時的概率密度函數。在圖中,水平軸表示水平而豎直軸表示概率。實線表示短期水平在轉變開始時的概率密度。注意左側為降低的峰(表示與舊頻道的選擇相關聯的概率的降低)而右側為增長的峰(表示與新頻道的選擇相關聯的概率的升高)。在轉變開始時,平滑水平[[t-l]仍然落在舊頻道選擇的峰內,而短期水平L[t]落在新頻道的峰內。在圖中,短期水平L[t]比[[t-l]超出大於ALft的數量,因此根據等式2,快速時間常數用來將[[t]朝向L[t]更新。這是希望的效果平滑水平[[t]快速適應於新選擇的頻道的更高水平,從而快速躍過將概率密度的兩個峰分開的間隙。
圖2描繪了對於大為不同的音頻信號的短期水平的概率密度。在這一情況下,信號的原動態性比較大,因此概率密度的峰擴展很寬。這樣的動態性在高質量記錄爵士或者經典音樂時是典型的。也在圖2中,[[t-l]與L[t]之間的關係與圖1中完全相同,但是現在兩個值都落在概率密度的主峰內。因此,因為[[t-l]與L[t]之間的關係是信號的典型動態性的一部分,所以向快速時間常數的切換是不希望的。在這一情況下,方程2描述的平滑並不合適。
發明內容
這裡教導用於平滑信號的隨時間變化的水平的方法、介質和裝置。 一種方法包括估計信號的短期水平的隨時間變化的概率密度和通過使用概率密度來平滑信號的水平。信號可以是音頻信號,而平滑後的水平和估計出的概率密度可以按近似相同的速率隨時間變化。 短期水平和平滑後的水平可以是時間序列,其每個都具有當前時間索引和先前時
間索引。在本文中,在平滑之前可以計算在先前時間索引處的平滑後的水平的概率。在平滑
之前,可以使用概率密度來計算平滑參數。計算平滑參數可以包括使用在先前時間索引處
的平滑後的水平、在當前時間索引處的短期水平和在先前時間索引處的平滑後的水平的概
率來計算平滑參數。計算平滑參數可以包括使用估計的概率密度的寬度來計算平滑參數。 計算平滑參數可以包括當在先前時間索引處的平滑後的水平不大於閾值概率
時,使用第一上升時間常數和釋放時間常數;相反,當在先前時間索引處的平滑後的水平大
於閾值概率時,使用如下的上升和釋放時間常數,該上升和釋放時間常數中的一個比它的
對應第一時間常數更慢。所用的上升時間常數和釋放時間常數均可以比它們的對應第一時
間常數更慢。
閾值概率可以是可變的。可變閾值概率可以是估計的概率密度的函數。
平滑可以包括通過使用概率密度來平滑短期水平。 估計概率密度可以包括將參數表達與短期水平的以往值擬合。擬合可以包括將高斯混合模型與短期水平的以往值擬合。估計概率密度可以包括計算短期水平的以往值的直方圖。 —種計算機可讀存儲器,包含用於實現這裡描述的方法中的任意一個的電腦程式。 —種計算機系統,包括中央處理器、所述存儲器以及通信耦合中央處理器和存儲器的總線。 —種音頻信號水平平滑器,包括短期水平計算器,用於計算音頻信號的短期水平;水平平滑器,用於使用平滑參數來平滑音頻信號的水平;概率密度估計器,用於估計音頻信號的概率密度;概率計算器,用於計算經延遲的平滑後的水平的概率;平滑參數計算器,用於計算平滑參數;以及延遲器,用於延遲平滑後的水平。 概率密度估計器可以包括用於使用音頻信號的短期水平的時間序列來估計概率密度的概率密度估計器。概率計算器可以包括用於使用估計出的概率密度和經延遲的平滑後的水平來計算概率的概率計算器。平滑參數計算器可以包括用於使用概率、經延遲的平滑後的水平和短期水平來計算平滑參數的平滑參數計算器。概率計算器可以包括用於使用估計出的概率密度和經延遲的平滑後的水平來計算概率的概率計算器,而平滑參數計算器可以包括用於使用概率、經延遲的平滑後的水平和短期水平來計算平滑參數的平滑參數計算器。 水平平滑器可以包括用於平滑音頻信號的短期水平的水平平滑器。 概率密度估計器可以包括用於將參數表達與短期水平的以往值擬合的擬合器。參
數表達擬合器可以包括用於將高斯混合模型與短期水平的以往值擬合的擬合器。概率密度
估計器可以包括用於計算短期水平的以往值的直方圖的直方圖計算器。 另一種用於平滑信號的隨時間變化的水平的方法包括接收具有短期水平的信號和平滑隨時間變化的水平,其中短期水平和平滑後的隨時間變化的水平為時間序列,其每個具有當前時間索引和先前時間索引,而平滑可以包括當在先前時間索引處的平滑後的短期水平與在當前時間索引處的短期水平之差超過指示使用快速時間常數的閾值時,使用緩慢時間常數。 可以通過參照以下討論和附圖來更好地理解本發明的各種特徵及其優選實施例,在附圖中相似標號指代相似元件。
圖1描繪了適合向快速平滑時間常數切換的音頻信號的短期水平的概率密度。 圖2描繪了不適合向快速平滑時間常數切換的音頻信號的短期水平的概率密度。 圖3描繪了本發明一個實施例的總體框圖。 圖4描繪了本發明一個實施例對在水平明顯不同的源之間切換的音頻信號的操作。 圖5是根據本發明一個實施例的平滑水平生成器的操作流程圖。
具體實施例方式
圖3是根據本發明一個實施例的平滑水平生成器3的框圖。 平滑水平生成器3包括短期水平計算器31、短期水平平滑器32、概率密度估計器33、概率計算器34、平滑參數計算器35和延遲器36。短期水平計算器31接收作為輸入的音頻信號3D,產生作為其輸出的短期水平L[t]37。概率密度估計器33接收作為輸入的短期水平L[t]37和產生作為其輸出的估計出的概率密度p(1, t)38。概率計算器34接收作為其輸入的估計出的概率密度P (1, t) 38和經延遲的平滑後的水平度量[[t-l] 3C,產生作為其輸出的概率P([[t-l], t)39。平滑參數計算器35接收作為其輸入的概率p([[t-l],t)39以及經延遲的平滑後的短期水平3B和短期水平L[t]37,產生作為其輸出的平滑參數3A。短期水平平滑器32接收作為其輸入的平滑參數3A和短期水平L[t]37,產生作為其輸出的平滑後的水平度量[[t] 3C。最後,延遲器36接收和延遲平滑後的水平度量[[t] 3C。
當然,平滑水平生成器3可以整體或者部分地實施為包括已編程的存儲器的通用計算機、專用電路、可編程門陣列等。 接著描述根據一個實施例的平滑水平生成器3的操作。 平滑水平生成器3通過平滑短期水平估計L[t]來生成平滑後的水平估計[[t],其中至少部分地按照從短期水平L[t]的隨時間變化的概率密度估計導出的信息進行控制。所生成的平滑後的水平估計[[t]例如可用作由實時響度計顯示的值或者在音頻動態處理器(如AGC)中的控制路徑中使用。 圖5是根據本發明一個實施例的平滑水平生成器3的操作流程圖。首先,計算音頻信號的短期水平L[t](步驟505)。平滑該短期水平(步驟510),生成平滑的水平度量[[t]。 並行地,根據短期水平L[t]來更新短期水平的概率密度的隨時間變化的估計(步驟515)。這一概率密度估計p(l, t)返回輸入水平l的在零與一之間的概率。時間索引t表明在概率密度估計器33(圖3)接收短期水平L[t]的新值時,這一函數隨時間改變。理想地,概率密度估計器33考慮用於創建估計p(l,t)的L[t]值的時間間隔應當與平滑器32用來生成[[t]的時間常數相當。結果[[t]和p(l,t)以近似相同的速率隨時間變化。
通過向密度估計p(l, t)饋送水平值[[t-l]來計算(步驟520)來自先前時間索引的平滑後的水平度量的概率P([[t-l],t)。這一概率值p([[t-l],t表示與[[t-l]和短期水平在時間索引t周圍的許多值之間的關係(不僅僅是[[t-l]與當前短期水平L[t]之間的關係)有關的信息。例如,如果P([[t-l], t)較高,則這表明[[t-l]類似於短期水平在最近的許多值。相反,如果P([[t-l], t)較低,則[[t-l]不同於短期水平在最近的多數值。 _ 最後,概率值p([[t-l], t)以及當前短期水平L[t]和先前的平滑後的水平度量[[t-l]饋送到平滑參數計算器35(圖3)中,該計算器使用這些值來選擇用於生成當前的平滑後的水平度量[[t]的平滑參數(步驟525)。 雖然圖3描繪了控制平滑參數的p([[t-l], t),但是可以採用從密度估計p(l, t)得出的其它信息。例如,平滑參數計算器35可以使用密度估計的寬度度量,這是音頻信號的動態範圍的指示。 回到p([[t-l], t)的示例使用,一般而言,當密度估計p(l, t)估計出先前的平滑後的值[[t-l]具有低概率時,那麼應當用快速時間常數更新[[t]。如果[[t-l]的概率相對較高,則應當使用正常的較慢的時間常數。這樣,如果多數短期水平值已經遠離先前的平滑後的值[[t-l],則[[t]將朝向這些值更快移動。如果[[t-l]已經在多數短期水平值附
9近,則較慢的移動是合適的。 參照圖2,因為[[t-l]仍然落在高概率區內(雖然短期水平L[t]相對較遠),所 以本發明的一個實施例可以防止不希望的向更快時間常數的切換。對於圖1中的頻道改變 例子,值得更具體地考察這一策略如何仍然產生希望的快速適應。為了有所幫助,圖4描繪 了在五個階段中兩個頻道之間的轉變。 一種簡單的時間常數控制策略假設當P([[t-l],t) 大於某一閾值PT時使用緩慢時間常數來更新[[t-l]。當p([[t-l],t)少於這一閾值PT時 使用快速時間常數。(圖中的符號中去除了時間下標以簡化表達。) 圖4的第一階段(初始穩態)描繪了緊接在選擇較響的第二頻道之前的狀態。短
期水平的概率密度緊密地分布於第一頻道的平均水平周圍。平滑後的水平[落在這一密度
的主峰內。因此,[的概率P([)大於閾值PT,因此使用緩慢時間常數來更新[。 第二階段(轉變開始)表示緊接在音頻已經向較響的第二頻道切換之後的系統狀
態。在這一階段中,位於第一頻道的平均水平周圍的概率密度的大峰收縮,而位於較響的第
二頻道的平均水平周圍的新峰增長。平滑水平[已經開始朝向第二頻道的平均水平右移。
然而它的概率仍然大於PT,因此仍然採用較慢時間常數。 在第三階段(轉變中間)中,概率分布的第一峰繼續收縮,而第二峰繼續增長。平 滑後的水平[繼續朝向第二頻道向右生長,但是現在它的概率下降至閾值PT以下。([已經 移入兩個峰之間的低概率間隙中。)這時,使用快速時間常數來更新[,使得它快速越過間 隙而移向第二頻道的峰。 在第四階段(轉變結束)中,[已經移入第二頻道的主峰中,它的概率再次大於PT。 現在進行返回到較慢時間常數的切換。 最後在第五階段(新的穩態)中,平滑水平[已經穩定於第二頻道的平均水平,繼 續使用緩慢時間常數。 通過使用從隨時間變化的概率密度估計p(l, t)得出的信息,本發明實施例以在 真正的轉變時段期間快速響應而對於先前有問題的信號仍然保持穩定的方式來適應用於 平滑音頻信號水平度量的時間常數。 現在具體地描述本發明一個具體實施例的例子。在這一實施例中,從L[t]生成 [[t]的平滑處理可以被表達為具有隨時間變化的係數a [t]的單極濾波器
[[t] = a [t][[t-l] + (l-a [t])L[t](3) 通過根據概率密度估計p(l,t)來改變係數a [t],來對平滑進行調整。先描述從 短期水平L[t]得出密度估計p(l,t)。然後描述係數a [t]的控制。
概率密度的估計 概率密度估計p(l,t)捕獲短期水平L[t]在從當前時間索引t延伸到過去近期的 時間間隔內的行為。為此,估計器33(圖3)維護包含短期水平L[t]的過去的T個值的緩 存器。(可以根據希望的應用來選擇該緩存器的長度T。對於之前討論的AGC例子,例如可 以設置緩存器的長度等於四秒。) 從該緩存器可以用任意的多種方式生成概率密度的估計。例如,可以將參數表達 (如高斯混合模型)與緩存器中的數據擬合。另一技術計算緩存數據的直方圖。緩存器中 的每個值分配給離散的格子(bin)。通過先找出值1落入的格子、然後將概率計算為數據緩 存器中分配給該格子的點的數目除以數據緩存器中的點的總數目,以計算出密度函數P (1,t)。可以將直方圖的格子限定為以間距AL^位於某一最小水平Lmin與最大水平L^之間。
例如,如果以dB為單位表示水平,則可以設置Lmin = ldB、L隨=120dB和A Lbin = ldB以產 生具有120個格子的直方圖。格子的總數目B可以一般地表達為 J 一丄 formula see original document page 11 在每個時間瞬間t,對長度為T的數據緩存器中落入直方圖的每個格子中的樣本 的數目進行計數。Ht[b] (b = 1…B)表示直方圖的格子,可以根據映射函數計算水平值l被 分配到的格子b:
formula see original document page 11(5) formula see original document page 11 在算法上,根據以下偽代碼計算每個時間t的直方圖Ht[b]: for b = 1 to B,
Ht[b] = 0 end for r =0 to T_l, b = LevelToBin (L[t_ t ]) Ht[b] = Ht[b]+1 end 然後,通過在1被分配到的格子處的直方圖除以緩存器中的數據點的總數目給出 概率密度估計P(l,t): formula see original document page 11
結果是估計出的概率密度p(l, t)不是輸入水平1的連續函數而是以ALbin的間 隔"逐級階躍"的函數。然而如果直方圖間距ALbin足夠小,概率密度估計對於實際用途而 言也足夠光滑。 平滑濾波器係數的計算 現在描述自適應濾波器係數a [t]的計算。在正常條件之下,當[[t-l]的概率相 對較高時使用正常的上升時間常數和釋放時間常數(如在方程l中那樣)。當[[t-l]的概 率較低時使用較快的上升時間常數和釋放時間常數。 為了在正常時間常數與快速時間常數之間平滑地插值,基於從密度估計p(l, t) 計算出的[[t-l]概率來生成範圍在零與一之間的控制信號13 [t]:
formula see original document page 11 則= 如果p([[t-l],t)大於閾值PT,則控制信號13 [t]等於一。隨著p([[t-l],t)下 降至Pt以下,控制信號13 [t]下降至零。最後,通過基於控制信號13 [t]在正常與快速的 上升和釋放係數之間插值來計算平滑濾波器係數a [t]。formula see original document page 12 當|3 [t]等於零時([[t-l]落在低概率區中),使用快速上升係數和快速釋放系
數。當e [t]等於一 ([[t-l]落在高概率區中)時,則使用正常上升和釋放係數。 為了實施AGC,可以設置分別與1秒、0. l秒、4秒和0. 4秒的時間常數對應的a上升、
a快上升、a釋放和a快釋放值。可以將概率閾值PT的值設置 為0. 075的固定值。
儘管這一實施例使用固定值的閾值PT,但是在一些應用中使pT為可變閾值(例如 根據密度估計P(l, t)的某一度量而改變)也可以是有利的。例如,Pt可以隨著水平1中 的最大值P(l,t)而變化。 本說明書通過引用合併了本文提到的所有出版物和專利申請,也就是說本說明書 已經通過引用來具體和個別地合併這樣的各個出版物或者專利申請。 由於可以在不脫離本發明的實質精神的情況下用多個形式實施本發明,所以本文 中實施例為示例而非限制。因此,落入權利要求的界限和範圍內或者落入這樣的界限和範 圍的等同內的改變將被權利要求所涵蓋。
權利要求
一種用於平滑信號的隨時間變化的水平的方法,所述方法包括估計所述信號的短期水平的隨時間而變化的概率密度;以及使用所述概率密度來平滑所述信號的水平。
2. 根據權利要求1所述的方法,其中 所述信號是音頻信號。
3. 根據權利要求1所述的方法,其中平滑後的水平和估計出的概率密度以近似相同的速率隨時間變化。
4. 根據權利要求1所述的方法,其中所述短期水平和所述平滑後的水平為時間序列,其每個具有當前時間索引和先前時間 索引;以及在所述平滑之前進行以下操作計算在所述先前時間索引處所述平滑後的水平的概率。
5. 根據權利要求1所述的方法,其中 在所述平滑之前進行以下操作使用所述概率密度來計算平滑參數。
6. 根據權利要求5所述的方法,其中 所述平滑參數的計算包括使用在所述先前時間索引處的所述平滑後的水平、在所述當前時間索引處的所述短期 水平和在所述先前時間索引處的所述平滑後的水平的概率來計算所述平滑參數。
7. 根據權利要求5所述的方法,其中 所述平滑參數的計算包括使用所述估計出的概率密度的寬度來計算所述平滑參數。
8. 根據權利要求6所述的方法,其中 所述平滑參數的計算包括當在所述先前時間索引處的所述平滑後的水平不大於閾值概率時,使用第一上升時間 常數和釋放時間常數;以及相反,當在所述先前時間索引處的所述平滑後的水平大於所述閾值概率時,使用如下 的上升時間常數和釋放時間常數,所述上升時間常數和釋放時間常數之一比其對應的第一 時間常數更慢。
9. 根據權利要求8所述的方法,其中上升常數和釋放常數的使用包括 使用如下的上升時間常數和釋放時間常數,所述上升時間常數和釋放時間常數都比其對應的第一時間常數更慢。
10. 根據權利要求6所述的方法,其中 所述閾值概率是可變的。
11. 根據權利要求10所述的方法,其中 可變閾值概率是所述估計出的概率密度的函數。
12. 根據權利要求l-ll中的任一權利要求所述的方法,其中所述平滑包括使用所述概 率密度來平滑所述短期水平。
13. 根據權利要求1-11中的任一權利要求所述的方法,其中估計所述概率密度包括將參數表達與所述短期水平的以往值擬合。
14. 根據權利要求13所述的方法,其中所述擬合包括 將高斯混合模型與所述短期水平的所述以往值擬合。
15. 根據權利要求1-11中的任一權利要求所述的方法,其中估計所述概率密度包括 計算所述短期水平的以往值的直方圖。
16. —種計算機可讀存儲器,包含用於實現根據權利要求l-ll的方法中的任一方法的 電腦程式。
17. —種計算機系統,包括 中央處理器;根據權利要求16所述的存儲器;以及總線,通信耦合所述中央處理器和所述存儲器。
18. —種音頻信號水平平滑器,包括 短期水平計算器,用於計算音頻信號的短期水平; 水平平滑器,用於使用平滑參數來平滑所述音頻信號的水平; 概率密度估計器,用於估計所述音頻信號的概率密度; 概率計算器,用於計算經延遲的平滑後的水平的概率;平滑參數計算器,用於計算所述平滑參數;以及 延遲器,用於延遲所述平滑後的水平。
19. 根據權利要求18所述的音頻信號水平平滑器,其中所述概率密度估計器包括 用於使用所述音頻信號的所述短期水平的時間序列來估計概率密度的概率密度估計器。
20. 根據權利要求18所述的音頻信號水平平滑器,其中所述概率計算器包括用於使用估計出的概率密度和經延遲的平滑後的水平來計算所述概率的概率計算器。
21. 根據權利要求18所述的音頻信號水平平滑器,其中所述平滑參數計算器包括用於使用所述概率、所述經延遲的平滑後的水平和所述短期水平來計算所述平滑參數 的平滑參數計算器。
22. 根據權利要求19所述的音頻信號水平平滑器,其中所述概率計算器包括用於使用所述估計出的概率密度和所述經延遲的平滑後的水平來計算所述概率的概 率計算器;以及所述平滑參數計算器,包括用於使用所述概率、所述經延遲的平滑後的水平和所述短期水平來計算平滑參數的平 滑參數計算器。
23. 根據權利要求18-22所述的音頻信號水平平滑器,其中所述水平平滑器包括 用於平滑所述音頻信號的所述短期水平的水平平滑器。
24. 根據權利要求18-22所述的音頻信號水平平滑器,其中所述概率密度估計器包括 擬合器,用於將參數表達與所述短期水平的以往值擬合。
25. 根據權利要求24所述的音頻信號水平平滑器,其中所述參數表達擬合器包括 用於將高斯混合模型與所述短期水平的以往值擬合的擬合器。
26. 根據權利要求18-22所述的音頻信號水平平滑器,其中所述概率密度估計器包括用於計算所述短期水平的以往值的直方圖的直方圖計算器。
27. —種用於平滑信號的隨時間變化的水平的方法,所述方法包括 接收具有短期水平的信號;以及 平滑所述隨時間變化的水平,其中所述短期水平和平滑後的隨時間變化的水平為時間序列,其每個具有當前時間索引和 先前時間索引,以及 所述平滑包括當在所述先前時間索引處的平滑後的短期水平與在當前時間索引處的短期水平之差 超過指示使用快速時間常數的閾值時,使用緩慢時間常數。
全文摘要
用於平滑信號的隨時間變化的水平的方法、介質和裝置。該方法包括估計信號的短期水平的隨時間變化的概率密度和通過使用概率密度來平滑信號的水平。信號可以是音頻信號。短期水平和平滑後的水平可以是各自具有當前時間索引和先前時間索引的時間序列。這裡,在平滑之前可以計算在先前時間索引處的平滑後的水平的概率。在平滑之前可以使用概率密度來計算平滑參數。計算平滑參數可以包括使用在先前時間索引處的平滑後的水平、在當前時間索引處的短期水平和在先前時間索引處的平滑後的水平的概率來計算平滑參數。計算平滑參數可以包括使用估計的概率密度的寬度來計算平滑參數。
文檔編號H03G3/30GK101743689SQ200880024506
公開日2010年6月16日 申請日期2008年7月11日 優先權日2007年7月13日
發明者阿蘭·傑弗裡·西費爾特 申請人:杜比實驗室特許公司