使用頻譜分量耦合和頻譜分量再生的改進音頻編碼系統和方法
2023-04-24 15:32:51 1
專利名稱:使用頻譜分量耦合和頻譜分量再生的改進音頻編碼系統和方法
技術領域:
本發明涉及用於傳輸、記錄和回放音頻信號的音頻編碼和解碼裝置和方法。更具體地,本發明涉及減少傳送或記錄給定音頻信號所需要的信息,同時在回放輸出信號中維持給定感覺質量水平。
背景技術:
許多通信系統面臨著信息傳輸和記錄容量的需求通常超過可用容量的問題。因此,其中在廣播和記錄領域中很受關注的是,降低傳送或記錄供人感知的音頻信號所需要的信息量而不降低它的感覺質量。
用於降低信息容量要求的傳統方法涉及只傳送或記錄輸入信號中的選定部分。丟棄其餘部分。稱為感知編碼的技術典型地轉換原始音頻信號為頻譜分量或者頻率子帶信號,以便冗餘或者不相關的那些信號部分可以被更容易地識別和丟棄。一個信號部分如果可以從該信號的其他部分再生,那麼它就被認為是冗餘的。如果一個信號部分感覺上無關緊要或者聽不見,那麼它就被認為是不相關的。感知解碼器可以從一個已編碼信號中再生丟失的冗餘部分,但是它不能產生還不是冗餘的任何丟失的不相關信息。然而,不相關信息的丟失是可接受的,因為它的缺少對已解碼信號沒有任何可察覺的影響。
如果信號編碼技術僅僅丟棄冗餘或者感覺上不相關的那些信號部分,那麼它在感覺上是透明的。如果感覺上透明的技術不能達到充分降低信息容量的要求,那麼就需要感覺上不透明的技術來丟棄非冗餘並且感覺上相關的附加信號部分。不可避免的結果就是,所傳送或記錄信號的感覺保真度就會降低。優選地,感覺上不透明的技術只丟棄被認為感覺上最不重要的那些信號部分。
一種稱為「耦合」的編碼技術可以用來降低信息容量要求,它通常被認為是感覺上不透明的技術。根據該技術,組合兩個或更多個輸入音頻信號中的頻譜分量以形成耦合聲道信號,該耦合聲道信號具有這些頻譜分量的複合表示。還產生補充信息,表示每一個輸入音頻信號中為了形成該複合表示所組合的頻譜分量的譜包絡。傳送或記錄包括耦合聲道信號和補充信息的已編碼信號,以供接收機隨後解碼。該接收機通過產生耦合聲道信號的副本並且使用補充信息對複製信號中的頻譜分量定標使得原始輸入信號的譜包絡基本上被恢復,來產生去耦信號,這些去耦信號是原始輸入信號的不精確複製。一種用於雙聲道立體聲系統的典型耦合技術組合左右聲道信號的高頻分量來形成一個單獨的複合高頻分量信號,並且產生表示原始左右聲道信號中的高頻分量的譜包絡的補充信息。在高級電視系統委員會(ATSC)標準文件A/52的「Digital Audio Compression(AC-3)」中描述了耦合技術的一個例子,通過引用其全部包含於此。
應該選擇補充信息和耦合聲道信號的信息容量要求,以便優化兩個競爭需要之間的折衷。如果用於補充信息的信息容量要求設置得太高,那麼耦合聲道將被迫以低精確度傳送它的頻譜分量。耦合聲道頻譜分量中的較低精確度可能導致聽得見程度的編碼噪聲或量化噪聲被注入到去耦信號中。相反,如果耦合聲道信號的信息容量要求設置得太高,那麼補充信息將被迫傳送具有低水平頻譜細節的譜包絡。譜包絡中的較低細節水平可能導致每個去耦信號的譜級(spectral level)和形狀的聽得到的差異。
通常,如果補充信息傳送頻率子帶的譜級,那麼就可以得到良好的折衷,其中這些子帶具有與人聽覺系統的臨界頻帶相當的帶寬。應該注意到,去耦信號可能能夠保持原始輸入信號的原始頻譜分量的譜級,但是他們通常不能保持原始頻譜分量的相位。如果耦合限於高頻頻譜分量,那麼可能不會感覺到相位信息的丟失,因為人的聽覺系統對尤其是在高頻的相位變化相對不敏感。
通過傳統耦合技術產生的補充信息典型地是頻譜幅度的度量。因此,一個典型系統中的解碼器基於從頻譜幅度推導的能量度量來計算定標因子。這些計算通常要求計算從補充信息得到的值的平方和的平方根,這需要相當大的計算資源。
一種有時稱為「高頻再生」(HFR)的編碼技術是感覺上不透明的技術,它可以用來降低信息容量要求。根據該技術,傳送或存儲只包含輸入音頻信號的低頻分量的基帶信號。還提供表示原始高頻分量的頻譜包絡的補充信息。傳送或記錄一個包括該基帶信號和該補充信息的已編碼信號,供接收機隨後解碼。該接收機基於該補充信息再生具有譜級的所省略高頻分量並且組合該基帶信號和該再生高頻分量來產生輸出信號。在1979年4月的Proc.of the International Conf.onAcoust.,Speech and Signal Proc.中的Makhoul和Berouti的「High-Frequency Regeneration in Speech Coding Systems」,可以找到已知HFR方法的描述。在2002年3月28日提交的題目為「BroadbandFrequency Translation for High Frequency Regeneration」的美國專利申請第10/113,858號中公開了適於編碼高質量音樂的改進HFR技術,通過參考其全部包含於此並且在下面稱為HFR申請。
應該選擇補充信息和基帶信號的信息容量要求,以便優化兩個競爭需要之間的折衷。如果用於補充信息的信息容量要求設置得太高,那麼已編碼信號將被迫以低精確度傳送基帶信號中的頻譜分量。基帶信號頻譜分量中的較低精確度可能導致聽得見程度的編碼噪聲或量化噪聲被注入到基帶信號以及從它合成的其他信號中。相反,如果基帶信號的信息容量要求設置得太高,那麼補充信息將被迫傳送具有低水平頻譜細節的譜包絡。譜包絡中的較低細節水平可能導致每個合成信號的譜級和形狀的聽得到的差異。
通常,如果補充信息傳送頻率子帶的譜級,那麼就可以得到良好的折衷,其中這些子帶具有與人聽覺系統的臨界頻帶相當的帶寬。
正如對上面所討論的耦合技術,通過傳統HFR技術產生的補充信息典型地是頻譜幅度的度量。因此,一個典型系統中的解碼器基於從頻譜幅度推導的能量度量來計算定標因子。這些計算通常要求計算從補充信息得到的值的平方和的平方根,這需要相當大的計算資源。
傳統的系統使用了耦合技術或者HFR技術,但沒有同時使用兩者。在許多應用中,耦合技術可能引起比HFR技術小的信號劣化,但是HFR技術可以實現信息容量要求的更大降低。可以在多聲道和單聲道應用中有利地使用HFR技術,但是,在單聲道應用中耦合技術不能提供任何優點。
發明內容
本發明的目的是提供像在音頻編碼系統中實現耦合和HFR那樣的信號處理技術的改進。
根據本發明的一個方面,一種用於編碼一個或多個輸入音頻信號的方法包括以下步驟從輸入音頻信號中得到一個或多個基帶信號以及一個或多個剩餘信號,其中基帶信號的頻譜分量在第一組頻率子帶中,剩餘信號的頻譜分量在基帶信號所不表示的第二組頻率子帶中;得到一個或多個合成信號的頻譜分量的能量度量,其中這些合成信號將在解碼期間在該第二組子帶內產生;得到剩餘信號的頻譜分量的能量度量;通過得到剩餘信號和合成信號的頻譜分量的能量度量的平方根和比值來計算定標因子;並且將表示定標因子的定標信息和表示基帶信號中的頻譜分量的信號信息彙編到已編碼信號中。
根據本發明的另一個方面,一種用於解碼表示一個或多個輸入音頻信號的已編碼信號的方法包括以下步驟從已編碼信號中得到定標信息和信號信息,其中定標信息表示通過得到頻譜分量的能量度量的平方根和比值所計算的定標因子,信號信息表示一個或多個子帶信號的頻譜分量,並且其中基帶信號中的頻譜分量表示第一組頻率子帶中的輸入音頻信號的頻譜分量;為該基帶信號產生相關合成信號,這些合成信號具有基帶信號所不表示的第二組頻率子帶中的頻譜分量,其中根據一個或多個定標因子通過乘法和除法對合成信號中的頻譜分量定標;並且產生一個或多個輸出音頻信號,這些信號表示輸入音頻信號並且是從基帶信號和相關合成信號中的頻譜分量中產生的。
根據本發明的又一個方面,一種用於編碼多個輸入音頻信號的方法包括以下步驟從輸入音頻信號中得到多個基帶信號、多個剩餘信號和一個耦合聲道信號,其中基帶信號的頻譜分量表示在第一組頻率子帶中的輸入音頻信號頻譜分量而剩餘信號的頻譜分量表示在基帶信號所不表示的第二組頻率子帶中的輸入音頻信號頻譜分量,並且其中耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個或更多個輸入音頻信號的頻譜分量的複合;得到剩餘信號和該耦合聲道信號所表示的兩個或更多個輸入音頻信號的頻譜分量的能量度量;並且將從能量度量中推導出來的定標信息和表示基帶信號和耦合聲道信號中的頻譜分量的信號信息彙編到已編碼信號。
根據本發明的另一個方面,一種用於解碼表示多個輸入音頻信號的已編碼信號的方法包括以下步驟從已編碼信號中得到控制信息和信號信息,其中控制信息是從頻譜分量的能量度量中推導出來的並且信號信息表示多個基帶信號和一個耦合聲道信號的頻譜分量,基帶信號中的頻譜分量表示在第一組頻率子帶中的輸入音頻信號頻譜分量,耦合聲道信號的頻譜分量表示在兩個或更多個輸入音頻信號的第三組頻率子帶中的頻譜分量的複合;為基帶信號產生相關合成信號,這些相關合成信號具有基帶信號所不表示的第二組頻率子帶中的頻譜分量,其中根據該控制信息對相關合成信號中的頻譜分量定標;從耦合聲道信號中為耦合聲道信號所表示的兩個或更多個輸入音頻信號產生去耦信號,其中去耦信號具有根據控制信息所定標的第三頻率子帶中的頻譜分量;並且從基帶信號和相關合成信號中的頻譜分量產生表示輸入音頻信號的多個輸出信頻信號,其中表示兩個或更多個音頻信號的輸出音頻信號也是從各個去耦信號中的頻譜分量中產生的。
本發明的其它方面包括具有執行各種編碼和解碼方法的處理電路的裝置;攜帶裝置可執行指令的程序的媒體,其中該程序會引起裝置執行各種編碼和解碼方法;以及攜帶表示各種編碼方法所產生的輸入音頻信號的已編碼信息的媒體。
通過參考下面的討論和附圖,可以更好地理解本發明的各種特點及其優選實施例,其中幾個圖中相同的參考編號指的是相同的元件。下面討論和附圖的內容僅僅作為例子闡述,不應該理解為表示對本發明範圍的限制。
圖1是對音頻信號編碼的裝置的示意框圖,其中該編碼信號用於隨後通過一個裝置使用高頻再生進行解碼。
圖2是使用高頻再生解碼已編碼音頻信號的裝置的示意框圖。
圖3是將音頻信號分為頻率子帶信號的裝置的示意框圖,這些子帶信號具有響應於該音頻信號的一個或多個特徵所適配的範圍。
圖4是從具有所適配範圍的頻率子帶信號合成音頻信號的裝置的示意框圖。
圖5和6是使用耦合來編碼音頻信號的裝置的示意框圖,該編碼信號用於隨後通過一個裝置使用高頻再生和去耦合進行解碼。
圖7是使用高頻再生和去耦合來解碼已編碼信號的裝置的示意框圖。
圖8是一個編碼音頻信號的裝置的示意框圖,該裝置使用第二分析濾波器組以便提供用於能量計算的附加頻譜分量。
圖9是可以實現本發明的各個方面的設備的示意框圖。
具體實施例方式
A.概述本發明涉及降低已編碼信號的信息容量要求的音頻編碼系統和方法,其通過丟棄原始輸入音頻信號的「剩餘」部分並且只編碼原始輸入音頻信號的基帶部分、並且隨後通過產生合成信號代替丟失的剩餘部分來解碼已編碼信號來實現。已編碼信號包括解碼處理用來控制信號合成的定標信息,以便合成信號在某種程度上保持原始輸入音頻信號的剩餘部分的譜級。
這種編碼技術在此稱為高頻再生(HFR),因為可以預料到,在許多實現中,剩餘信號將包含較高頻率的頻譜分量。但是原則上,該技術並不限於只合成高頻頻譜分量。基帶信號可以包括更高頻率頻譜分量的一些或全部,或者可以包括分散在整個輸入信號總帶寬的頻率子帶中的頻譜分量。
1.編碼器圖1示出接收輸入音頻信號並且產生表示該輸入音頻信號的已編碼信號的音頻編碼器。分析濾波器組10從路徑9接收該輸入音頻信號,並且作為響應,提供表示該音頻信號的頻譜分量的頻率子帶信息。沿著路徑12產生表示基帶信號的頻譜分量的信息並且沿著路徑11產生表示剩餘信號的頻譜分量的信息。基帶信號的頻譜分量表示第一組頻率子帶中的一個或多個子帶中的輸入音頻信號的頻譜內容,這些子帶由已編碼信號中傳送的信號信息來表示。在一種優選實現中,第一組頻率子帶是較低頻子帶。剩餘信號的頻譜分量表示在第二組頻率子帶中的一個或多個子帶中的輸入音頻信號的頻譜內容,這些子帶沒有在基帶被表示並且沒有被已編碼信號傳送。在一種實現中,第一和第二組頻率子帶的聯合組成了輸入音頻信號的整個帶寬。
能量計算器31計算剩餘信號的一個或多個子帶中頻譜能量的一個或多個度量。在一種優選實現中,從路徑11接收的頻譜分量被安排在具有與人聽覺系統的臨界頻帶相當的帶寬的頻率子帶中,並且能量計算器31提供這些頻率子帶中每一個的能量度量。
合成模型21表示信號合成處理,該處理將會在對沿著路徑51產生的已編碼信號進行解碼的解碼處理中發生。合成模型21可以自己執行合成處理或者它可以執行某種其他處理,該其他處理可以估計合成信號的頻譜能量而不實際執行合成處理。能量計算器32接收合成模型21的輸出並且計算要合成的信號中的頻譜能量的一個或多個度量。在一個優選實現中,合成信號的頻譜分量被安排在具有與人聽覺系統的臨界頻帶相當的帶寬的頻率子帶中,並且能量計算器32提供這些頻率子帶中每一個的能量度量。
在圖1中的描述和圖5、6和8中的描述表示了分析濾波器組和合成模型之間的連接,其建議合成模型至少部分地響應於基帶信號;但是,這種連接是可選的。下面討論合成模型的一些實現。這些實現中的一些獨立於基帶信號而操作。
定標因子計算器40從兩個能量計算器中的每一個接收一個或多個能量度量,並且計算定標因子,這在下面更詳細地解釋。沿著路徑41傳遞表示所計算的定標因子的定標信息。
格式化器50從路徑41接收定標信息並且從路徑12接收表示基帶信號的頻譜分量的信息。這些信息被彙編到已編碼信號中,後者沿著路徑51傳遞供傳輸或記錄用。已編碼信號可以通過基帶或包括超聲波到紫外頻率的整個頻譜上的調製通信路徑傳送,或者它可以使用基本上任何記錄技術記錄在媒體上,這些記錄技術包括磁帶、卡或盤、光卡或盤以及在像紙張這樣的媒體上的可檢測標記。
在優選實現中,使用可以通過丟棄冗餘或不相關的部分降低信息容量要求的感知編碼處理來編碼基帶信號的頻譜分量。這些編碼處理對於本發明來說不是必要的。
2.解碼器圖2描述了接收表示音頻信號的已編碼信號並且產生該音頻信號的解碼表示的音頻解碼器。去格式化器60從路徑59接收已編碼信號並且從已編碼信號中得到定標信息和信號信息。定標信息表示定標因子而信號信息表示基帶信號的頻譜分量,其中該基帶信號具有在第一組頻率子帶中的一個或多個子帶中的頻譜分量。信號合成部件23執行合成處理以便產生具有在第二組頻率子帶中的一個或多個子帶中的頻譜分量的信號,這些頻率分量表示已編碼信號沒有傳送的剩餘信號的頻譜分量。
圖2和7中的描述示出了去格式化器和信號合成部件23之間的連接,其建議信號合成至少部分地響應於基帶信號;但是,該連接是可選的。下面討論信號合成的一些實現。這些實現中的一些獨立於基帶信號而操作。
信號定標部件70從由路徑61接收的定標信息中得到定標因子。定標因子用來對信號合成部件23產生的合成信號的頻譜分量定標。合成濾波器組80從路徑71接收已定標合成信號,從路徑62接收基帶信號的頻譜分量,並且作為響應沿著路徑89產生輸出音頻信號,該輸出音頻信號是原始輸入音頻信號的解碼表示。儘管輸出信號與原始輸入音頻信號不同樣,但是可以預料到,該輸出信號與輸入音頻信號在感覺上不可區別,或者對於給定應用至少是以在感覺上令人滿意並且可接受的方式可區別的。
在優選實現中,信號信息表示編碼形式的基帶信號的頻譜分量,必須使用與編碼器中使用的編碼處理相反的解碼處理來解碼。如上所提到的,這些處理對於本發明來說不是必要的。
3.濾波器組分析和合成濾波器組可以以期望的基本上任何方式來實現,包括數字濾波器技術、塊變換和小波變換的廣泛範圍。在一個具有如圖1和2中分別所示的解碼器和編碼器的音頻編碼系統中,分析濾波器組10通過改進離散餘弦變換(MDCT)來實現,並且合成濾波器組80可以通過改進離散餘弦反變換來實現,這些在1987年5月的Proc.ofthe International Conf.on Acoust.,Speech and Signal Proc.第2161-64頁Princen等人的「Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation」中描述了。原則上沒有特定的濾波器實現是很重要的。
通過塊變換實現的分析濾波器組將一塊或一個時段的輸入信號分為一組表示該時段的信號的頻譜內容的變換係數。一個或多個相鄰變換係數的一個組表示一個特定頻率子帶中的頻譜內容,該子帶具有與該組中的係數數量相當的帶寬。
通過某種數字濾波器例如多相濾波器而不是塊變換實現的分析濾波器組將輸入信號分為一組子帶信號。每個子帶信號是一個特定頻率子帶內的輸入信號頻譜內容的基於時間的表示。優選地,子帶信號被抽取,以便每個子帶信號的帶寬與單位時段的子帶信號中的抽樣數量相當。
下面的討論具體地參考使用類似於上面提到的時域混疊消除(TDAC)變換的塊變換的實現。在該討論中,術語「頻譜分量」指的是變換係數並且術語「頻率子帶」和「子帶信號」涉及一個或多個相鄰變換係數的組。但是,本發明的原理可以應用於其它類型的實現,因此術語「頻率子帶」和「子帶信號」還涉及表示一個信號的整個帶寬一部分的頻譜內容的信號,並且術語「頻譜分量」通常理解為指的是子帶信號的抽樣或單元。
B.定標因子在使用例如像TDAC變換這樣的變換的編碼系統中,變換係數X(k)表示原始輸入音頻信號x(t)的頻譜分量。變換係數分為不同組,表示基帶信號和剩餘信號。在使用諸如下述方式之一的合成處理的解碼處理期間,產生合成信號的變換係數Y(k)。
1.計算在一個優選實現中,編碼處理提供定標信息,其傳送根據剩餘信號的頻譜能量度量與合成信號的頻譜能量度量的比值的平方根而計算的定標因子。對剩餘信號和合成信號的頻譜能量的度量可以根據下式計算E(k)=X2(k) (1a)ES(k)=Y2(k) (1b)其中,X(k)=剩餘信號中的變換係數k;E(k)=頻譜分量X(k)的能量度量;Y(k)=合成信號中的變換係數k;以及ES(k)=頻譜分量Y(k)的能量度量。
對於大多數應用來說,用於補充信息的信息容量要求太高,其中補充信息基於對每個頻譜分量的能量度量;因此,根據下式由頻譜分量的組或頻率子帶的能量度量計算定標因子E(m)=k=m1m2X2(k)---(2a)]]>ES(m)=k=m1m2Y2(k)---(2b)]]>
其中,E(m)=對剩餘信號的頻率子帶m的能量度量;以及ES(m)=對合成信號的頻率子帶m的能量度量。求和界限m1和m2規定了在子帶m中的最低和最高頻譜分量。在優選實現中,這些頻率子帶具有與人聽覺系統的臨界頻帶相當的帶寬。
求和界限還可以使用一個集合表示法來表示,例如k∈{M},其中{M}表示包含在能量計算中的所有頻譜分量的集合。基於下面解釋的原因,該表示法在說明書其餘部分中使用。使用該表示法,公式2a和2b可以分別如公式2c和2d所示寫為E(m)=k{M}X2(k)---(2c)]]>ES(m)=k{M}Y2(k)---(2d)]]>其中,{M}=子帶m中的所有頻譜分量的集合。
根據下式之一可以計算用於子帶m的定標因子SF(m)SF(m)=E(m)ES(m)---(3a)]]>SF(m)=E(m)ES(m)---(3b)]]>但是,基於第一公式的計算通常更有效。
2.定標因子的表示優選地,編碼處理在已編碼信號中提供定標信息,其以需要比這些定標因子本身低的信息容量的形式來傳送所計算的定標因子。可以使用各種方法來降低定標信息的信息容量要求。
一種方法是將每個定標因子本身表示為具有相關定標值的定標數。可實現該方法的一種方式是將每個定標因子表示為一個浮點數,其中尾數是定標數並且相關指數表示定標值。可以選擇尾數或定標數的精確度,以便傳送具有足夠精確度的定標因子。可以選擇指數或定標值的允許範圍,以便為定標因子提供足夠的動態範圍。產生定標信息的處理還可以允許兩個或更多浮點尾數或定標數來共享一個共同指數或定標值。
另一種方法通過相對於某個基值或歸一化值歸一化定標因子來降低信息容量要求。可以在定標信息的編碼和解碼處理之前規定該基值,或者可以自適應地確定它。例如,可以相對於一個時段的音頻信號的最大定標因子來歸一化用於音頻信號的所有頻率子帶的定標因子,或者可以相對於從規定的一組值中選擇的一個值來對它們歸一化。基值的某種指示可以與定標信息包含在一起,以便解碼處理可以撤銷歸一化的作用。
如果定標因子可由在從零到一範圍內的值來表示,在許多實現中可以便於編碼和解碼定標信息所需的處理。如果相對於等於或大於所有可能定標因子的某個基值來歸一化定標因子,那麼可以確保該範圍。作為替換,可以相對於比可合理預期的任何定標因子大的某個基值來歸一化定標因子,並且如果某個意外或罕見事件導致一個定標因子超出該值就將其設置等於一。如果基值被限制為2的冪,那麼歸一化這些定標因子並且撤銷該歸一化的處理可以通過二進位整數運算函數或二進位移位操作有效地實現。
這些方法中的多個可以一起使用。例如,定標信息可以包括歸一化定標因子的浮點表示。
C.信號合成合成信號可以以各種方式產生。
1.頻率變換一種技術通過線性地轉換一個基帶信號的頻譜分量X(k)來產生合成信號的頻譜分量Y(k)。該轉換可以表示為Y(j)=X(k) (4)這裡,差值(j-k)是用於頻譜分量k的頻率變換的量。
當子帶m中的頻譜分量被轉換為頻率子帶p時,編碼處理可以根據下式由頻率子帶m中的頻譜分量的能量度量計算用於頻率子帶p的定標因子SF(p)=E(p)ES(p)=j{p}X2(j)j{p}Y2(j)=j{p}X2(j)k{M}X2(k)---(5)]]>這裡,{P}=頻率子帶p中的所有頻譜分量的集合;以及{M}=被轉換的頻率子帶m中的頻譜分量的集合。
集合{M}不需要包含頻率子帶m中的所有頻譜分量並且頻率子帶m中的一些頻譜分量可以在該集合中被多次表示。這是因為該頻率變換處理可能不轉換頻率子帶m中的一些頻譜分量並且可以多次轉換頻率子帶m中的其他頻譜分量,每次以不同的量轉換。當頻率子帶p與頻率子帶m的頻譜分量的數量不相同時,將出現這些情況之一或兩者。
下面的例子說明了子帶m中的一些頻譜分量被省略而其他分量被多次表示的情況。頻率子帶m的頻率範圍從200Hz到3.5kHz並且頻率子帶p的頻率範圍從10kHz到14kHz。通過將從500Hz到3.5kHz的頻譜分量轉換到從10kHz到13kHz的範圍,其中對每個頻譜分量的轉換量是9.5kHz,並且通過將從500Hz到1.5kHz的頻譜分量轉換到從13kHz到14kHz的範圍,其中對每個頻譜分量的轉換量是12.5kHz,在頻率子帶p中合成一個信號。在該例中集合{M}不包括從200Hz到500Hz的任何頻譜分量,但是包括從1.5kHz到3.5kHz的頻譜分量並且包括從500Hz到1.5kHz的每個頻譜分量兩次。
上面所提到的HFR申請描述了可以包含到編碼系統中以便改進合成信號的感覺質量的其他考慮。一個考慮是根據需要修改轉換的頻譜分量以便確保在已轉換信號中維持一致相位的特徵。在本發明的優選實現中,限制頻率變換的量,以便已轉換分量維持一致相位而不需任何進一步的修改。例如對於使用TDAC變換的實現,這可以通過確保轉換量是一個偶數來實現。
另一個考慮是音頻信號的類似噪聲或類似音調的特徵。在許多情況下,音頻信號的高頻部分比低頻部分更像噪聲。如果低頻基帶信號更像音調並且高頻剩餘信號更像噪聲,那麼頻率變換將產生比原始剩餘信號更像音調的高頻合成信號。信號高頻部分的特徵的改變可能導致可聽得到的劣化,但是通過下面所述的合成技術可以降低或避免劣化的可聽度,這種合成技術使用頻率變換和噪聲產生來保持高頻部分的類似噪聲的特徵。
在一個信號的低頻和高頻部分都類似音調的其他情況下,頻率變換仍然可能導致聽得出的劣化,因為所轉換的頻譜分量不保持原始剩餘信號的諧波結構。通過限制要通過頻率變換合成的剩餘信號的最低頻率可以降低或避免這種聽得到的劣化影響。HFR申請建議用於轉換的最低頻率應該不低於大約5kHz。
2.噪聲產生可以用來產生合成信號的第二種技術是例如通過產生一個偽隨機數序列以表示時域信號的抽樣來合成類似噪聲的信號。這種特定的技術有一個缺點,就是必須使用分析濾波器組來得到所產生的信號的頻譜分量以用於隨後的信號合成。作為替換,可以通過使用偽隨機數產生器直接產生這些頻譜分量來產生類似噪聲的信號。任何一種方法都可以通過下式示意性地表示Y(j)=N(j)(6)這裡,N(j)=類似噪聲的信號的頻譜分量j。
但是根據任何一種方法,編碼處理都可以合成該類似噪聲的信號。產生該信號所需要的附加計算資源增加了編碼處理的複雜性和實現成本。
3.轉換和噪聲用於信號合成的第三種方法是組合基帶信號的頻率變換和合成的類似噪聲信號的頻譜分量。在一個優選實現中,根據在已編碼信號中傳送的噪聲混合控制信息,如在HFR申請中所描述的那樣適配所轉換信號和類似噪聲信號的相對部分。該方法可以表示為Y(j)=a·X(k)+b·N(j)(7)這裡,a=用於所轉換頻譜分量的混合參數;以及b=用於類似噪聲的頻譜分量的混合參數。
在一種實現中,通過取頻譜平坦度量(SFM)的平方根來計算混合參數b,頻譜平坦度量等於頻譜分量值的幾何平均與算術平均的比值的對數,其被定標並且限制在從零到一的範圍內變化。對於這種特定實現,b=1指示類似噪聲的信號。優選地,混合參數a如下式所示從b推導出來
a=c-b2---(8)]]>這裡,c是常數。
在一個優選實現中,公式8中的常數c等於一併且產生類似噪聲的信號,以便它的頻譜分量N(j)具有均值零和統計上等效於與它們組合的轉換頻譜分量的能量度量的能量度量。如公式7所示,合成處理可以混合類似噪聲信號的頻譜分量和所轉換頻譜分量。在該合成信號中的頻率子帶p的能量可以根據下式計算ES(p)=j{P}Y2(j)=k{M},j{P}[aX(k)+bN(j)]2---(9)]]>在一個替換實現中,混合參數表示頻率的規定函數或者它們明確地傳送頻率的函數a(j)和b(j),該函數指示原始輸入音頻信號的類似噪聲特徵如何隨頻率變化。在另一個替換中,為各個頻率子帶提供混合參數,這基於可為每個子帶計算的噪聲度量。
通過編碼和解碼處理執行對合成信號的能量度量的計算。包括類似噪聲的信號的頻譜分量的計算是不希望的,因為僅僅為了執行這些能量計算的目的,該編碼處理必須使用附加的計算資源來合成類似噪聲的信號。編碼處理為任何其他目的並不需要合成信號本身。
上面所述的優選實現允許編碼處理得到公式7中所示的合成信號的頻譜分量的能量度量,而不需合成類似噪聲的信號,因為所合成信號中的頻譜分量的頻率子帶的能量在統計上獨立於類似噪聲的信號的頻譜能量。編碼處理可以僅僅基於所轉換的頻譜分量來計算能量度量。以這種方式計算的能量度量平均來說是實際能量的精確度量。因此,該編碼處理可以根據公式5僅僅從基帶信號的頻率子帶m的能量度量為頻率子帶p計算一個定標因子。
在一個替換實現中,通過已編碼信號而不是定標因子來傳送頻譜能量度量。在該替換實現中,產生類似噪聲的信號,以便它的頻譜分量具有等於零的均值以及等於一的方差,並且定標所轉換頻譜分量,以便他們的方差為一。如公式7所示通過組合分量所得到的合成信號的頻譜能量平均來說等於常數c。解碼處理可以對該合成信號定標,以便具有與原始剩餘信號相同的能量度量。如果常數c不等於一,那麼定標處理還應該考慮該常數。
D.耦合通過在編碼系統中使用耦合,對於解碼信號中的給定感覺信號質量水平,可以達到已編碼信號的信息要求的降低,其中該編碼系統產生表示兩個或更多個聲道的音頻信號的已編碼信號。
1.編碼器圖5和6描述了音頻編碼器,其從路徑9a和9b接收兩個聲道的輸入音頻信號,並且沿路徑51產生表示這兩個聲道的輸入音頻信號的一個已編碼信號。分析濾波器組10a和10b、能量計算器31a、32a、31b和32b、合成模型21a和21b、定標因子計算器40a和40b以及格式化器50的細節和特點基本上與針對圖1中所示的單聲道編碼器的部件所描述的那些相同。
a)共同特點圖5和6中的編碼器類似。在討論不同點之前描述對這兩種實現來說共同的特點。
參照圖5和6,分析濾波器組10a和10b分別沿路徑13a和13b產生頻譜分量,他們表示在第三組頻率子帶中的一個或多個子帶中的各自輸入音頻信號的頻譜分量。在優選實現中,第三組頻率子帶是一個或多個中間頻率子帶,在第一組頻率子帶中的低頻子帶之上並且在第二組頻率子帶中的高頻子帶之下。能量計算器35a和35b各計算在一個或多個頻率子帶中的頻譜能量的一個或多個度量。優選地,這些頻率子帶具有與人聽覺系統的臨界頻帶相當的帶寬,並且能量計算器35a和35b為這些頻率子帶中每一個提供一個能量度量。
耦合器26沿著路徑27產生一個耦合聲道信號,該信號的頻譜分量表示從路徑13a和13b接收的頻譜分量的複合。該複合表示可以以各種方式形成。例如,可以根據從路徑13a和13b接收的相應頻譜分量值的和或平均計算複合表示中的每個頻譜分量。能量計算器37計算在該耦合聲道信號的一個或多個頻率子帶中頻譜能量的一個或多個度量。在一個優選實現中,這些頻率子帶具有與人聽覺系統的臨界頻帶相當的帶寬,並且能量計算器37為這些頻率子帶中每一個提供能量度量。
定標因子計算器44從能量計算器35a、35b和37中每一個接收一個或多個能量度量並且如上所述計算定標因子。沿路徑45a和45b分別傳遞表示用於耦合聲道信號中所表示的每個輸入音頻信號的定標因子的定標信息。可以如上所述編碼該定標信息。在一個優選實現中,如下式中任一個所表示的那樣,為每個頻率子帶中的每個輸入聲道信號計算一個定標因子。
SFi(m)=Ei(m)EC(m)---(10a)]]>SFi(m)=Ei(m)EC(m)---(10b)]]>這裡,SFi(m)=用於信號聲道i的頻率子帶m的定標因子;Ei(m)=用於輸入信號聲道i的頻率子帶m的能量度量;以及EC(m)=用於耦合聲道的頻率子帶m的能量度量。
格式化器50從路徑41a、41b、45a和45b接收定標信息,從路徑12a和12b接收表示基帶信號的頻譜分量的信息,以及從路徑27接收表示該耦合聲道信號的頻譜分量的信息。如上所述將這些信息彙編到一個用於傳輸或記錄的已編碼信號中。
圖5和6中所示的編碼器和圖7中所示的解碼器是雙聲道裝置;但是,本發明的各方面可以應用到用於更多聲道的編碼系統。說明書和附圖提到雙聲道實現僅僅是為了解釋和圖示的方便。
b)不同特點可以將耦合聲道信號中的頻譜分量在解碼處理中用於HFR。在這種實現中,編碼器應該為解碼處理在已編碼信號中提供控制信息,以便在從耦合聲道信號產生合成信號中使用。該控制信息可以以許多方式來產生。
在圖5中描述了一種方式。根據該實現,合成模型21a響應於從路徑12a接收的基帶頻譜分量,並且響應於從路徑13a接收的頻譜分量,後者將通過耦合器26耦合。合成模式21a、相關的能量計算器31a和32a以及定標因子計算器40a以類似於上面討論的計算的方式執行計算。表示這些定標因子的定標信息沿路徑41a傳遞給格式化器50。該格式化器還從路徑41b接收定標信息,該定標信息表示以類似方式為來自路徑12b和13b的頻譜分量所計算的定標因子。
在圖5所示編碼器的一個替換實現中,如上所討論的,合成模型21a獨立於來自路徑12a和13a中任一個或兩者的頻譜分量而操作,並且合成模型21b獨立於來自路徑12b和13b中任一個或兩者的頻譜分量而操作。
在另一個實現中,沒有為耦合聲道信號和/或基帶信號計算用於HFR的定標因子。作為替代,頻譜能量度量的表示傳遞給格式化器50並且包含在已編碼信號中,而不是相應的定標因子的表示。這種實現增加了解碼處理的計算複雜性,因為解碼處理必須計算這些定標因子中至少一些;但是,它降低了編碼處理的計算複雜性。
圖6中描述了另一種產生控制信息的方式。根據該實現,定標部件91a和91b從路徑27接收耦合聲道信號並從定標因子計算器44接收定標因子,並且執行等效於在下面討論的解碼處理中執行的處理的處理以從耦合聲道信號產生去耦信號。這些去耦信號傳遞給合成模型21a和21b,並且以類似於在上面結合圖5所討論的方式計算這些定標因子。
在圖6所示編碼器的一個替換實現中,如果頻譜能量度量和定標因子的計算不需要基帶信號和/或耦合聲道信號的頻譜分量的話,合成模型21a和21b可以獨立於基帶信號和/或耦合聲道信號的頻譜分量進行操作。此外,如果HFR不使用耦合聲道信號中的頻譜分量,那麼合成模型可以獨立於耦合聲道信號進行操作。
2.解碼器圖7描述了一個音頻解碼器,其從路徑59接收表示兩個聲道的輸入音頻信號的一個已編碼信號並且沿路徑89a和89b產生這些信號的解碼表示。去格式化器60、信號合成部件23a和23b、信號定標部件70a和70b以及合成濾波器組80a和80b的細節和特點基本上與上面對圖2中所示的單聲道解碼器的部件描述的那些是相同的。
去格式化器60從該已編碼信號得到一個耦合聲道信號和一組耦合定標因子。該耦合聲道信號沿著路徑64傳遞,其頻譜分量表示在兩個輸入音頻信號中的頻譜分量的複合。用於這兩個輸入音頻信號中每一個的耦合定標因子分別沿路徑63a和63b傳遞。
信號定標部件92a沿路徑93a產生一個去耦信號的頻譜分量,這些頻譜分量近似於在原始輸入音頻信號之一中的相應頻譜分量的頻譜能量水平。通過將該耦合聲道信號中的每個頻譜分量與一個合適的耦合定標因子相乘,可以產生這些去耦頻譜分量。在將該耦合聲道信號的頻譜分量安排到頻譜子帶中並且為每個子帶提供一個定標因子的實現中,可以根據下式產生一個去耦信號的頻譜分量。
XDi(k)=SFi(m)·XC(k) (11)這裡,XC(k)=該耦合聲道信號的子帶m中的頻譜分量k;SFi(m)=用於信號聲道i的頻率子帶m的定標因子;以及XDi(k)=用於信號聲道i的去耦頻譜分量k。
每個去耦信號都傳遞到一個相應的合成濾波器組中。在上述的優選實現中,每個去耦信號的頻譜分量都在第三組頻率子帶中的一個或多個頻率子帶中,該第三組頻率子帶在第一和第二組頻率子帶的頻率子帶的中間。
如果信號合成需要去耦頻譜分量的話,去耦頻譜分量還傳遞到一個相應的信號合成部件23a或23b中。
E.自適應帶化(banding)如上所討論的將頻譜分量安排到兩或三組頻率子帶中的編碼系統可以適配包含在每組中的子帶的頻率範圍。例如,有利的是,在具有被認為是類似噪聲的高頻頻譜分量的輸入音頻信號各時段,降低用於剩餘信號的第二組頻率子帶的頻率範圍的較低端。還可以適配頻率範圍,以便去除一組頻率子帶中的所有子帶。例如,可以通過從第二組頻率子帶中去除所有子帶,對幅度具有大的突然變化的輸入音頻信號禁止HFR處理。
圖3和4描述了一種方式,在該方式下為了任何原因,包括對輸入音頻信號的一個或多個特徵的響應,都可以適配基帶、剩餘和/或耦合聲道信號的頻率範圍。為了實現該特點,圖1、5、6和8中所示的分析濾波器組中每一個都可以由圖3中所示的裝置代替,並且圖2和7中所示的分析濾波器組中每一個都可以由圖4中所示的裝置來代替。這些圖表示了頻率子帶如何適應三組頻率子帶;但是,可以使用同樣的實現原理來適應不同數量的頻率子帶組。
參照圖3,分析濾波器組14從路徑9接收一個輸入音頻信號並且作為響應產生一組頻率子帶信號,傳遞給自適應帶化部件15。信號分析部件17分析直接從輸入音頻信號推導出來的和/或從子帶信號推導出來的信息,並且響應於該分析產生頻帶控制信息。該頻帶控制信息傳遞給自適應帶化部件15,並且它沿路徑18將該頻帶控制信息傳遞給格式化器50。格式化器50將該頻帶控制信息的表示包括在已編碼信號中。
該自適應帶化部件15通過將頻率子帶信號頻譜分量分配給各組頻率子帶來響應該頻帶控制信息。沿路徑12傳遞分配給第一組子帶的頻譜分量。沿路徑11傳遞分配給第二組子帶的頻譜分量。沿路徑13傳遞分配給第三組子帶的頻譜分量。如果存在沒有包含在任何一組中的一個頻率範圍或間隔,那麼通過不分配該範圍或間隔中的頻譜分量給任何一組,就可以達到此目的。
信號分析部件17還可以產生頻帶控制信息以響應於與該輸入音頻信號無關的條件適配頻率範圍。例如,可響應於表示信號質量的期望水平或者傳送或記錄已編碼信號的可用容量的一個信號來適配這些範圍。
頻帶控制信息可以以許多形式產生。在一種實現中,頻帶控制信息規定了頻譜分量要被分配到的每個組的最低和/或最高頻率。在另一種實現中,頻帶控制信息規定了多個預定義頻率範圍安排之一。
參照圖4,自適應帶化部件81從路徑71、93和62接收各組頻譜分量,並且它從路徑68接收頻帶控制信息。通過去格式化器60從已編碼信號得到頻帶控制信息。自適應帶化部件81通過將接收到的各組頻譜分量中的頻譜分量分配到一組頻率子帶信號中來響應頻帶控制信息,該組頻率子帶信號被傳遞給合成濾波器組82。合成濾波器組82響應於頻率子帶信號沿路徑89產生一個輸出音頻信號。
F.第二分析濾波器組在用諸如上面提到的TDAC變換這樣的變換來實現分析濾波器組10的音頻編碼器中根據公式1a計算的頻譜能量度量往往低於輸入音頻信號的真實頻譜能量,因為分析濾波器組僅僅提供了實數值變換係數。使用像離散傅立葉變換(DFT)這樣的變換的實現能夠提供更精確的能量計算,因為每個變換係數都由一個複數值表示,該複數值更精確地傳送每個頻譜分量的真實幅度。
通過使用第二分析濾波器組,可以克服基於從如TDAC變換這樣的變換得到的僅有實數值的變換係數的能量計算的固有不精確性,該第二分析濾波器組具有正交於分析濾波器組10的基底函數的基底函數。圖8示出了一個音頻編碼器,其類似於圖1中所示的編碼器,但是包括第二分析濾波器組19。如果該編碼器使用TDAC變換的MDCT來實現分析濾波器組10,那麼可以使用一個相應的改進離散正弦變換(MDST)來實現第二分析濾波器組19。
能量計算器39根據下式計算頻譜能量的更精確度量E』(k)E(k)=X12(k)+X22(k)---(12)]]>這裡,X1(k)=來自第一分析濾波器組的變換係數k;以及X2(k)=來自第二分析濾波器組的變換係數k。
在為頻率子帶計算能量度量的實現中,能量計算器39根據下式為頻率子帶m計算度量E(m)=k{M}X12(k)+X22(k)---(13)]]>定標因子計算器49以類似於公式3a或3b的方式根據這些更精確能量度量計算定標因子SF』(m)。在公式14中表示了類似於公式3a的計算
SF(m)=E(m)ES(m)=k{M}X12(k)+X22(k)k{M}Y2(k)---(14)]]>當使用根據這些更精確的能量度量計算的定標因子SF』(m)時,應該注意一些。根據更精確定標因子SF』(m)定標的合成信號頻譜分量幾乎肯定會畸變一個信號的基帶部分與再生的合成部分的相對頻譜平衡,因為更精確的能量度量總是大於或等於僅僅從實數值變換係數計算的能量度量。可以補償該差別的一種方式是將更精確的能量度量減半,因為平均來說更精確度量是較低精確度量的兩倍大。這種減小將在一個信號的基帶和合成部分中提供一個在統計上一致的能量水平,同時保持了更精確頻譜能量度量的好處。
可能有用的是指出即使可以從第二濾波器組19得到附加係數,公式14中的比例的分母也應該僅僅根據來自分析濾波器組10的實數值變換係數計算。定標因子的計算應該以這種方式來完成,因為在解碼處理期間執行的定標將基於合成頻譜分量,這些合成頻譜分量僅類似於從分析濾波器組10得到的變換係數。解碼處理將不使用相應於或可以從由第二分析濾波器組19得到的頻譜分量推導出來的任何係數。
G.實現本發明的各方面可以以多種方式實現,包括在通用計算機系統中或者在某種其他設備中的軟體,該其它設備包括更多諸如數位訊號處理器(DSP)電路這樣的專用部件,這些專用部件耦合到類似於在通用計算機系統中可以找到的那些部件的部件上。圖9是可以用來在音頻編碼器或音頻解碼器中實現本發明的各方面的裝置70的框圖。DSP72提供計算資源。RAM 73是用於信號處理的DSP 72所使用的系統隨機存取存儲器(RAM)。ROM 74表示某種形式的永久存儲器,例如只讀存儲器(ROM),用於存儲操作裝置70以及執行本發明的各方面所需要的程序。I/O控制器75表示用來通過通信信道76、77接收和傳送信號的接口電路。模數轉換器和數模轉換器可以根據需要包括在I/O控制器75中,用來接收和/或傳送模擬音頻信號。在所示的實施例中,所有主要系統部件都連接到總線71上,該總線可以表示多於一個的物理總線;但是,實現本發明並不需要總線結構。
在通用計算機系統中實現的實施例中,為了接口到諸如鍵盤或滑鼠和顯示器這樣的裝置上,以及為了控制具有存儲媒體的存儲器裝置,可以包括附加部件,其中存儲媒體例如是磁帶或盤、或光媒體。存儲媒體可用來記錄用於作業系統、實用和應用的指令程序,並且可以包括實現本發明的各方面的程序的實施例。
實踐本發明的各方面所需要的功能可以通過以多種方式實現的部件來執行,這些部件包括分立邏輯部件、集成電路、一個或多個ASIC和/或受程序控制的處理器。實現這些部件的方式對於本發明來說並不重要。
通過多種機器可讀媒體或者基本上使用任何記錄技術傳送信息的存儲媒體可以傳送本發明的軟體實現,機器可讀媒體例如是基帶或包括從超聲波到紫外頻率的整個頻譜中的調製通信路徑,所述記錄技術包括磁帶、卡或盤、光卡或盤以及在像紙張這樣的媒體上的可檢測標記。
權利要求
1.一種用於編碼一個或多個輸入音頻信號的方法,包括接收該一個或多個輸入音頻信號並且從中得到一個或多個基帶信號和一個或多個剩餘信號,其中一個基帶信號的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量,並且在一個相關剩餘信號中的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應輸入音頻信號的頻譜分量;得到將在解碼期間產生的一個或多個合成信號的至少一些頻譜分量的能量度量,其中該一個或多個合成信號具有在該第二組頻率子帶內的頻譜分量;得到每個剩餘信號的至少一些頻譜分量的能量度量;通過得到在所述剩餘信號中的頻譜分量的能量度量與在該一個或多個合成信號中的頻譜分量的能量度量的比值的平方根、在該一個或多個合成信號中的頻譜分量的能量度量與在所述剩餘信號中的頻譜分量的能量度量的比值的平方根、在所述剩餘信號中的頻譜分量的能量度量的平方根與在該一個或多個合成信號中的頻譜分量的能量度量的平方根的比值、或者在該一個或多個合成信號中的頻譜分量的能量度量的平方根與在所述剩餘信號中的頻譜分量的能量度量的平方根的比值,計算定標因子;以及將信號信息和定標信息彙編到已編碼信號中,其中該信號信息表示在該一個或多個基帶信號中的頻譜分量並且該定標信息表示定標因子。
2.根據權利要求1的方法,其中該一個或多個合成信號將至少部分地通過該一個或多個基帶信號中的至少一些頻譜分量的頻率變換來產生。
3.根據權利要求2的方法,合成信號的頻譜分量將通過保持相位相關性的頻率變換來產生。
4.根據權利要求1的方法,其中,將至少部分地通過組合該一個或多個基帶信號中的至少一些頻譜分量的頻率變換和一個或多個類似噪聲的信號的產生來產生該一個或多個合成信號,所述類似噪聲的信號具有根據該一個或多個基帶信號中的譜級適配的譜級,並且其中,在不考慮所述類似噪聲的信號中的譜級的情況下得到在該一個或多個合成信號中的頻譜分量的能量度量。
5.根據權利要求1的方法,其中該一個或多個合成信號將至少部分地通過產生一個或多個類似噪聲的信號來產生。
6.根據權利要求1的方法,其中所述剩餘信號的頻譜分量的能量度量從表示這些頻譜分量的幅度的值得到。
7.根據權利要求6的方法,還包括將第一分析濾波器組應用於該一個或多個輸入音頻信號以得到該一個或多個基帶信號和該一個或多個剩餘信號;以及將第二分析濾波器組應用於該一個或多個輸入音頻信號以得到附加頻譜分量;其中,從所述剩餘信號的頻譜分量和所述附加頻譜分量中的一個或多個計算所述剩餘信號中的頻譜分量的能量度量。
8.根據權利要求1的方法,其中該定標信息表示相對於一個或多個歸一化值被歸一化的定標因子,並且其中該定標信息包括該一個或多個歸一化值的表示。
9.根據權利要求8的方法,其中從一組值中選擇該一個或多個歸一化值。
10.根據權利要求8的方法,其中該一個或多個歸一化值包括定標因子的最大容許值。
11.根據權利要求1的方法,為各個剩餘信號的一個或多個頻率子帶計算一個定標因子。
12.根據權利要求11的方法,其中適配所述各組頻率子帶中一組或多組的頻率範圍,並且其中該方法在該已編碼信號中彙編所適配頻率範圍的指示。
13.根據權利要求12的方法,其中通過從一組範圍中選擇來適配所述頻率範圍。
14.根據權利要求1的用於多個輸入音頻信號的方法,包括從該多個輸入音頻信號得到一個耦合聲道信號,該耦合聲道信號的頻譜分量表示第三組頻率子帶中的所述輸入音頻信號中兩個或更多個的頻譜分量的複合;得到該耦合聲道信號的至少一些頻譜分量的能量度量;得到在該第三組頻率子帶中的耦合聲道信號所表示的所述兩個或更多個輸入音頻信號的至少一些頻譜分量的能量度量;以及通過得到在該兩個或更多個輸入音頻信號中的頻譜分量的能量度量與在該耦合聲道信號中的頻譜能量的能量度量的比值的平方根、在該耦合聲道信號中的頻譜能量的能量度量與在該兩個或更多個輸入音頻信號中的頻譜分量的能量度量的比值的平方根、在該兩個或更多個輸入音頻信號中的頻譜分量的能量度量的平方根與在該耦合聲道信號中的頻譜能量的能量度量的平方根的比值、或者在該耦合聲道信號中的頻譜能量的能量度量的平方根與在該兩個或更多個輸入音頻信號中的頻譜分量的能量度量的平方根的比值,計算耦合定標因子;其中該定標信息還表示這些耦合定標因子並且該信號信息還表示該耦合聲道信號中的頻譜分量。
15.根據權利要求14的方法,其中該一個或多個合成信號將至少部分地通過在該第三組頻率子帶中的輸入音頻信號的至少一些頻譜分量的頻率變換來產生。
16.根據權利要求14的方法,包括檢測該多個輸入音頻信號的一個或多個特性;響應於所檢測的特性,適配該第一組頻率子帶、該第二組頻率子帶或該第三組頻率子帶的頻率範圍;以及在該已編碼信號中彙編所適配頻率範圍的指示。
17.根據權利要求1的方法,包括檢測該一個或多個輸入音頻信號的一個或多個特性;響應於所檢測的特性,適配該第一組頻率子帶或該第二組頻率子帶的頻率範圍;以及在該已編碼信號中彙編所適配頻率範圍的指示。
18.一種用於解碼表示一個或多個輸入音頻信號的已編碼信號的方法,包括從該已編碼信號中得到定標信息和信號信息,其中該定標信息表示從頻譜分量的能量度量的比值的平方根或者頻譜分量的能量度量的平方根的比值所計算的定標因子,並且該信號信息表示一個或多個基帶信號的頻譜分量,其中在每個基帶信號中的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量;為每個相應的基帶信號產生一個相關的合成信號,該合成信號具有該相應基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據一個或多個所述定標因子通過乘法或除法對該相關合成信號中的頻譜分量定標;以及產生一個或多個輸出音頻信號,其中每個輸出音頻信號表示一個相應的輸入音頻信號並且從相應基帶信號及其相關合成信號中的頻譜分量產生。
19.根據權利要求18的方法,其中該相關合成信號至少部分地通過在相應基帶信號中的至少一些頻譜分量的頻率變換來產生。
20.根據權利要求19的方法,其中頻率變換保持相位相關性。
21.根據權利要求18的方法,其中該相關合成信號至少部分地通過產生一個類似噪聲的信號來產生,該類似噪聲的信號具有根據一個或多個所述定標因子適配的譜級。
22.根據權利要求18的方法,從該已編碼信號中得到一個或多個歸一化值並且撤銷所述定標因子相對於該一個或多個歸一化值的歸一化。
23.根據權利要求22的方法,其中通過定標信息在該已編碼信號中傳送該一個或多個歸一化值,該定標信息表示在一組值中的選定值。
24.根據權利要求22的方法,其中該一個或多個歸一化值包括定標因子的最大容許值。
25.根據權利要求18的方法,其中該相關合成信號的頻率子帶與一個相應的定標因子相關。
26.根據權利要求25的方法,響應於在該已編碼信號中傳送的子帶信息適配該相關合成信號的產生,其中該子帶信息規定所述頻率子帶的頻率範圍。
27.根據權利要求26的方法,其中該子帶信息表示在一組範圍中的選定頻率範圍。
28.根據權利要求18的用於解碼表示多個輸入音頻信號的信號的方法,包括從該已編碼信號得到一個耦合聲道信號,該耦合聲道信號的頻譜分量表示第三組頻率子帶中的該多個輸入音頻信號中兩個或更多個的複合,其中該定標信息還表示耦合定標因子,這些耦合定標因子是從以下計算的在該第三組頻率子帶中的該兩個或更多個輸入音頻信號的頻譜分量的能量度量與在該耦合聲道信號中的頻譜能量的能量度量的比值的平方根、在該耦合聲道信號中的頻譜能量的能量度量與在該第三組頻率子帶中的該兩個或更多個輸入音頻信號的頻譜分量的能量度量的比值的平方根、在該第三組頻率子帶中的該兩個或更多個輸入音頻信號的頻譜分量的能量度量的平方根與在該耦合聲道信號中的頻譜能量的能量度量的平方根的比值、或者在該耦合聲道信號中的頻譜能量的能量度量的平方根與在該第三組頻率子帶中的該兩個或更多個輸入音頻信號的頻譜分量的能量度量的平方根的比值;以及從該耦合聲道信號為該耦合聲道信號所表示的該兩個或更多個輸入音頻信號中每一個產生一個相應的去耦信號,其中這些去耦信號具有在該第三組頻率子帶中的頻譜分量,這些頻率分量根據一個或多個所述耦合定標因子通過乘法或除法來定標;其中,還從各個去耦信號中的頻譜分量產生表示該兩個或更多個輸入音頻信號的輸出音頻信號。
29.根據權利要求28的方法,其中該相關合成信號至少部分地通過在該第三組頻率子帶中的至少一些頻譜分量的頻率變換來產生。
30.根據權利要求28的方法,包括從該已編碼信號中得到該第一、第二或第三組頻率子帶的頻率範圍的指示;以及響應於該指示適配合成信號和去耦信號的產生。
31.根據權利要求18的方法,包括從該已編碼信號中得到該第一或第二組頻率子帶的頻率範圍的指示;以及響應於該指示適配合成信號和去耦信號的產生。
32.一種用於編碼多個輸入音頻信號的方法,包括接收該多個輸入音頻信號並且從中得到多個基帶信號、多個剩餘信號以及一個耦合聲道信號,其中一個基帶信號的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量並且一個相關剩餘信號的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應輸入音頻信號的頻譜分量,並且其中該耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個或更多個所述輸入音頻信號的頻譜分量的複合;得到每個剩餘信號和該耦合聲道信號所表示的該兩個或更多個輸入音頻信號的至少一些頻譜分量的能量度量;以及將控制信息和信號彙編到已編碼信號中,其中該控制信息從所述能量度量中推導出來並且其中該信號信息表示在該多個基帶信號和該耦合聲道信號中的頻譜分量。
33.根據權利要求32的方法,包括得到將在解碼期間產生的一個或多個合成信號的至少一些頻譜分量的能量度量,其中該一個或多個合成信號具有在該第二組頻率子帶內的頻譜分量;以及通過計算這些能量度量的比值的平方根或這些能量度量的平方根的比值推導至少一些所述控制信息。
34.根據權利要求33的方法,其中該一個或多個合成信號的至少一些頻譜分量將從該第三組頻率子帶中的頻譜分量合成。
35.根據權利要求32的方法,其中適配所述各組頻率子帶的頻率範圍,並且其中該方法將所適配的頻率範圍的指示彙編到該已編碼信號中。
36.一種用於解碼表示多個輸入音頻信號的已編碼信號的方法,包括從該已編碼信號得到控制信息和信號信息,其中該控制信息是從頻譜分量的能量度量推導出來的並且該信號信息表示多個基帶信號和一個耦合聲道信號的頻譜分量,其中在每個基帶信號中的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量並且該耦合聲道信號的頻譜分量表示該多個輸入音頻信號中兩個或更多個的第三組頻率子帶中的頻譜分量的複合;為每個相應的基帶信號產生一個相關合成信號,該合成信號具有該相應基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據該控制信息對該相關合成信號中的頻譜分量定標;從該耦合聲道信號為該耦合聲道信號所表示的所述兩個或更多個輸入音頻信號中每一個產生一個相應去耦信號,其中去耦信號具有該第三組頻率子帶中的根據該控制信息所定標的頻譜分量;以及產生多個輸出音頻信號,其中每個輸出音頻信號表示一個相應的輸入音頻信號並且是從一個相應基帶信號及其相關合成信號中的頻譜分量產生的,並且其中表示該兩個或更多個音頻信號的輸出音頻信號也是從相應的去耦信號中的頻譜分量產生的。
37.根據權利要求36的方法,其中該控制信息傳送從能量度量的比值的平方根或者能量度量的平方根的比值所計算的定標因子的表示,並且其中在這些比值中的一些能量度量表示所述合成信號的至少一些頻譜分量的能量。
38.根據權利要求37的方法,其中從該第三組頻率子帶中的頻譜分量合成該一個或多個合成信號的至少一些頻譜分量。
39.根據權利要求36的方法,其中響應於該控制信息適配所述各組頻率子帶中的一組或多組的頻率範圍。
40.一種用於編碼一個或多個輸入音頻信號的編碼器,其中該編碼器具有執行信號處理方法的處理電路,該信號處理方法包括接收該一個或多個輸入音頻信號並且從中得到一個或多個基帶信號和一個或多個剩餘信號,其中一個基帶信號的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量,並且在一個相關剩餘信號中的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應輸入音頻信號的頻譜分量;得到將在解碼期間產生的一個或多個合成信號的至少一些頻譜分量的能量度量,其中該一個或多個合成信號具有在該第二組頻率子帶內的頻譜分量;得到每個剩餘信號的至少一些頻譜分量的能量度量;通過得到在所述剩餘信號中的頻譜分量的能量度量與在該一個或多個合成信號中的頻譜分量的能量度量的比值的平方根、在該一個或多個合成信號中的頻譜分量的能量度量與在所述剩餘信號中的頻譜分量的能量度量的比值的平方根、在所述剩餘信號中的頻譜分量的能量度量的平方根與在該一個或多個合成信號中的頻譜分量的能量度量的平方根的比值、或者在該一個或多個合成信號中的頻譜分量的能量度量的平方根與在所述剩餘信號中的頻譜分量的能量度量的平方根的比值,計算定標因子;以及將信號信息和定標信息彙編到已編碼信號中,其中該信號信息表示在該一個或多個基帶信號中的頻譜分量並且該定標信息表示定標因子。
41.一種用於解碼表示一個或多個輸入音頻信號的編碼信號的解碼器,其中該解碼器具有執行信號處理方法的處理電路,該信號處理方法包括從該已編碼信號中得到定標信息和信號信息,其中該定標信息表示從頻譜分量的能量度量的比值的平方根或者頻譜分量的能量度量的平方根的比值所計算的定標因子,並且該信號信息表示一個或多個基帶信號的頻譜分量,其中在每個基帶信號中的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量;為每個相應的基帶信號產生一個相關的合成信號,該合成信號具有該相應基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據一個或多個所述定標因子通過乘法或除法對該相關合成信號中的頻譜分量定標;以及產生一個或多個輸出音頻信號,其中每個輸出音頻信號表示一個相應的輸入音頻信號並且從相應基帶信號及其相關合成信號中的頻譜分量產生。
42.一種用於編碼多個輸入音頻信號的編碼器,其中該編碼器具有執行信號處理方法的處理電路,該信號處理方法包括接收該多個輸入音頻信號並且從中得到多個基帶信號、多個剩餘信號以及一個耦合聲道信號,其中一個基帶信號的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量並且一個相關剩餘信號的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應輸入音頻信號的頻譜分量,並且其中該耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個或更多個所述輸入音頻信號的頻譜分量的複合;得到每個剩餘信號和該耦合聲道信號所表示的該兩個或更多個輸入音頻信號的至少一些頻譜分量的能量度量;以及將控制信息和信號彙編到已編碼信號中,其中該控制信息從所述能量度量中推導出來並且其中該信號信息表示在該多個基帶信號和該耦合聲道信號中的頻譜分量。
43.一種用於解碼表示多個輸入音頻信號的已編碼信號的解碼器,其中該解碼器具有執行信號處理方法的處理電路,該信號處理方法包括從該已編碼信號得到控制信息和信號信息,其中該控制信息是從頻譜分量的能量度量推導出來的並且該信號信息表示多個基帶信號和一個耦合聲道信號的頻譜分量,其中在每個基帶信號中的頻譜分量表示在第一組頻率子帶中的一個相應輸入音頻信號的頻譜分量並且該耦合聲道信號的頻譜分量表示該多個輸入音頻信號中兩個或更多個的第三組頻率子帶中的頻譜分量的複合;為每個相應的基帶信號產生一個相關合成信號,該合成信號具有該相應基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據該控制信息對該相關合成信號中的頻譜分量定標;從該耦合聲道信號為該耦合聲道信號所表示的所述兩個或更多個輸入音頻信號中每一個產生一個相應去耦信號,其中去耦信號具有該第三組頻率子帶中的根據該控制信息所定標的頻譜分量;以及產生多個輸出音頻信號,其中每個輸出音頻信號表示一個相應的輸入音頻信號並且是從一個相應基帶信號及其相關合成信號中的頻譜分量產生的,並且其中表示該兩個或更多個音頻信號的輸出音頻信號也是從相應的去耦信號中的頻譜分量產生的。
44.一種傳送裝置可執行的指令程序的媒體,其中該指令程序的執行導致該裝置執行權利要求1-39中任一個的方法。
全文摘要
一種音頻編碼器丟棄輸入信號的頻譜分量並且使用聲道耦合來降低已編碼信號的信息容量需求。聲道耦合以複合形式表示多個聲道信號的選定頻譜分量。音頻解碼器合成頻譜分量來代替丟棄的頻譜分量並且從耦合聲道信號中產生用於各個聲道信號的頻譜分量。該編碼器在已編碼信號中提供定標因子,這些定標因子可以提高解碼器產生輸出信號的效率,其中這些輸出信號基本上保持了原始輸入信號的頻譜能量。
文檔編號G10L19/02GK1781141SQ200480011250
公開日2006年5月31日 申請日期2004年4月30日 優先權日2003年5月8日
發明者羅伯特·L.·安德森, 麥可·M.·杜魯門, 飛利浦·A.·威廉士, 史蒂芬·D.·弗農 申請人:杜比實驗室特許公司