新四季網

編碼設備和解碼設備的製作方法

2023-05-25 02:30:31 2

專利名稱:編碼設備和解碼設備的製作方法
技術領域:
本發明涉及採用一個諸如正交變換的方法通過用一個較少量的編碼數據流對通過將時域中的音頻信號、例如聲音和音樂信號變換成頻域內的信號所獲得的信號進行編碼來壓縮數據的編碼方法,以及用於在接收到編碼數據流時擴展數據並獲得音頻信號的解碼方法。
背景技術:
目前已經開發出了幾種對音頻信號進行編碼和解碼的方法。特別地,近來,在ISO/IEC中被在國際上標準化的IS13818-7被公知並被高度評價為是一個具有高效率的再現高質量聲音的編碼方法。這個編碼方法被稱為高級音頻編碼(AAC)。近年來,AAC被採用在被稱為MPEG4的標準中,並且已經開發出一個具有添加到IS13818-7的一些擴展功能的被稱為MPEG-4 AAC的系統。在MPEG-4AAC的介紹部分描述了編碼過程的一個例子。
下面是參考圖1對於一個採用常規編碼方法的音頻編碼設備的解釋。圖1是顯示一個常規編碼設備100的結構的方框圖。編碼設備100包括時間—頻率變換單元101、頻譜放大單元102、頻譜量化單元103、霍夫曼編碼單元104和編碼數據流傳輸單元105。以預定時間間隔將一個通過以預定頻率對一個模擬音頻信號採樣而獲得的在時間軸上的數字音頻信號分成各個預定數目的樣本,並通過時間—頻率變換單元101變換成頻率軸上的數據,然後作為到編碼設備100的輸入信號送給頻譜放大單元102。頻譜放大單元102以一個特定增益放大在各個預定波帶中包括的頻譜。頻譜量化單元103用一個預定的變換表達式對放大的頻譜進行量化。在AAC方法的情況下,量化是通過將以浮點表示的頻譜數據捨入成一個整數值來進行的。霍夫曼編碼單元104根據霍夫曼編碼對其一組特定條中的量化的頻譜數據進行編碼,並根據霍夫曼編碼對頻譜放大單元102中的各個預定頻帶中的增益以及指定用於量化的變換表達式的數據進行編碼,然後將其代碼發送到編碼數據流傳輸單元105。將霍夫曼編碼的數據流從編碼數據流傳輸單元105通過一個傳輸信道或一個記錄介質傳輸到一個解碼設備,並由解碼設備重構為時間軸上的音頻信號。常規的編碼設備的操作即如上所述。
然而,在常規的編碼設備100中,壓縮數據量的能力取決於霍夫曼編碼單元104或類似單元的性能,因此在以高壓縮率、即以少量數據進行編碼時,需要充分提高頻譜放大單元102中的增益,並對由頻譜量化單元103獲得的量化的頻譜流編碼,以使其是霍夫曼編碼單元104中的一個較少量的數據。依據這個方法,如果編碼是為了使數據量更少而進行的,則用於再現的聲音和音樂的頻率帶寬實際上變得很窄。因此,不能否定,聲音和音樂對於人的聽覺來說將是沙啞的。其結果是,不可能保持聲音質量。這是一個問題。
並且,在常規的編碼設備100內,在時間—頻率變換單元101中以每個預定間隔(樣本數)將在時間軸上表示的輸入信號變換成頻率軸上表示的頻譜。因此,在這個後一階段用於編碼的量化的信號是頻率軸上的頻譜。對一個量化過程來說,通過例如將頻譜數據中的小數點值捨入成一個整數值的處理而具有一些量化誤差是不可避免的。與在頻率軸上容易估計在信號中產生的量化誤差這個事實相反的是,在時間軸上則是困難的。由於這一點,不容易通過估計在時間軸上反映的量化誤差來提高編碼設備的時間分辨能力。並且,如果可分配給編碼的數據量足夠多,則有可能提高頻率分辨能力和時間分辨能力。但如果分配用於編碼的數據量較小,則在這兩方面提高都是非常困難的。
考慮到上述問題,本發明的目的在於提供一種能夠以高級別的時間分辨能力以高壓縮比對一個音頻信號編碼的編碼設備,以及一種能夠對寬頻帶上的頻譜數據解碼的解碼設備。

發明內容
依據本發明的編碼設備是一個對通過依據時間—頻率變換來變換一個輸入初始信號而獲得的在頻域中的信號進行編碼、並產生一個輸出信號的編碼設備,包括第一頻帶指定單元,可用於基於輸入初始信號的特性為一部分頻譜指定一個頻帶;時間變換單元,可用於根據頻率—時間變換將指定頻帶中的一個信號變換成一個信號;以及,編碼單元,可用於對由時間變換單元獲得的信號和至少一部分頻譜進行編碼,並從編碼信號和編碼頻譜產生一個輸出信號。
並且,本發明的解碼設備是一個對通過對一個輸入初始信號編碼而獲得的編碼數據流進行解碼、並輸出一個頻譜的解碼設備,包括解碼單元,可用於提取在輸入編碼數據流中包含的編碼數據流的一部分,並對提取出的編碼數據流解碼;頻率變換單元,可用於將通過對提取出的編碼數據流解碼而獲得的信號變換成一個頻譜;以及,合成單元,可用於在頻率軸上合成通過對從輸入編碼數據流的其他部分提取出的編碼數據流解碼而獲得的一個頻譜和由頻率變換單元獲得的頻譜。
如上所述,依據本發明的編碼設備和解碼設備,通過在時域中的編碼之外還增加時域中的編碼,變得能夠以較高的編碼效率選擇一個域中的編碼並減少所輸出的編碼數據流的比特量。此外,通過增加時域中的編碼,變得容易提高時間分辨能力以及頻率分辨能力。
並且,依據本發明的編碼設備和解碼設備可以以低比特率提供一個寬頻帶的編碼音頻數據流。對於較低頻率區域中的一個分量,其頻率的微觀結構通過採用一個諸如霍夫曼編碼的壓縮技術來編碼。對於較高頻率區域中的一個分量,只對通過用較低頻率區域中的頻譜替代較高頻率區域中的頻譜而再現的主要數據進行編碼,而不對其微觀結構編碼,以使得由高頻中的分量的編碼所使用的數據量可以最少。
依據本發明的解碼設備,由於高頻區域中的分量是通過在再現音頻信號時在解碼過程中處理較低頻率區域中的頻譜的再現而產生的,所以可以容易地由低比特率來實現,並且可以在比由常規解碼設備以同一比率再現的更寬的頻帶中再現聲音。


圖1是顯示常規編碼設備的結構的方框圖。
圖2是顯示依據本發明的第一實施例的解碼設備的結構的方框圖。
圖3是顯示由圖2所示的時間—頻率變換單元進行的時間—頻率變換的一個例子的示意圖。
圖4A是顯示輸入到時間—頻率變換單元中的時域中的一個音頻信號的示意圖。在該示意圖中,假定根據頻率變換在某一時刻要變換一個在等效於第N幀的一部分中的信號。
圖4B是顯示對圖4A所示的第N幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的一個頻譜。
圖5A是顯示與圖4A在同一時間軸上的音頻信號的第N幀是如何被分成用於其第一半的子幀1和用於其第二半的子幀2的示意圖。
圖5B是顯示通過將圖5A所示的子幀1中的時域中的音頻信號變換成頻域中的一個信號而獲得的頻譜的示意圖。
圖5C是顯示通過將圖5A所示的子幀2中的時域中的音頻信號變換成頻域中的一個信號而獲得的頻譜的示意圖。
圖6A是顯示與圖4A相同的時域中的音頻信號(第N幀)是如何被分成(M+1)段子幀的示意圖。
圖6B是顯示通過將一幀中的音頻輸入信號分成(M+1)段子幀並由每個子幀執行時間—頻率變換而獲得的頻譜的示意圖。
圖7A是顯示通過對一幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的頻譜上的頻帶BandA中包含的樣本的示意圖。
圖7B是顯示通過將一幀中的音頻輸入信號分成(M+1)段並由每個子幀對其執行時間—頻率變換而獲得的頻譜上的頻帶BandB中包含的樣本的示意圖。
圖8A是顯示通過對一幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖8B是顯示通過將一幀中的音頻輸入信號分成(M+1)段子幀並由每個子幀對其執行時間—頻率變換而獲得的頻譜上的頻帶BandD中的樣本的示意圖。
圖9A是顯示通過對一幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的頻譜上的頻帶BandC中的樣本的示意圖。
圖9B是採用水平軸上的時間和垂直軸上的頻譜係數為圖8B所示的每個樣本(頻譜係數)重繪的示意圖。
圖10是顯示由圖2所示的編碼數據流產生單元對一個時間—頻率信號編碼的示意圖。
圖11是顯示時間—頻率變換單元的一個輸出信號是如何對應於指示由一個時間變換單元依據時間變換而變換的頻帶的數據的示意圖。
圖12是顯示依據本發明的第一實施例的解碼設備的結構的方框圖。
圖13是顯示依據本發明的第二實施例的編碼設備的結構的方框圖。
圖14是顯示參考其他頻帶在一個目標頻帶中產生一個編碼數據流的方法的一個例子的示意圖。
圖15是顯示參考其他頻帶在目標頻帶中產生編碼數據流的方法的另一個例子的示意圖。
圖16是顯示參考其他頻帶在目標頻帶中產生編碼數據流的方法的其他例子的示意圖。
圖17是顯示通過採用一個參考頻帶中的已經被量化和編碼的編碼數據流將一個目標域中的頻譜在頻域中合成的方法的一個例子的示意圖。
圖18是顯示通過採用一個參考頻帶中的已經被量化和編碼的編碼數據流將一個目標域中的頻譜在時域中合成的方法的一個例子的示意圖。
圖19A是顯示一個指示通過將一個作為參考頻帶的頻帶A的頻域中的一個信號變換成時域中的信號而獲得的一個信號的向量Ta的示意圖。
圖19B是顯示一個指示通過將一個作為參考頻帶的頻帶B的頻域中的一個信號變換成時域中的信號而獲得的一個信號的向量Tb的示意圖。
圖19C是對於通過在向量Ta上施加一個增益控制來指示一個近似於向量Tb的向量的情況,顯示一個近似向量Tb』的示意圖。
圖20是顯示依據第二實施例的解碼設備的結構的方框圖。
圖21A是顯示由圖2所示的編碼數據流產生單元產生的編碼數據流的數據結構的一個例子的示意圖。
圖21B是顯示由圖13所示的編碼數據流產生單元產生的編碼數據流的數據結構的一個例子的示意圖。
具體實施例方式
下面將參考附圖(圖2~圖20)解釋依據本發明的實施例的編碼設備和解碼設備。
(第一實施例)圖2是顯示依據本發明的第一實施例的編碼設備200的結構的方框圖。編碼設備200是一個提取出在時間軸上表示的音頻輸入信號的時間特性並在基於提取出的時間特性將一個頻譜的一部分部分地變換成時域中的一個頻率信號之後編碼的編碼設備,包括時間—頻率變換單元201、頻率特性提取單元202、時間特性提取單元203、時間變換單元204和編碼數據流產生單元205。
時間—頻率變換單元201將音頻輸入信號從時間軸上的一個離散信號變換成具有規則間隔的頻譜數據。更具體地,時間—頻率變換單元201例如基於作為一單位的一幀(1024個樣本)變換在時域中的某一時刻的音頻信號,並作為變換結果為1024個樣本或類似產生一個頻譜係數。MDCT變換或類似被用作時間—頻率變換,並作為變換結果產生一個MDCT係數或類似。從其向時間變換單元204輸出由時間特性提取單元203指定的頻帶中的多個頻譜係數,並向頻率特性提取單元202輸出頻帶中的其他頻譜係數。
頻率特性提取單元202提取出頻譜的頻率特性,基於提取出的特性對於頻域中的量化和編碼的情況選擇一個帶有較差的編碼效率的頻帶,將其從由時間—頻率變換單元201輸出的頻譜劃分出來,並將其輸出到時間變換單元204。將除此之外的頻帶的頻譜輸入到編碼數據流產生單元205。
時間特性提取單元203分析音頻輸入信號的時間特性,判定當在編碼數據流產生單元205進行量化時是時間分辨能力優先還是頻率分辨能力優先,並指定一個其中判定時間分辨能力優先的頻帶。時間變換單元204採用一個全部可逆的變換表達式將在其中判定時間分辨能力優先的頻帶中的頻譜和由頻率特性提取單元202選擇的頻帶中的頻譜變換成一個被指示為頻譜係數中的時間改變的時間—頻率信號。在因而量化了從時間—頻率變換單元201輸入的頻譜以及從時間變換單元204輸入的時間—頻率信號之後,編碼數據流產生單元205對其進行編碼。此外,編碼數據流產生單元205將諸如標題的附加數據附在編碼數據上,並根據一個預定格式產生一個編碼數據流,將產生的編碼數據流輸出到編碼設備200的外部。
圖3是顯示由圖2所示的時間—頻率變換單元201進行的時間—頻率變換的一個例子的示意圖。例如,如圖3所示,時間—頻率變換單元201以允許一些重疊的規則的時間間隔在時間軸上劃分離散信號,並執行變換。與第N幀(N是一個正整數)形成對比,圖3顯示了通過允許第(N+1)幀的一半與第N幀重疊來提取出第(N+1)幀並對其進行變換的情況。一般來說,時間—頻率變換單元201通過改進的離散餘弦變換(MDCT)來變換數據。然而,時間—頻率變換單元201的變換方法並不限於MDCT。它可以是多相濾波器或傅立葉變換。由於相關領域技術人員熟悉MDCT、多相濾波器和傅立葉變換中的任何一種,因此這裡省略對它們的解釋。
圖4A是顯示輸入到時間—頻率變換單元201的時域中的音頻信號的示意圖。假設在同一圖中在某一時刻對在等效於第N幀的部分中的信號進行了頻率變換。圖4B是顯示通過對圖4A所示的第N幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的一個頻譜的示意圖。這個示意圖是採用垂直軸上的頻率和水平軸上的用於該頻率的頻譜係數值而繪出的。如圖所示,對於第N幀的時域中的信號被變換成頻域中的信號。圖4B所示頻譜指示在圖4A所示的一幀持續時間內在音頻信號中包含的一個頻率分量的特性。當在時間—頻率變換單元201中採用MDCT時,時域中的信號和頻域中的信號具有相同數目的有效樣本。關於有效樣本的數目,在MDCT的情況下,如果圖4A所示的第N幀中的樣本數目是2048個樣本,則圖4B所示的獨立頻率係數(MDCT係數)的數目是1024個樣本。然而,因為MDCT是一種如圖3所示各幀由其他幀的一半覆蓋的算法,因此在圖4A中新輸入的樣本數目是1024個樣本。因此,圖4A和圖4B中的樣本數目在每個數據量方面被認為是相同的,因此基於這一點將有效樣本的數目看作是1024。第N幀中的有效樣本的數目可以如上所述是1024,但也可以是128或其他任何任意值。這個值是在本發明的編碼設備200和解碼設備之間預先確定的。
另一方面,除了時間—頻率變換單元201之外,音頻輸入信號還被輸入到時間特性提取單元203。時間特性提取單元203分析一個給定音頻輸入信號的時間改變,並在音頻輸入信號被量化時判定是時間分辨能力應該被優先還是頻率分辨能力應該被優先。也就是說,時間特性提取單元203判定音頻輸入信號應該在頻域還是在時域中被量化。這意味著當量化發生在時域中時,音頻輸入信號的時間改變由時域中的信號通知給解碼設備。這進一步基於下面的事實a)量化帶有一些量化誤差;以及b)雖然當量化發生在頻域時,誤差可以存在於頻域中的一特定值範圍內,但難以掌握誤差分布在時域中的哪一值範圍內。這是由於當量化在頻域中進行時可以執行高頻率分辨能力、而當量化發生在時域中時可以執行高時間分辨能力的原因。並且,當一幀給定音頻輸入信號被分成多個時間子幀時,在屬於每個子幀的信號的平均能量與其相鄰子幀的平均能量相比有大的改變的情況下,假設在音頻輸入信號的音量上已經有一個迅速的改變,例如一個衝擊。在這種情況下,量化誤差在時域上散布不是更可取的。由於這一點,時間特性提取單元203判定在這樣的頻帶上的量化上給予時間分辨能力比頻率分辨能力高的優先權。根據編碼設備的實施方法定義時間特性提取單元203在判定平均能量中的改變大時所使用的閾值(例如,對於在相鄰子幀之間的平均能量差的閾值)。然後,時間特性提取單元203為音頻輸入信號指定一個應該在時域中對其完成量化的頻帶。頻帶和帶寬的選擇不限於上面的情況。關於指定頻帶的方法,首先,指定在時域中的一個包含一個給出最大振幅的樣本的信號(峰值信號),並計算峰值信號的頻率。此外,時間特性提取單元203例如根據峰值信號的大小確定一個帶寬,並指定具有所確定的帶寬的一個頻帶,包括作為計算結果而獲得的頻率或一個與其接近的頻率。在時間特性提取單元203中,將對於時間分辨能力被優先還是頻率分辨能力被優先的判定結果以及指示指定頻帶的數據輸出到時間—頻率變換單元201和編碼數據流產生單元205。
頻率特性提取單元202分析作為時間—頻率變換單元201的輸出信號的頻譜的特性,並指定一個最好在時域中被量化的頻帶。例如,考慮編碼數據流產生單元205中的編碼效率,有編碼效率在一個其中相鄰頻譜係數在頻譜中廣泛散布的頻帶或一個其中相鄰頻譜係數的正負代碼被頻繁切換或類似的頻帶中未被提高的多個情況。因此,頻率特性提取單元202從輸入的頻譜對一個可用於這些的頻帶採樣,將其輸出到時間變換單元204,並且還將一個不可應用於這些的頻帶象現在這樣輸出到編碼數據流產生單元205。同時,將指定輸出到時間變換單元204的頻帶的數據輸出到編碼數據流產生單元205。
在編碼數據流產生單元205,合併頻率特性提取單元202的輸出信號(指定頻譜和頻帶的數據)、時間特性提取單元203的判定結果和指定頻帶的數據以及時間變換單元204的輸出信號(一個頻率—時間信號),並產生編碼數據流。
圖5A是顯示在與圖4A中的一個相同的時間軸上的音頻信號中如何將一個第N幀分成用於其第一半的子幀1和用於其第二半的子幀2的示意圖。雖然示意圖顯示了子幀1和子幀2具有相同長度的情況,但其長度不必是相同的,或者可以彼此重疊。此後,恰如圖5所示,採用子幀1和子幀2具有相同長度的情況來簡化解釋。
圖5B是顯示通過將圖5A所示的子幀1的時域中的音頻信號變換成頻域中的一個信號而獲得的頻譜的示意圖。圖5C是顯示通過將圖5A所示的子幀2的時域中的音頻信號變換成頻域中的一個信號而獲得的頻譜的示意圖。從時域到頻域的變換是僅僅採用每個子幀中的音頻信號來進行的,並假定由變換獲得的頻域中的信號(頻譜)通過執行其逆變換(頻率—時間變換)將被完全恢復成時域中的初始信號。有離散傅立葉變換和離散餘弦變換可用作這種頻率變換方法。由於它們與相關領域技術人員所熟悉的類似,所以這裡省略其說明。前面提到的MDCT變換是將具有時間上的一些相互重疊的一幀中的時域中的信號變換成頻域中的一個信號。然而,這引起用於重構時域中的信號的延遲,使得它不能用於導出圖5B和圖5C中的頻譜的情況。由於引起一個延遲的同樣的原因,不使用多相濾波器或類似方法。
由於圖5B和圖5C中的第N幀中的頻譜被分成幀的第一半和第二半,在子幀1和子幀2中分別包含的樣本數等於該幀中的樣本數量的一半。圖5A和圖5B中的頻譜的樣本數分別等於幀中的樣本數量的一半,因此這些圖在頻率軸方向以樣本的雙倍間隔顯示了與圖4B所示頻帶相同頻帶中的頻率分量的比率中的改變。如圖4B所示,當在某一時刻對該幀中的音頻輸入信號執行時間—頻率變換時,獲得了顯示出在該幀中的整個音頻輸入信號中包含的頻率分量的一個比率的頻譜。但如圖5B和5C所示,如果該幀中的音頻輸入信號被分成根據時間—頻率變換將其分別變換成的第一半和第二半,則顯然在每部分音頻信號中包含的頻率分量的比率在音頻輸入信號的第N幀的第一半和第二半之間是不同的。也就是說,圖5B和圖5C所示的頻譜表明了在第N幀的第一半和第二半中的音頻信號的頻率分量的比率中的時間改變。
上述的圖5B和圖5C顯示了在將第N幀分成兩個子幀並對每個子幀執行時間—頻率變換的情況下的頻譜的例子。下面參考圖6A和圖6B描述將第N幀進一步分成(M+1)段更小的子幀的情況。圖6A是顯示如何將與圖4A相同的時域中的音頻信號(第N幀)分成(M+1)段子幀的示意圖。圖6B是顯示通過將一幀中的音頻輸入信號分成(M+1)段子幀並對每個子幀執行時間—頻率變換而獲得的頻譜的示意圖。在圖6A和圖6B中,將在任意位置(例如,第P個位置(P是一個整數))的子幀的時域中的一個信號SubP變換成一個由至少相同數目的樣本或更多樣本組成的頻譜係數Spect_SubP。下面假設將其變換成包含相同數目的樣本的頻譜以簡化解釋。以與此類似的方式,當圖6B所示的(M+1)段頻譜(頻譜係數Spect_Sub0~頻譜係數Spect_SubM)與圖5B和圖5C所示的頻譜相比較,雖然樣本間隔在頻率軸方向上變得更寬,但在時間軸方向上更詳細地指示了第N幀的頻率分量中的時間改變。
接著,下面採用圖7A和圖7B描述通過對一幀中的音頻輸入信號執行時間—頻率變換而獲得的頻譜如何對應於通過由每個子幀執行時間—頻率變換而獲得的頻譜。圖7A是顯示在通過對該幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的頻譜上的頻帶BandA中包含的一個樣本的示意圖。圖7A的頻譜與圖4B所示的頻譜相同。並且,圖7B是顯示在通過將該幀中的音頻輸入信號分成(M+1)段子幀並由每個子幀執行時間—頻率變換而獲得的頻譜上的頻帶BandB中包含的一個樣本的示意圖。也就是說,圖7B中的頻譜與圖6B中所示的頻譜相同。圖7A中的頻譜的頻帶BandA和圖7B中的頻譜的頻帶BandB指示相同的頻帶區域。也就是說,在整個幀中,在頻帶BandA中包含的樣本數等於在頻帶BandB中包含的樣本數。這表明圖7A的頻帶BandA中的頻譜係數的數據(圖中的黑菱形)等效於圖7B的頻帶BandB中的所有子幀中的頻譜係數中的一個(圖中的黑菱形)。這裡,不需要通過以一個變換表達式對頻帶BandA中的頻譜係數執行時間變換來獲得與頻帶BandB中的頻譜係數完全一致的頻譜係數。頻帶BandA中的頻譜係數等效於頻帶BandB中的頻譜係數是重要的。因此,可以考慮用表達在頻帶BandB中的所有子頻帶中的樣本(頻譜係數)來替代對頻帶BandA中的每個樣本(頻譜係數)的描述。也就是說,在依據本發明的第一實施例的編碼設備200中,對於其中判定時間分辨能力被優先的頻帶BandA,頻帶BandB中的頻譜係數被量化和編碼,而不是對頻帶BandA中的頻譜係數量化和編碼。也就是說,時間變換單元204例如對由時間—頻率變換單元201獲得的頻譜中的其中判定時間分辨能力被優先的頻帶BandA執行一個等效於DCT變換的逆變換(頻率—時間變換)的變換表達式,並輸出一個等效於圖7B所示的頻帶BandB中的所有樣本(頻譜係數)的頻譜係數。
依據圖7A和圖7B所指示的頻帶BandA和頻帶BandB的帶寬,為了更好地理解對於時間變換單元204的時間變換方法的解釋,下面利用圖8A和圖8B描述當將頻帶BandD的帶寬選擇為在每個子頻帶中剛好具有屬於頻帶BandD的一段樣本時的情況。圖8A是顯示通過對一幀中的音頻信號執行時間—頻率變換而獲得的頻譜上的頻帶BandC中的一個樣本的示意圖。圖8B是顯示通過將一幀中的音頻輸入信號分成(M+1)段子幀並由每個子幀對其執行時間—頻率變換而獲得的頻譜上的頻帶BandD中的一個樣本的示意圖。圖8A中的頻譜與圖4B中所示的頻譜相同,圖8B中的頻譜與圖6B中所示的頻譜相同。並且,圖8A中的頻譜中的頻帶BandC和圖8B中的頻譜中的頻帶BandD顯示了相同的頻帶。在圖8B中,當將頻帶BandD的帶寬選擇為在每個(M+1)段子頻帶中具有屬於頻帶BandD的一段樣本(頻譜係數)時,與圖8A所示的頻譜中的頻帶是同一頻帶的頻帶BandC中的樣本數是(M+1)段。因為屬於圖8B所示的頻帶BandD的每個樣本是從每個(M+1)段子幀選擇出的,如果採用水平軸上的時間和垂直軸上的頻譜係數繪出每個樣本,則可以說它指示了在音頻信號的一幀中的屬於頻帶BandC中的頻譜係數中的時間改變。
與圖8A類似,圖9A是顯示通過對一幀中的音頻信號在某一時刻執行時間—頻率變換而獲得的頻譜上的頻帶BandC中的一個樣本的示意圖。圖9B是採用水平軸上的時間和垂直軸上的頻譜係數值為圖8B所示的每個樣本(頻譜係數)重繪的示意圖。已經解釋過,如圖9B所示的重繪的、通過在同一頻帶BandD中的(M+1)段子幀的每一個提取出一個樣本而組成的信號等效於由時間變換單元204獲得的時間—頻率信號,並且是指示有關頻帶BandD的頻譜係數的時間改變的時間—頻率信號。如上所述,圖9A所示的頻帶BandC中的每個樣本(頻譜係數)可以被看待為與圖9B中的時間—頻率信號(頻帶BandD)幾乎相同的數據。因此,在下面的解釋中,將量化圖9A中的頻譜係數指示為「執行Qf」,將量化圖9B中的時間—頻率信號指示為「執行Qt」。
在依據本發明的第一實施例的編碼設備200內的圖2所示的時間變換單元204中,由時間—頻率變換單元201獲得的頻譜的頻譜係數的一部分、即在圖9A中的頻帶BandC中包含的頻譜係數流被變換成圖9B中的時域中的時間—頻率信號。經過這個變換等效於從圖8A中的頻帶BandC中包含的頻譜係數流到圖8B中的頻帶BandD中包含的頻譜係數流的變換,這已經在前面解釋過了。或者,等效於從圖7A中的頻帶BandA中的頻譜係數流到圖7B 中的頻帶BandB中的頻譜係數流的變換。
圖2所示的編碼數據流產生單元205對經過如上變換的來自時間—頻率變換單元201的輸出和來自時間變換單元204的輸出進行量化和編碼,並輸出編碼數據流。關於編碼數據流產生單元205中的量化和編碼的具體方法,使用諸如霍夫曼編碼和向量量化的公知技術。
並且,編碼數據流產生單元205可以將位於具有較小振幅波動的一部分中的時間—頻率信號的幾段樣本分成組,然後對每組的平均增益進行量化和編碼。圖10是顯示由圖2所示的編碼數據流產生單元205對時間—頻率信號的編碼的示意圖。如圖10所示,編碼數據流產生單元205例如分別為一個從頻譜係數Spec_Sub_0到頻譜係數Spec_Sub_2的樣本組和一個從頻譜係數Spec_Sub_3到頻譜係數Spec_Sub_M的樣本組找到平均增益Gt1和平均增益Gt2,並對指定每個樣本組和每個組中的平均增益的數據進行量化和編碼,而不是對從頻譜係數Spec_Sub_0到頻譜係數Spec_Sub_M的時間—頻率信號本身進行量化和編碼。在這種情況下,如果時間—頻率信號在編碼設備200和對從編碼設備200輸出的編碼數據流解碼的解碼設備之間被預先限定為例如表達為「樣本組中的第一樣本號,樣本組中的最後一個樣本號,樣本組中的平均增益」,則圖10所示的時間—頻率信號可以表達為兩個數據組(0,2,Gt1)和(3,M,Gt2)。並且,在這種情況下,不需要為時間—頻率信號將全部每個樣本都聚集起來。可以只將在具有較小振幅波動的部分中的樣本聚集起來。對於具有極端(radical)振幅波動的部分,每個樣本中的頻譜係數值本身可以被量化和編碼。
此外,在編碼數據流產生單元205中,指示哪個頻帶被進行時間變換的數據與時間—頻率變換單元201的輸出中的編碼數據流一起輸出。圖11是顯示時間—頻率變換單元201的一個輸出信號是如何對應於指示由時間變換單元204進行了時間變換的頻帶的數據的示意圖。在同一圖中,垂直軸顯示頻率,水平軸顯示對應於垂直軸上的頻率的頻譜係數。在時間—頻率變換單元201中採用MDCT變換的情況下,頻譜係數在同一圖中指示MDCT係數。並且,在作為時間—頻率變換單元201的輸出信號的頻譜中,虛線所示部分是未被編碼數據流產生單元205量化和編碼的部分。相反,在編碼數據流產生單元205中,對應於這個頻帶的時間—頻率信號被量化和編碼。同一圖描述了對於將頻率軸方向分成5個頻帶、並從其低頻開始按照Qf、Qt、Qf、Qt和Qf的順序進行量化的情況的一個例子。這樣,從編碼數據流產生單元205輸出的編碼數據流至少包括指示每個頻帶是在時域中還是在頻域中被量化和編碼的數據以及在每個頻帶中被編碼和量化的數據。頻帶劃分的數目和在編碼設備200中的用於每個頻帶的量化方法(即,是Qf還是Qt)不是固定的,並不限於這個例子。
圖12是顯示依據本發明的第一實施例的解碼設備1200的結構的方框圖。這個解碼設備1200是一個對編碼設備200輸出的編碼數據流解碼、並輸出一個具有高級別的時間分辨能力的音頻信號的解碼設備,包括編碼數據流分離單元1201、時間—頻率信號產生單元1202、頻率變換單元1 203、頻譜產生單元1204和頻率—時間變換單元1205。編碼數據流分離單元1201從作為輸入信號的編碼數據流分離出在指示為「Qf」的頻帶中的編碼數據和在指示為「Qt」的頻帶中的編碼數據,將在指示為「Qf」的頻帶中的編碼數據輸出到頻譜產生單元1204,將在指示為「Qt」的頻帶中的編碼數據輸出到時間—頻率信號產生單元1202。在指示為「Qf」的頻帶中的編碼數據是在編碼設備200中在頻域量化和編碼的數據。在指示為「Qt」的頻帶中的編碼數據是在編碼設備200中在時域量化和編碼的數據。
頻譜產生單元1204對輸入的編碼數據解碼,進一步對其反量化,並產生頻率軸上的一個頻譜。另一方面,時間—頻率信號產生單元1202對輸入的編碼數據解碼,對其反量化,並在時間上產生時間軸上的一個時間—頻率信號。在時間上產生的時間—頻率信號被輸入到頻率變換單元1203。頻率變換單元1203通過採用一個等效於由編碼設備200的時間變換單元204所採用的變換表達式的逆變換的變換表達式以數目小於一幀中的樣本數的多個樣本為單位將輸入的時間—頻率信號從時域中的頻譜係數變換到頻域中的頻譜係數。將指示時間—頻率信號中所表達出的時間改變的數據反映在作為依據上面的描述對該幀的部分變換的結果而獲得的頻譜係數上,並將這個頻譜係數輸出到頻率—時間變換單元1205。在頻率—時間變換單元1205中,將作為頻譜產生單元1204和頻率變換單元1203的輸出信號的頻域中的頻譜在頻率軸上合成,並變換成在時間軸上的一個音頻信號。這樣,由時間—頻率信號表達的時間分量可以反映在從頻譜產生單元1204輸出的頻譜上,並且可以獲得一個具有高時間分辨能力的音頻信號。在頻率—時間變換單元1205,使用一種是在編碼設備200進行的時間—頻率變換單元201的逆過程的變換方法。例如,如果在編碼設備200中的時間—頻率變換單元201中使用MDCT變換,則在頻率—時間變換單元1205中使用逆MDCT變換。以這種方式獲得的頻率—時間變換單元1205的輸出例如是一個由電壓上的離散時間改變所表達的一個音頻輸出信號。
如上所述,依據本發明的第一實施例中的編碼設備200和解碼設備1200,可以選擇是在時域還是在頻域中對一個任意頻帶的一特定時間幀中的音頻信號進行編碼。因此,這個方法提供了比僅僅在頻域中的編碼方法或僅僅在時域中的編碼方法更靈活和更有效的數據編碼的可能性。其結果是,使得能夠在一給定量的數據內對許多數據編碼,並實現高質量的再現音頻信號。
雖然在第一實施例中時間特性提取單元203判定當子幀之間的平均能量的改變(即,相鄰子幀之間的差)大於預先限定的閾值時時間分辨能力應該被優先,但時間特性提取單元203判定是時間分辨能力被優先還是頻率分辨能力被優先的判決標準並不限於上述方法。並且,在上面的實施例中,雖然頻率特性提取單元202判定對於其中鄰接頻譜係數在頻譜上廣泛散布的頻帶或其中正負代碼被頻繁切換的頻帶應該實現時域中的量化,但對這個判決的判決標準也不限於上述方法。
(第二實施例)下面描述本發明的第二實施例。第二實施例中的量化和編碼方法與第一實施例中的不同。在第一實施例中,對於由每幀變換到頻域中的音頻輸入信號,該幀中的一特定頻帶中的信號象現在這樣被量化,但另一個頻帶中的信號被重新變換到時域中,然後量化時域中的信號。在本發明的第二實施例中,不是僅僅用選定頻帶中的信號實現量化和編碼,而是由其他頻帶中的信號執行量化和編碼。
圖13是顯示依據本發明的第二實施例的編碼設備1300的結構的方框圖。編碼設備1300包括時間—頻率變換單元1301、頻率特性提取單元1302、時間特性提取單元1303、量化和編碼單元1304、參考頻帶判定單元1305、時間變換單元1306、時間合成和編碼單元1307、頻率合成和編碼單元1308和編碼數據流產生單元1309。在同一圖中,時間—頻率變換單元1301、頻率特性提取單元1302、時間特性提取單元1303和時間變換單元1306分別與圖2所示的編碼設備200中的時間—頻率變換單元201、頻率特性提取單元202、時間特性提取單元203和時間變換單元204幾乎是相同的。
音頻輸入信號以一特定時間長度的每一幀被輸入到時間—頻率變換單元1301和時間特性提取單元1303。時間—頻率變換單元1301將時域中的輸入信號變換成頻域中的一個信號。時間—頻率變換單元1301例如採用MDCT變換來獲得一個MDCT係數。
頻率特性提取單元1302分析作為時間—頻率變換單元201的輸出的由每幀變換的頻譜係數的頻率特性,並以與圖2中的頻率特性提取單元202相同的方式指定一個最好以給予時間分辨能力優先權來量化的頻帶。
以與圖2中的時間特性提取單元203相同的方式,時間特性提取單元1303判定是時間分辨能力應該被優先還是頻率分辨能力應該被優先來在每幀量化音頻信號輸入。在時間特性提取單元1303,因為不需要以相同的時間分辨能力或相同的頻率分辨能力對輸入信號的所有頻帶量化和編碼,所以可以由每個子幀或每個頻帶來作出判決。
對於由時間—頻率變換單元1301獲得的頻域中的信號(頻譜係數),量化和編碼單元1304由每個預先限定的頻帶對信號量化和編碼。這個量化和編碼單元1304採用相關領域的技術人員所熟悉的公知技術、例如向量量化和霍夫曼編碼對數據量化和編碼。量化和編碼單元1304在內部包含一個在圖中未顯示的存儲器,將已經被編碼的編碼數據流和編碼之前的頻譜保存在其存儲器中,並將在由參考頻帶判定單元1305判定的頻帶中的編碼數據流或編碼之前的頻譜輸出到參考頻帶判定單元1305。
依據頻率特性提取單元1302和時間特性提取單元1303的判決結果,參考頻帶判定單元1305判定在作為量化和編碼單元1304的輸出的編碼數據流中的應該為由頻率特性提取單元1302和時間特性提取單元1303指定的頻帶而參考的一個頻帶。具體地,對於由時間特性提取單元1301指定的頻帶,參考頻帶判定單元1305隻在時域中對第一個指定頻帶量化和編碼,而不參考其他頻帶,並參考頻帶中的頻譜在時域中對剩餘頻帶進行編碼。此外,對於由頻率特性提取單元1302指定的頻帶,如果等效於一個整數的倍數(即,諧音的關係)的信號分量的頻譜係數被包含在由頻率特性提取單元1302指定的頻帶中,則參考頻帶判定單元1305在頻域中例如僅僅對包括頻譜係數的頻帶中的包含一個最低頻率的分量(頻譜係數)的頻帶進行量化和編碼。例如,如果8kHz、16kHz和24kHz的頻率分量分別被包含在由頻率特性提取單元1302指定的頻帶中,則只對包含8kHz的頻率分量的頻帶進行量化和編碼。對於除此之外的任何頻帶,例如包含16kHz的頻率分量的頻帶和包含24kHz的頻率分量的頻帶,判定將參考作為參考頻帶的包含最低頻率(8kHz)的分量(頻譜係數)的頻帶來在頻域中對其編碼。如果未包含等效於由頻率特性提取單元1302指定的頻帶中的諧音的頻譜係數,則頻率特性提取單元1302判定不參考其他頻帶在時域中對這些頻帶量化和編碼。
接著,參考圖14到16描述參考頻帶判定單元1305的行為。圖14是顯示用於參考其他頻帶產生一個目標頻帶的編碼數據流的方法的一個例子的示意圖。垂直軸顯示頻率,水平軸顯示圖中的頻率的頻譜係數值。在圖14中,頻帶Base1和頻帶Base2都是其頻域信號(頻譜)的係數已經被量化和編碼單元1304量化和編碼的頻帶的一部分。另一方面,在指示為「Qt1」和「Qt2」的頻帶中的信號的含義是分別採用頻帶Base1和頻帶Base2的頻譜係數進行量化和編碼的信號。例如,「Qt1」意味著採用頻帶Base1的信號根據時域變換被量化和編碼,「Qf2」意味著採用Base2的信號在頻域被量化和編碼。此外,採用Base1的頻帶信號來表達「Qt1」的參數被定義為參數Gt1,採用頻帶Base2的頻帶信號來表達「Qf2」的參數被定義為參數Gf2。這意味著頻帶「Qt1」中的信號由在時域中表達的頻帶Base1的頻帶中的信號用參數Gt1所指示的參數來量化和編碼,頻帶「Qf2」中的信號由在頻域中表達的頻帶Base2的頻帶中的信號(但不需要變換,因為它已經被在頻域中表達)用參數Gf2所指示的參數來量化和編碼。然而,用於劃分頻帶的方法、其順序和數量並不限於這些。
圖15是顯示用於參考其他頻帶產生目標頻帶的編碼數據流的方法的另一個例子的示意圖。與在圖15中的情況一樣,信號「Qt」可以通過採用已經分別用參數Gt1和參數Gt2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個頻帶(在時域中表達)由加法之和來表達。圖16是顯示用於參考其他頻帶產生目標頻帶的編碼數據流的方法的其他例子的示意圖。與在圖16中的情況一樣,信號「Qf」可以通過採用已經分別用參數Gf1和參數Gf2在量化和編碼單元1304中量化和編碼的頻帶Base1和頻帶Base2這兩個頻帶(在頻域中表達)由加法之和來表達。圖15和圖16中的任一種情況顯示了採用已經被量化和編碼的兩個頻帶中的信號來對一特定頻帶量化和編碼的情況,但頻帶數並不限於兩個。在參考頻帶判定單元1305中,一幀中的頻譜係數中的由時間特性提取單元203指定的要進行量化和編碼的頻帶(目標頻帶)通過採用由量化和編碼單元1304量化和編碼的任一個頻帶(參考頻帶)來表達,並判定是否要對其進行量化和編碼。
接著,參考圖17解釋頻率合成和編碼單元1308。圖17是顯示通過採用一個被參考頻帶中的已經被量化和編碼的編碼數據流將一個目標域中的頻譜在頻域中合成的方法的一個例子的示意圖。如上所述,假設參考頻帶和目標頻帶中的信號已經被參考頻帶判定單元1305選擇。在圖17中,頻帶A是參考頻帶,頻帶B是目標頻帶。為了簡化解釋,頻帶A中的信號和頻帶B中的信號分別由相同數目的元素組成,並分別被描述為向量Fa和向量Fb。另外,將每個向量分成兩個,即,向量Fa=(Fa0,Fa1),向量Fb=(Fb0,Fb1)。Fa0、Fa1、Fb0和Fb1是向量。Fa0的元素數與Fb0的元素數相同,Fa1的元素數與Fb1的元素數相同。Fa0的元素數可以與Fa1的元素數相同也可以不同。定義一個參數Gb=(Gb0,Gb1)。參數Gb是一個向量,但Gb0和Gb1是標量值。採用向量Fa和參數Gb將作為向量Fb的近似的向量Fb』定義為下面的公式 Fb』=Gb*Fa=(Gb0*Fa0,Gb1*Fa1)以這種方式,通過從目標頻帶A的頻域中的信號乘以控制合成比的參數Gb獲得一個乘積來合成頻帶B的頻域中的信號。此外,頻率合成和編碼單元1308對顯示哪一參考頻帶表達一特定目標頻帶的數據以及用於在所參考頻帶上的增益控制的參數Gb進行量化和編碼。為了簡化解釋,已經描述了目標頻帶和參考頻帶被分成兩個向量的情況。但它們也可以被分成少於兩個或多於兩個。並且,對頻帶的劃分可以是均勻的或不均勻的。
下面參考圖18描述時間合成和編碼單元1307。圖18是顯示通過採用參考頻帶中的已經被量化和編碼的編碼數據流將目標域中的頻譜在時域中合成的方法的一個例子的示意圖。如上所述,假設參考頻帶中的一個信號和目標頻帶中的一個信號已經由參考頻帶判定單元1305選擇。在圖18中,假設頻帶A是參考頻帶,頻帶B是目標頻帶。為了簡化解釋,頻帶A中的信號和頻帶B中的信號分別由相同數目的元素組成。時間變換單元1306以與第一實施例的時間變換單元204相同的方式將頻帶A和頻帶B中的頻域中的信號變換成時域中的信號(Tt)。這裡,假設通過變換頻帶A和頻帶B的頻域中的信號而獲得的信號分別是向量Ta和向量Tb。另外,向量Ta和向量Tb可以被劃分如下Ta=(Ta0,Ta1);Tb=(Tb0,Tb1)。Ta0、Ta1、Tb0、Tb1是向量。Ta0的元素數與Tb0的元素數相同,Ta1的元素數與Tb1的元素數相同。然而,Ta0的元素數與Ta1的元素數可以相同也可以不相同。並且,這裡定義參數Gb=(Gb0,Gb1)。Gb0和Gb1分別是標量值。圖19A、圖19B和圖19C是顯示通過採用向量Ta作為頻帶A的時域中的信號來將向量Tb近似為頻帶B的時域中的信號的方法的一個例子的示意圖。圖19A是顯示表達通過將作為參考頻帶的頻帶A的頻域中的信號變換成時域中的信號而獲得的信號的向量Ta的示意圖。圖19B是顯示表達通過將作為目標頻帶的頻帶B的頻域中的信號變換成時域中的信號而獲得的信號的向量Tb的示意圖。圖19C是對於通過在向量Ta上執行一個增益控制來表達一個近似於向量Tb的向量的情況顯示一個近似向量Tb』的示意圖。如圖19A、圖19B和圖19C所示,參數Gb的值被確定為使得向量Ta乘以Gb近似於向量Tb。
例如,採用向量Ta和參數Gb將近似向量Tb』定義為下面的公式[公式2]Tb』=Gb*Ta=(Gb0*Ta0,Gb1*Ta1)以這種方式,由參考頻帶A的時域中的信號與執行增益控制的參數Gb來合成目標頻帶B的時域中的信號。因此,在時間合成和編碼單元1307中,對顯示哪一參考頻帶被用於表達一特定目標頻帶的數據以及用於在所參考頻帶上的增益控制的參數Gb進行量化和編碼。為了簡化解釋,已經描述了目標頻帶和參考頻帶被分成兩個向量的情況。但它們也可以被分成少於兩個或多於兩個。並且,對頻帶的劃分可以是均勻的或不均勻的。
在編碼數據流產生單元1309中,根據一個預定格式將量化和編碼單元1304、頻率合成和編碼單元1308、時間合成和編碼單元1307、頻率特性提取單元1302和時間特性提取單元1303的輸出打包,並與其一起產生編碼數據流。因此,作為編碼設備1300的輸出信號的編碼數據流包含下面的數據1.通過對一個參考頻帶和一個既不是參考頻帶也不是目標頻帶的頻帶中的信號進行量化和編碼而獲得的數據;2.指示參考頻帶和目標頻帶之間的關係的數據;3.指示如何採用參考頻帶中的信號對目標頻帶進行量化和編碼的數據;4.指示在哪個域、時域或頻域中參考頻帶、目標頻帶和一個被分類為不是這兩個中的任一種的頻帶被量化和編碼的數據;等等。並且,參考頻帶和目標頻帶中的樣本數和與每個頻帶相關的頻率被直接或間接包含在編碼數據流中。
下面參考圖20描述依據本發明的第二實施例的解碼設備2000。圖20是顯示依據第二實施例的解碼設備2000的結構的方框圖。這個解碼設備2000是一個對編碼設備1300產生的編碼數據流解碼並輸出一個音頻輸出信號的解碼設備,包括編碼數據流分離單元2001、參考頻率信號產生單元2002、時間變換單元2003、時間合成單元2004、頻率變換單元2005、頻率合成單元2006和頻率—時間變換單元2007。解碼設備2000中的頻率—時間變換單元2007、時間變換單元2003和頻率變換單元2005與第一實施例中的頻率—時間變換單元1205、時間變換單元1306和頻率變換單元1203分別具有相同的結構。編碼數據流分離單元2001讀取輸入編碼數據流中的一個標題等,並分離出在編碼數據流中包含的下列數據1.通過對一個參考頻帶和一個既不是參考頻帶也不是目標頻帶的頻帶中的信號進行量化和編碼而獲得的數據;2.指示參考頻帶和目標頻帶之間的關係的數據;3.指示如何採用參考頻帶中的信號對目標頻帶進行量化和編碼的數據;4.指示在哪個域、時域或頻域中參考頻帶和目標頻帶被量化和編碼,並將其輸出到每個對應單元中的數據。參考頻率信號產生單元2002使用相關領域的技術人員所熟悉的公知的解碼方法、例如霍夫曼解碼,並對頻域中的信號編碼。這意味著圖14到圖16中的Base1和Base2的信號被解碼。並且,這意味著圖17和圖18中的頻帶A的頻域中的信號被解碼。
下面參考圖17解釋頻率合成單元2006的行動。如圖17所示,被表達為頻帶A中的向量Fa的頻域中的信號(頻譜)是通過在參考頻率信號產生單元2002中對從編碼數據流分離單元2001輸入到參考頻率信號產生單元2002的參考頻率中的數據進行解碼和反量化而獲得的。另一方面,被表達為頻帶B中的向量Fb的頻域中的信號(頻譜)由依據公式1採用向量Fa和參數Gb合成的近似向量Fb』來近似。用於增益控制的參數Gb是通過在編碼數據流分離單元2001中從編碼數據流分離出來而獲得的,指示頻帶A是頻帶B的參考頻帶的數據也是通過在編碼數據流分離單元2001中從編碼數據流分離出來而獲得的。這樣,在頻率合成單元2006,通過產生近似向量Fb』來產生作為參考頻帶的頻帶B的頻域中的信號Fb。
接著,參考圖18解釋時間合成單元2004的行動。在圖18中,由向量Ta所指示的頻帶A的時域中的信號(時間—頻率信號)是通過由時間變換單元2003對由參考頻率信號產生單元2002獲得的向量Fa所指示的頻譜執行時間變換(圖18中的過程Tf)而獲得的。並且,在作為目標頻帶的頻帶B中的由向量Tb所指示的時域中的信號(時間—頻率信號)由近似向量Tb』來近似。這個近似向量Tb』根據公式2由向量Ta和參數Gb組成。這樣,在時間合成單元2004中,通過產生近似向量Tb』來產生作為目標頻帶的頻帶B的時域中的信號Tb。用於增益控制的參數Gb和指示頻帶A是頻帶B的參考頻帶的數據是從編碼數據流分離單元2001獲得的。由時間合成單元2004獲得的表示為近似向量Tb』的時域中的信號被頻率變換單元2005變換成頻域中的一個信號。在頻率—時間變換單元2007中,將參考頻率信號產生單元2002、頻率合成單元2006和頻率變換單元2005的輸出合成為頻率軸上的一個信號分量。此外,頻率—時間變換單元2007對所合成的頻譜執行編碼設備1300的時間—頻率變換單元1301的時間—頻率變換的逆變換,並獲得時域中的音頻輸出信號。頻率—時間變換單元2007中的頻率—時間變換(例如,逆MDCT變換)可以用相關領域的技術人員所熟悉的公知技術來容易地實現。
圖21A是顯示由圖2中的編碼數據流產生單元205產生的編碼數據流的數據結構的一個例子的示意圖。圖21B是顯示由圖13中的編碼數據流產生單元1309產生的編碼數據流的數據結構的一個例子的示意圖。在圖21A和21B中所示的每個頻帶的帶寬可以是也可以不是固定帶寬。在第一實施例的編碼設備200中,由頻率特性提取單元202和時間特性提取單元203指定的頻帶中的頻譜在由時間變換單元204進一步變換成一個時間—頻率信號之後被量化和編碼。除此之外的任何頻帶在作為該頻譜時被量化和編碼。例如,圖21A顯示了由頻率特性提取單元202和時間特性提取單元203指定的頻帶是頻帶1和頻帶4的情況。如圖21A和21B所示,在每個頻帶前面描述一個標題。在圖21A中,在每個標題中描述一個標誌,顯示出在哪個域、是時域還是頻域中對頻帶中的編碼數據流進行量化和編碼的。例如,在頻帶1和頻帶4的標題中分別描述了標誌qm=t,顯示出頻帶1和頻帶4中的編碼數據流t_quantize在時域中被量化和編碼。並且,在頻帶2和頻帶3的標題中描述了標誌qm=f,顯示出頻帶2和頻帶3中的編碼數據流f_quantize在頻域中被量化和編碼。這裡,編碼數據流f_quantize和編碼數據流t_quantize是通過分別在頻域和時域中對頻譜進行量化和編碼而獲得的編碼數據流。
並且,在第二實施例的編碼設備1300中,由下面四種類型的編碼方法對由頻率特性提取單元1302和時間特性提取單元1303指定的頻帶中的頻譜進行編碼1.不參考其他頻帶在頻域中量化和編碼。
2.參考其他頻帶在頻域中編碼。
3.不參考其他頻帶在時域中量化和編碼。
4.參考其他頻帶在時域中編碼。
因此,在編碼數據流中的每個頻帶的標題中描述了一個顯示該頻帶是否參考其他頻帶的標誌、一個顯示如果參考的話參考哪個頻帶的頻帶號、一個控制參考頻帶的增益的參數等等。如圖21B所示,例如,在頻帶1的標題中描述了一個顯示頻帶1中的編碼數據流t_quantize在時域中被量化和編碼的標誌qm=t。在頻帶2的標題中描述了一個顯示頻帶2中的編碼數據流f_quantize在頻域中被量化和編碼的標誌qm=f。此外,在頻帶3中描述了下面的元素標誌qm=ref,顯示出實際上不包含通過在時域中對頻譜進行量化和編碼而獲得的編碼數據流,並參考其他頻帶產生頻帶3;頻帶號ref=1,顯示出頻帶1是頻帶3的參考頻帶;參數Gain_info,控制參考頻帶頻帶1的增益;等等。並且,以與頻帶3相同的方式,在頻帶4中描述了如下元素標誌qm=ref,顯示出實際上不包含通過對頻譜進行量化和編碼而獲得的編碼數據流,並參考其他頻帶產生頻帶4;頻帶號ref=2,顯示出頻帶2是頻帶4的參考頻帶;參數Gain_info,控制參考頻帶頻帶2的增益;等等。在頻帶3中,因為頻帶號ref=1顯示出參考在頻域中量化和編碼的頻帶1,這隱含著頻帶3是在頻域中編碼的。在頻帶4中,因為頻帶號ref=2表明參考在時域中量化和編碼的頻帶2,這隱含著頻帶4是在時域中編碼的。
在圖21A中,在編碼數據流中的每個頻帶的標題中描述了一個顯示在哪個域、是時域還是頻域中對頻帶中的編碼數據流進行量化和編碼的標誌。但如果預先確定了在哪個域中對哪一頻帶進行量化和編碼,則不需要這個標誌。並且,在圖21B中,在每個編碼數據流中的每個頻帶的標題中描述了一個顯示該頻帶是否參考其他頻帶的標誌以及一個指定用於該頻帶的參考頻帶的頻帶號。但如果預先確定了哪一頻帶參考哪一頻帶,則不需要這些數據。
在依據本發明的第二實施例的編碼設備1300和解碼設備2000中,如果將參考頻帶選擇為一個帶有較低頻率分量的頻帶,將目標頻帶選擇為一個帶有比參考頻帶高的頻率分量的頻帶,用一個現有的編碼方法對參考頻帶編碼,並將產生目標頻帶中的分量的代碼編碼為補充數據,則進一步可以使用現有的編碼方法和少量的補充數據來再現一個寬頻帶中的聲音。當將AAC方法用作一個現有的音頻編碼方法時,只要產生目標頻帶中的分量的編碼數據被包括在AAC方法的Fill_element中,甚至在與AAC方法兼容的解碼方法中,也可以在不發出噪聲的情況下對編碼數據流解碼。當使用依據本發明的第二實施例的解碼方法時,還可以從相對較小量的數據再現一個更寬頻帶上的聲音。
當使用結構如上所述的本發明的編碼設備和解碼設備時,除了可以實現頻域中的數據編碼之外,還可以實現時域中的數據編碼。因此,通過選擇一種具有更高編碼效率的編碼方法,對於再現的被解碼的聲音可以高效率地提高頻率分辨能力和時間分辨能力。並且,因為通過重新使用已經被編碼的頻帶中的信號可以用較小數據量來構造編碼音頻數據流,所以可以將編碼音頻數據流的比特率保持在較低水平。另外,如果使用相同的比特率,可以提供一個能夠獲得具有高級別聲音質量的音頻信號的編碼音頻數據流。此外,如果為時間變換單元1306、時間變換單元2003和頻率變換單元2005選擇一個不需要用於劃分信號的時間重疊的分析合成類型的正交變換方法,則可以去除編碼設備和解碼設備中的任何附加算術延遲,使得這在編碼和解碼過程中需要考慮延遲的應用上具有一個優點。
在上面的第二實施例中,參考頻帶判定單元1305為頻率特性提取單元1302和時間特性提取單元1303指定的頻帶判定四種類型的編碼方法,但其實際的判決方法並不限於上面這些。
工業實用性依據本發明的編碼設備可用作為位於用於包括BS和CS的衛星廣播的廣播基站中的音頻編碼設備,作為用於通過諸如網際網路的通信網絡來分布內容的內容分布伺服器的音頻編碼設備,以及進一步作為由通用計算機執行的用於對音頻信號編碼的程序。
另外,依據本發明的解碼設備不僅可用作為位於家庭中的STB中的音頻解碼設備,還作為一個由通用計算機、PDA、行動電話等執行的用於對音頻信號解碼的程序、以及在STB或通用計算機中包括的僅用於對音頻信號解碼的電路板、LSI等,並進一步作為插入到STB或通用計算機中的IC卡。
權利要求
1.一種對通過根據時間—頻率變換來變換一個輸入初始信號而獲得的頻域中的一個信號進行編碼並產生一個輸出信號的編碼設備,包括第一頻帶指定單元,可用於基於輸入初始信號的特性為一部分頻譜指定一個頻帶;時間變換單元,可用於根據頻率—時間變換將指定頻帶中的一個信號變換成一個信號;以及,編碼單元,可用於對由時間變換單元獲得的信號和至少一部分頻譜進行編碼,並從編碼信號和編碼頻譜產生一個輸出信號。
2.依據權利要求1的編碼設備,其中,時間變換單元根據頻率—時間變換將指定頻帶中的信號變換成一個指示一個在與頻譜相同的時間上的頻率分量的時間改變的信號。
3.依據權利要求2的編碼設備,其中,編碼設備進一步包括時域近似單元,可用於指定頻譜的兩個或多個頻帶,並採用一個指示在一個指定頻帶中包含的頻率分量的時間改變的信號來近似一個指示在另一個指定頻帶中的頻率分量的時間改變的信號,以及編碼單元對用於由時域近似單元指定的頻帶的近似的信號進行編碼。
4.依據權利要求3的編碼設備,其中,時域近似單元產生指定在頻譜中用於近似的頻帶和被近似的頻帶的數據。
5.依據權利要求4的編碼設備,其中,時域近似單元進一步產生指示用於被近似的信號的近似的信號的增益的數據。
6.依據權利要求5的編碼設備,其中,編碼單元不對被近似的信號進行編碼,而是對由時域近似單元產生的指定用於近似的頻帶的數據和指示增益的數據進行編碼。
7.依據權利要求1的編碼設備,其中,第一頻帶指定單元為一個在輸入初始信號的平均能量上具有一個大的改變的部分指定一個頻帶。
8.依據權利要求1的編碼設備,其中,編碼設備進一步包括第二頻帶指定單元,可用於基於頻譜特性為一部分頻譜指定一個頻帶,以及時間變換單元根據頻率—時間變換將指定頻帶的一個信號變換成一個信號。
9.依據權利要求8的編碼設備,其中,編碼設備進一步包括頻域近似單元,可用於指定在頻譜中包含的兩個或多個頻帶,並採用指定頻帶中的一個的頻譜來近似另一個頻帶的頻譜,以及編碼單元對用於由頻域近似單元指定的頻帶的近似的頻譜進行編碼。
10.依據權利要求9的編碼設備,其中,頻域近似單元產生指定在頻譜中用於近似的頻帶和被近似的頻帶的數據。
11.依據權利要求10的編碼設備,其中,頻域近似單元進一步產生指示用於被近似的頻譜的近似的頻譜的增益的數據。
12.依據權利要求11的編碼設備,其中,編碼單元不對被近似的頻譜進行編碼,而是對由頻域近似單元產生的指定用於近似的頻帶的數據和指示增益的數據進行編碼。
13.依據權利要求8的編碼設備,其中,第二頻帶指定單元指定一個在頻譜中具有廣泛散布的頻譜係數的頻帶。
14.一種對通過對一個輸入初始信號編碼而獲得的編碼數據流進行解碼、並輸出一個頻譜的解碼設備,包括解碼單元,可用於提取在輸入編碼數據流中包含的編碼數據流的一部分,並對提取出的編碼數據流解碼;頻率變換單元,可用於將通過對提取出的編碼數據流解碼而獲得的信號變換成一個頻譜以及,合成單元,可用於在頻率軸上合成通過對從輸入編碼數據流的其他部分提取出的編碼數據流解碼而獲得的一個頻譜和由頻率變換單元獲得的頻譜。
15.依據權利要求14的解碼設備,其中,由頻率變換單元獲得的頻譜和通過對從編碼數據流的其他部分提取出的編碼數據流解碼而獲得的頻譜是指示對於相同輸入初始信號的在同一時間的一個信號的頻譜。
16.依據權利要求15的解碼設備,其中,解碼設備進一步包括時間近似單元,可用於用一個從其他頻帶中的編碼數據流解碼出的信號來近似由提取出的編碼數據流指示的頻帶,以及頻率變換單元將被近似的信號變換成一個頻譜。
17.依據權利要求16的解碼設備,其中,時間近似單元根據在提取出的編碼數據流中包含的數據指定被用於由編碼數據流所指示的頻帶的近似的信號的一個頻帶,並採用所指定頻帶的信號執行近似。
18.依據權利要求17的解碼設備,其中,時間近似單元進一步通過從提取出的編碼數據流中包含的數據讀取用於被近似的信號的近似的信號的增益,並通過採用所讀取的增益調節指定頻帶中的信號的振幅來近似頻帶。
19.依據權利要求17的編碼設備,其中,時間近似單元指定一個已經變換成頻譜的頻帶,根據頻率—時間變換將指定頻帶的頻譜變換成一個信號,並採用變換所獲得的信號來近似一個由提取出的編碼數據流所指示的頻帶。
20.依據權利要求16的編碼設備,其中,解碼設備進一步包括頻率近似單元,可用於用從其他頻帶中的編碼數據流解碼出的頻譜來近似由提取出的編碼數據流所指示的頻帶,以及,除了通過對從輸入編碼數據流的其他部分提取出的編碼數據流解碼而獲得的頻譜以及由頻率變換單元獲得的頻譜之外,合成單元進一步在頻率軸上合成由頻率近似單元近似的頻譜。
21.依據權利要求20的解碼設備,其中,頻率近似單元根據在提取出的編碼數據流中包含的數據指定被用於由編碼數據流所指示的頻帶的近似的頻譜的一個頻帶,並採用所指定頻帶的頻譜執行近似。
22.依據權利要求21的解碼設備,其中,頻率近似單元進一步通過從提取出的編碼數據流中包含的數據讀取用於被近似的頻譜的近似的頻譜的增益,並通過採用所讀取的增益調節指定頻帶中的頻譜的振幅來近似頻帶。
23.一種對通過根據時間—頻率變換來變換一個輸入初始信號而獲得的頻域中的一個信號進行編碼並產生一個輸出信號的編碼方法,包括第一頻帶指定步驟,用於基於輸入初始信號的特性為一部分頻譜指定一個頻帶;時間變換步驟,用於根據頻率—時間變換將指定頻帶中的一個信號變換成一個信號;以及,編碼步驟,用於對由時間變換步驟獲得的信號和至少一部分頻譜進行編碼,並從編碼信號和編碼頻譜產生一個輸出信號。
24.一種對通過對一個輸入初始信號編碼而獲得的編碼數據流進行解碼、並輸出一個頻譜的解碼方法,包括解碼步驟,用於提取在輸入編碼數據流中包含的編碼數據流的一部分,並對提取出的編碼數據流解碼;頻率變換步驟,用於將通過對提取出的編碼數據流解碼而獲得的信號變換成一個頻譜;以及,合成步驟,用於在頻率軸上合成通過對從輸入編碼數據流的其他部分提取出的編碼數據流解碼而獲得的一個頻譜和由頻率變換步驟獲得的頻譜。
25.一種對通過根據時間—頻率變換來變換一個輸入初始信號而獲得的頻域中的一個信號進行編碼並產生一個輸出信號的程序,所述程序使計算機執行第一頻帶指定步驟,用於基於輸入初始信號的特性為一部分頻譜指定一個頻帶;時間變換步驟,用於根據頻率—時間變換將指定頻帶中的一個信號變換成一個信號;以及,編碼步驟,用於對由時間變換步驟獲得的信號和至少一部分頻譜進行編碼,並從編碼信號和編碼頻譜產生一個輸出信號。
26.一種對通過對一個輸入初始信號編碼而獲得的編碼數據流進行解碼、並輸出一個頻譜的程序,所述程序使計算機執行解碼步驟,用於提取在輸入編碼數據流中包含的編碼數據流的一部分,並對提取出的編碼數據流解碼;頻率變換步驟,用於將通過對提取出的編碼數據流解碼而獲得的信號變換成一個頻譜;以及,合成步驟,用於在頻率軸上合成通過對從輸入編碼數據流的其他部分提取出的編碼數據流解碼而獲得的一個頻譜和由頻率變換步驟獲得的頻譜。
全文摘要
一種編碼設備(200)包括時間特性提取單元(203),基於時域中的一個音頻輸入信號的特性為一部分頻譜指定一個頻帶;時間變換單元(204),根據頻率一時間變換將指定頻帶中的一個信號變換成一個信號;以及,編碼數據流產生單元(205),對由時間變換單元(204)獲得的信號和至少一部分頻譜進行編碼,並從編碼信號和編碼頻譜產生一個輸出編碼數據流。
文檔編號G10L19/02GK1516865SQ0380041
公開日2004年7月28日 申請日期2003年4月7日 優先權日2002年4月11日
發明者津島峰生, 則松武志, 志, 也, 田中直也 申請人:松下電器產業株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀