採用語音多路系統的數字音頻編碼器的製作方法
2023-06-27 20:43:31 3
專利名稱:採用語音多路系統的數字音頻編碼器的製作方法
技術領域:
本發明涉及一個採用語音多路系統的數字音頻編碼器,它完成音頻的數位訊號處理和語音多路數據的編碼。詳細地說,本發明中,語音多路數據加入到一個應用於廣播系統的數字音頻編碼器中。該廣播系統在數字音頻數據的傳輸端和接收端需要語音多路。
傳統的數字音頻編碼器是一個雙通道的數字音頻系統。它在接收和發送數據時,採用簡單的算法來保持高質量的聲音。雙通道的數字音頻系統可以改裝成多通道的數字音頻編碼器。然而,這種多通道數字音頻編碼器很複雜也很昂貴。另外,雙通道的數字音頻系統可以處理立體聲音頻數據,卻不能處理音頻多路數據。
本發明的目的是要提供一種音頻多路系統所適用的數字音頻編碼器,它可以通過使用一個結構相對簡單的雙通道數字音頻系統來編碼立體聲音頻數據和音頻多路數據。
根據本發明,在數字音頻編碼器中,立體聲音頻數據和音頻多路數據被採樣和定標,以調整信號的範圍。之後,將窗口放在數據上。通過這個窗口,鄰接的塊被覆蓋,這樣就消除了塊之間的噪音。為了提取和規範化MDCT係數和MDST係數,執行MDCT和MDST操作,使它和窗口有同樣大小,MDCT和MDST係數分別表示指數和尾數。尾數包括固定位數據和可變位數據。
為了產生固定位數據,首先,通過每個子帶分配幾位而分配固定位項。為了產生不變位數據,從低頻帶開始,剩下的各位依次被分配給每個子帶。然後,執行量化。
根據語音多路數據的存在執行格式化。如果沒有語音多路數據,那麼一幀處理512個單位的數據。如果有語音多路數據,那麼一幀處理2倍於512個單位的數據。也就是1024個單位的數據。
相應地,本發明的數字音頻編碼器的整體數據位速率和一幀處理512個單位數據的雙通道編碼系統之間沒多少差別。因此,本發明的數字音頻編碼器具有簡單的結構並且保持很高的語音質量。
本發明的其它目的和優點將在結合附圖閱讀以下描述後更加明顯。
圖1是本發明中數字音頻編碼器的方塊2是圖1的音頻數據編碼部分和語音多路編碼部分的方塊圖。
圖3是當沒有語音多路數據輸入時,從本發明的數字音頻編碼器輸出的數據的格式。
圖4是當有語音多路數據輸入時,從本發明的數字音頻編碼器輸出的數據的格式。
參照附圖,本發明的數字音頻編碼器包括,第一採樣部分10,採樣兩路立體聲音頻數據(L,R);第二採樣部分(20)採樣兩路語音多路數據(S1,S2);一個音頻數據編碼部分(30),根據是否存在由第一採樣部分(10)採樣的採樣數據(L1,R1)確定窗口和MDCT/MDST的大小;一個語音多路數據編碼部分40,根據是否存在由第二採樣部分20採樣的採樣數據(S1』,S2』)確定窗口和MDCT/MDST大小;一個格式化部分50,格式化從音頻數據編碼部分30和語音多路數據編碼部分40輸出的數據,並產生位流。
音頻數據編碼部分30和語音多路數據編碼部分40具有同樣的結構。如圖2所示,音頻數據編碼部分30和語音多路數據編碼部分40包括一個定標部分31,調整分別由第一採樣部分10和第二採樣部分20採樣得到的數據(L1,R1)、(S1』,S2』)的範圍;一個語音數據存在鑑別/塊大小選擇部分32,根據定標部分31的輸出數據鑑別語音數據是否存在並確定塊的大小;一個窗口迭蓋部分33,根據語音數據存在鑑別/塊大小選擇部分32的輸出信號確定窗口的大小,迭蓋其範圍已由定標部分31調整過的數據的鄰接塊,並且將重迭加窗口放到被迭蓋的塊上以消除塊之間的噪音;MDCT/MDST部分34,通過對窗口迭蓋部分33的輸出信號執行MDCT/MDST操作提取MDCT/MDST係數;一個子帶塊處理部分35,規範化MDCT/MDST的係數,並且將每個係數分別表示為一個指數和一個尾數;一個可變位分配部分36,在已由子帶塊處理部分35表示的尾數中分配一個可變位項;一個自適應量化部分37,用於量化可變位分配部分36的可變位數據和尾數的固定位數據,以及指數,並且將量化的數據用于格式化部分50。
詳細地說,在本發明的數字音頻編碼器中,兩路立體聲音頻數據(L,R)和兩路語音多路數據(S1,S2)分別輸入到第一採樣部分10和第二採樣部分20並被它們採樣。
立體聲音頻數據(L,R)的頻率一般不大於20KHz,所以32KHz、44.1KHz、或48KHz用作第一採樣部分10的採樣頻率。語音多路數據(S1,S2)的頻率一般小於4KHz,所以將第一採樣部分10的採樣頻率的一半用作第二採樣部分20的採樣頻率。
分別由第一採樣部分10和第二採樣部分20採樣的數據(L1,R1)和(S1』,S2』)輸入到音頻數據編碼部分30和語音多路數據編碼部分40的定標部分31。
比如,音頻數據編碼部分30詳述如下。
定標部分31對輸入數據(L1,R1)進行定標並調整輸入數據(L1,R1)的信號範圍。由定標部分31調整過信號範圍的數據輸入到語音數據存在鑑別/塊大小選擇部分32和窗口迭蓋部分33。
窗口迭蓋部分33將窗口放到數據輸入上。此窗口是重迭加窗口,它通過迭蓋鄰接塊消除塊之間的噪音。
放到窗口迭蓋部分33的輸入數據上的窗口的大小根據塊的大小變化。塊的大小由語音數據存在鑑別/塊大小選擇部分32確定。語音數據存在鑑別/塊大小選擇部分32鑑別語音數據是否已從定標部分31輸入並且確定塊的大小。也就是說,當語音數據輸入到語音數據存在鑑別/塊大小選擇部分32時,語音數據成了主數據,這樣窗口大小定為1024,是512的兩倍。
通常,在處理立體聲音頻數據時,一幀處理512個單位的數據。然而,當語音數據輸入時,窗口大小應為512的兩倍即1024,因為輸入的語音數據應與立體聲音頻數據同時處理。
已經通過窗口迭蓋部分33的數據,在MDCT/MDST部分34執行MDCT/MDST操作,提取MDCT係數和MDST係數。MDCT/MDST的大小被確定為與已在上面確定的窗口大小相同。
由MDCT/MDST部分34提取出來的MDCT係數和MDST係數由子帶塊處理部分35和可變位分配部分36進行規範化。這兩個係數分別指示指數和尾數。
指數有4位,最多可以表示15位。尾數由固定位數據和可變位數據組成。對每個子帶進行固定位數據的位分配。頻率越低,分配的位越多。頻率越高,分配的位越少。由可變位分配部分35通過從低頻帶開始,將固定位項剩下的每位分配給每個子帶,將可變位項分配給每個子帶。
由子帶塊處理部分35和可變位分配部分36處理的尾數的可變位數據和固定數據以及指數由自適應量化部分37量化並且輸入到格式化部分50。
同音頻數據編碼部分30一樣,由第二採樣部分20採樣的數據(S1』,S2』)輸入到語音多路數據編碼部分40。在語音多路數據編碼部分30,獲得MDCT係數和MDST係數並進行規範化。獲得指數、尾數、固定位項和可變位項,並進行位分配。不同於其它音頻語音,語音多路的語音不是順序輸入的,因此,為了確定一個信號是不是語音信號,應在執行位分配之前測量信號電平。
為了鑑別每塊的語音信號,數據幀有標誌作為指示。用編碼器來辨別標誌位,以確定語音數據是否要被編碼。
在語音數據被辨別後,音頻數據編碼部分30和語音多路數據編碼部分40在它們各自的語音數據存在鑑別/塊大小選擇部分32中將窗口大小確定為1024。
相應地,MDCT/MDST定為「1024」。如上所述,在第一採樣部分10的採樣數據(L1,R1)和第二採樣部分20的採樣數據(S1』,S2』)通過音頻數據編碼部分30和語音多路數據編碼部分40後,就能得到尾數的可變位數據和固定位數據以及變換係數的指數。獲得的變換係數的指數以及尾數的固定位數據和可變位數據輸入到格式化部分50並進行格式化。
如圖3和圖4所示,由格式化部分50完成數據的格式化。圖3所示的是,當沒有語音多路數據輸入時,由音頻數據編碼部分30所產生的數據的格式化。圖4所示的是,與此同時,當有語音多路數據輸入時,由音頻數據編碼部分30和語音多路數據編碼部分40所產生數據的格式化。
如圖3所示,當沒有語音多路數據時,一個表示同步數據和語音多路數據存在與否的標誌數據(a)位於第一塊。子帶指數數據(b)、固定位數據(c)和可變位數據(d)依次位於餘下的塊中。指數數據(b)插入到固定位數據(c)和標誌數據(a)之間以最小化傳輸過程中產生的錯誤所帶來的影響。
如圖4所示,當有語音多路數據時,一個表示同步數據和語音多路數據存在與否的標誌數據(a)位於第一塊。音頻數據編碼部分30的指數(b),音頻數據編碼部分30的固定位數據(c),語音多路數據編碼部分40的指數(d),語音多路數據編碼部分40的固定位數據(e),音頻數據編碼部分30的可變位數據(f)和語音多路數據編碼部分40的可變位數據(g),依次位於餘下的塊中。
在沒有語音多路數據時,一幀處理512個單位的數據,而在有語音多路數據時,一幀處理兩倍於512個單位的數據,也即1024個單位的數據,因此,本發明的數字音頻編碼器的整體數據位速率和一幀處理512個單位數據的雙通道編碼系統的整體數據位速率相差無幾。
如上所述,通過加入在傳輸系統中得到廣泛應用的語音多路系統並且利用可以保持高語音質量。並具有簡單結構的雙通道數字編碼器,本發明的數字音頻編碼器結構並不複雜也不昂貴。
在下面描述和附圖中提出的問題,作簡單說明並不作為限制。本發明的實際範圍是基於現有技術的合適的觀點由權利要求所限定。
權利要求
1.一種採用了語音多路系統的數字音頻編碼器,包括第一採樣部分(10),採樣兩路立體聲數據(L,R);第二採樣部分(20),採樣兩路語音多路數據(S1,S2);一個音頻數據編碼部分(30),根據是否存在由第一採樣部分(10)採樣的採樣數據(L1,R1),確定窗口和MDCT/MDST的大小;一個語音多路數據編碼部分(40),根據是否存在由第二採樣部分(20)採樣的數據(S1』,S2』)確定窗口和MDCT/MDST的大小,以及一個格式化部分(50),格式化從音頻數據編碼部分(30)和語音多路數據編碼部分(40)輸出的數據並產生位流。
2.根據權利要求1的採用語音多路系統的數字音頻編碼器,其中第二採樣部分(20)的採樣頻率是第一採樣部分(10)的採樣頻率的一半。
3.根據權利要求1的採用語音多路系統的數字音頻編碼器,其中音頻數據編碼部分(30)和語音多路數據編碼部分(40)中的每一個包括一個定標部分(31),調整分別由第一採樣部分(10)和第二採樣部分(20)採樣的採樣數據(L』,R』)和(S1』,S2』)的範圍;一個語音數據存在鑑別/塊大小選擇部分(32),根據定標部分(31)的輸出數據鑑別是否存在語音數據並確定塊的大小;一個窗口迭蓋部分(33),根據語音數據存在鑑別/塊大小選擇部分(32)的輸出信號確定窗口大小,迭蓋由定標部分(31)調整過範圍的鄰接塊數據,並且將重迭加窗口放到被迭蓋的塊上以消除塊之間的噪音;一個MDCT/MDST部分(34),通過對窗口迭蓋部分(33)的輸出信號執行MDCT/MDST操作,以提取MDCT/MDST係數;一個子帶塊處理部分,規範化MDCT/MDST的係數並將每個係數表示成一個指數和一個尾數;一個可變位分配部分(36),在已由子帶塊處理部分(35)表示的尾數中分配一個可變位項;一個自適應量化部分(37),量化可變位分配部分(36)的可變位數據和尾數的固定位數據以及指數,並且將量化後的數據輸出到格式化部分(50)。
4.根據權利要求3的採用語音多路系統的數字音頻編碼器,其中語音數據存在鑑別/塊大小選擇部分(32)鑑別是否已輸入語音多路數據,並且當有語音多路數據時,確定窗口和MDCT/MDST的大小為1024。
5.根據權利要求3的採用語音多路系統的數字音頻編碼,其中當有語音多路數據時,格式化部分(50)順序地定位表示同步數據和語音多路數據是否存在的標誌數據(a)、音頻數據編碼部分(30)的指數(b)、音頻數據編碼部分(30)的固定位數據(c)、語音多路數據編碼部分(40)的指數(d)、語音多路數據編碼部分(40)的固定位數據(e)、音頻數據編碼部分(30)的可變位數據(f)和語音多路數據編碼部分(40)的可變位數據(g)。
全文摘要
在本發明的數字音頻編碼器中,對立體聲音頻數據和音頻多路數據進行採樣和定標,調整信號的範圍。之後,將窗口放到數據上。通過窗口,鄰接的塊被覆蓋以消除塊之間的噪音。對信號執行MDCT和MDST操作,使其具有和窗口同樣的大小,以提取並規範化MDCT係數和MDST係數,它們分別表示指數和尾數。之後,完成量化。格式化的執行,依據是否存在語音多路數據而定。如果沒有語音多路數據,一幀處理512個單位的數據。如果有語音多路數據,一幀處理2倍於512個單位的數據。
文檔編號H04H20/88GK1132877SQ95109688
公開日1996年10月9日 申請日期1995年7月31日 優先權日1995年4月1日
發明者樸成完, 尹政植 申請人:現代電子產業株式會社