用於編碼/解碼具有輔助信息的音頻比特流的方法和設備的製作方法

2023-06-18 22:59:16 6

專利名稱：用於編碼/解碼具有輔助信息的音頻比特流的方法和設備的製作方法
技術領域：
本發明涉及MPEG音頻比特流的編碼/解碼，並更具體地，涉及一種用於編碼/解碼具有輔助信息的MPEG-4位片算術編碼(BSAC)音頻比特流的方法和設備。

背景技術：
模擬波形是連續時間信號。因此，需要模數(A/D)轉換來把所述模擬波形表現為離散時間信號。對A/D轉換來說有兩種處理是必需的。一種是把時間上的連續時間信號轉換為離散時間信號的採樣處理，另一種是利用有限數值來限制可能振幅數量的振幅量化處理。也就是說，振幅量化處理把時刻n的輸入振幅x(n)轉換成y(n)，y(n)為可能振幅的有限集中的元素。
近來，在音頻信號存儲/恢復方法中，根據數位訊號處理技術的發展，採樣和量化典型模擬信號、把採樣和量化後的信號轉換成作為數位訊號的脈碼調製(PCM)數據、在記錄/存儲介質如壓縮盤(CD)或數字音頻磁帶(DAT)中存儲所述PCM數據、以及根據用戶需求通過再現所存儲的數據來收聽所述PCM數據的技術已得到了發展。與採用模擬方法如慢轉密紋唱片(LP)的磁帶記錄相比，通過應用利用數字方法的存儲/恢復方法，可以獲得較好的聲音質量，並能防止由於存儲持續時間所引起的惡化。但是，由於數字數據的大小很大，因此當進行存儲或傳輸時會產生很多問題。
為了解決這些問題，人們努力採用用於壓縮數字聲音信號的差分脈碼調製(DPCM)方法或自適應差分脈碼調製(ADPCM)方法，來減少數據量。但是，DPCM或ADPCM方法的效率根據信號種類的不同而有很大差別。最近，在國際標準化組織(ISO)已實現標準化工作的運動圖像專家組(MPEG)/音頻技術或由Dolby Co.Ltd.所發展的AC-2/AC-3技術中，已經使用了利用心理聲學建模減少數據量的方法。在不考慮信號特性的情況下，所述減少數據量的方法對有效減少數據量做出了很大貢獻。
在傳統的音頻壓縮技術如MPEG-1/音頻、MPEG-2/音頻、或AC-2/AC-3中，將時域信號捆綁(bound)成預定大小的塊並轉換成頻域信號。利用心理聲學建模對所轉換的信號進行分級量化。所述量化技術簡單，但即使輸入樣本統計上獨立，所述量化技術也不最佳。此外，如果輸入樣本在統計上相關，則所述量化技術效率低下。由於這個原因，編碼實現為包含無損編碼如熵編碼，或特定類型的自適應量化。因此執行相當複雜的處理，而不是存儲單一PCM數據的方法，並且比特流由量化的PCM數據和用於信號壓縮的輔助信息組成。
所述MPEG/音頻標準或AC-2/AC-3方法提供了和具有64Kbps-384Kbps速率的CD音質一樣良好的音質，該速率是傳統數字編碼速率的1/6至1/8。具有較高音質的MPEG/音頻標準，在音頻信號的存儲與傳輸系統如數字音頻廣播(DAB)、網際網路電話、音頻點播(AOD)、及多媒體系統中，將扮演重要的角色。
在這些傳統方法中，由於編碼器提供了固定的比特率，且通過為所提供的比特率找到最佳狀態來執行量化和編碼處理，因此當固定比特率用於編碼時，所述方法提供了良好的方案。然而，為了多媒體的用途，需要傳統的低比特率編碼和具有各種功能的編碼器/解碼器。其中一種是能控制比特率的音頻編碼器/解碼器。所述比特率可控的音頻編碼器可以使用用高比特率編碼的比特流來生成低比特率的比特流，並能僅利用一部分比特流來恢復上述比特流。因此，當網絡超負載、解碼器的性能不佳、或用戶指令降低了比特率時，所述比特率可控的音頻編碼器應該利用部分比特流來恢復具有合理性能的音頻信號，即使性能惡化得和降低的比特率一樣。
允許存儲輔助信息的語法，如data_stream_element和fill_element，在MPEG-2/4AAC(ISO/IEC 13818-7，ISO/IEC 14496-3)中。而且，MPEG-1的第3層(mp3)中定義了「輔助數據」。因此，可以通過把輔助信息嵌入到幀信息的中間，來存儲音頻輔助信息。ID3v1是這方面的代表性的例子。圖11示出了ID3v1中的比特流結構。
然而，當前標準化的MPEG-4位片算術編碼(BSAC)音頻格式中沒有定義允許提供輔助信息的語法。圖12和13示出了BSAC語法中幀報頭的定義。在BSAC中，由於幀報頭中沒有定義允許嵌入輔助信息的語法，因此根據標準，不可能把輔助信息嵌入到幀報頭中。

發明內容
本發明提供了一種用於編碼/解碼具有輔助數據的MPEG-4位片算術編碼(BSAC)音頻比特流的方法和設備，可以通過在當前標準化的MPEG-4 BSAC音頻格式中嵌入輔助信息的方式來改善音頻內容的元數據或音質，從而提供與眾不同的服務。
本發明還提供了一種區分在用MPEG-4 BSAC音頻格式編碼的音頻數據中是否嵌入有輔助信息的方法。
根據本發明的一個方面，提供了一種編碼具有輔助信息的MPEG-4 BSAC音頻比特流的方法，所述方法包括把時域音頻信號轉換為頻域音頻信號，並用心理聲學模型量化音頻信號；對比特率受控的音頻數據的比特數進行計數；利用要使用的比特數和要使用的層數而獲得每一層可用的比特數；通過獲得輔助信息的大小來修正每一層可用的比特數；以層為單位編碼實際音頻數據；及在編碼比特流中嵌入輔助信息。
所述輔助信息可以是關於音質改進的信息。所述輔助信息還可以是關於音樂曲調的信息。
根據本發明的另一方面，提供了一種用於編碼具有輔助信息的MPEG-4BSAC音頻比特流的設備，所述設備包括量化處理器，用於將時域音頻信號轉換為頻域音頻信號，並利用心理聲學模型而量化所述音頻信號；可用比特計算器，用於利用音頻數據的比特數和層數而獲得每一層可用的比特數；可用比特修正器，用於通過獲得輔助信息的大小，而修正由可用的比特計算器計算出的每一層的可用比特數；及比特封裝單元，用於根據由可用比特修正器修正的每一層的可用比特數，而編碼實際音頻數據，並把輔助信息嵌入到編碼比特流中。
所述可用比特計算器可以包括比特計數器，用於對比特率受控的音頻信號的比特數進行計數；和副層可用比特計算器，用於利用由所述比特計數器計數得到的比特數和預定層數，而獲得每一層可用的比特數。
根據本發明的另一個方面，提供了一種解碼具有輔助信息的MPEG-4BSAC音頻比特流的方法，所述方法包括解碼音頻比特流的報頭；通過從報頭信息中獲得幀的大小，來計算音頻比特流的層結構；從層結構中獲得一直到頂層的數據大小和幀的大小，並將所述一直到頂層的數據的大小與幀的大小之間的差值確定為輔助信息的大小；根據所述輔助信息的大小，而從所述音頻比特流中提取所述輔助信息；及根據所計算的層結構，而解碼所述音頻比特流一直到頂層。
根據本發明的另一個方面，提供了一種解碼具有輔助信息的MPEG-4BSAC音頻比特流的方法，所述方法包括解碼比特流的報頭；通過從報頭信息中獲得幀的大小，來計算比特流的層結構；對來自比特流的層結構的、與一直到頂層的音頻數據大小相對應的音頻數據進行解碼；及提取剩餘比特流作為輔助信息，並解碼所述輔助信息。
所提取的輔助信息可以是關於音質改進的信息。所提取的輔助信息還可以是音頻數據用戶的音頻元數據。
根據本發明的另一個方面，提供了一種用於區分在用MPEG-4 BSAC音頻數據編碼的音頻數據中是否嵌入有輔助信息的方法，所述方法包括解碼比特流的報頭；通過從所述報頭信息中獲得幀的大小，來計算所述比特流的層結構；及從層結構中獲得一直到頂層的數據大小和幀的大小，以及利用所述一直到頂層的數據大小和幀的大小之間的差值，來區分是否存在輔助信息。
根據本發明的另一方面，提供了一種用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的設備，所述設備包括比特拆分單元，用於解碼音頻比特流的報頭；層結構計算器，用於通過從所述報頭信息中獲得幀的大小，來計算所述音頻比特流的層結構；輔助信息計算器，用於從層結構中獲得一直到頂層的數據大小和幀的大小，並將所述一直到頂層的數據的大小與幀的大小之間的差值確定為輔助信息的大小；輔助信息提取器，用於根據所述輔助信息的大小，而從所述音頻比特流中提取所述輔助信息；及音頻解碼器，用於根據所計算的層結構，而解碼所述音頻比特流一直到頂層。
根據本發明的另一方面，提供了一種在其上記錄有用於執行上述方法的計算機可讀程序的計算機可讀介質。

通過參考附圖對示範實施例的詳細描述，本發明的上述和其他特徵及優點將會變得更明顯，其中圖1是用於編碼MPEG-4 BSAC音頻比特流的設備的方框圖；圖2是根據本發明一個實施例的用於編碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的方框圖；圖3是用於編碼MPEG-4 BSAC音頻比特流的設備的操作流程圖；圖4是根據本發明一個實施例的用於編碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的操作流程圖；圖5是用於解碼MPEG-4 BSAC音頻比特流的設備的方框圖；圖6是根據本發明一個實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的方框圖；圖7是根據本發明一個實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的方法的流程圖；圖8是根據本發明另一個實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的另一種方法的流程圖；圖9是BSAC比特流的配置；圖10示出了在BSAC比特流中嵌入輔助信息的位置；以及圖11示出了ID3v1的比特流結構；圖12示出了MPEG-4 BSAC語法中的bsac_header；以及圖13示出了MPEG-4 BSAC語法中的general_header。

具體實施例方式下面，將參考附圖對本發明進行更全面的描述，其中所述附圖示出了本發明的實施例。
圖1是用於編碼MPEG-4 BSAC音頻比特流的設備的方框圖。參照圖1，所述設備包括時/頻轉換器100、心理聲學建模單元110、量化/比特率控制器120、和比特封裝單元130。
所述時/頻轉換器100把輸入的時域音頻信號轉換成頻域信號。在時域中，人們所能辨別的信號特性間的區別並不明顯。但在頻域中，由於人們所能辨別的信號與人們不能辨別的信號間的區別根據心理聲學模型在每一頻帶中是很明顯的，以至於可以根據頻帶而分配不同的量化比特，從而提高了壓縮效率。
所述心理聲學建模單元110以預定子帶信號為單位對時/頻轉換器100轉換為頻率分量的輸入音頻信號進行捆綁，並利用由於子帶信號間的相關性所產生的掩蔽(masking)效應而計算出每個子帶的掩蔽閾值。
所述量化/比特率控制器120對預定編碼子帶中的子帶信號進行量化，從而使每個子帶的量化噪聲的量值變得比掩蔽閾值小。也就是說，分級量化用於子帶的頻率信號，使每個子帶的量化噪聲電平比掩蔽閾值小，從而使人們聽不到量化噪聲。使用NMR來執行上述量化，使得所有子帶的噪聲掩蔽比(NMR)的值等於或小於0dB，其中NMR是每個子帶中產生的噪聲與心理聲學建模單元110所計算的掩蔽閾值的比率。上述NMR值小於0dB的情況是指掩蔽閾值比量化噪聲大，即人們聽不到量化噪聲。
比特封裝單元130對具有最低比特率的與基層相對應的量化數據進行編碼，並且如果完成了基層編碼，則比特封裝單元130對與較高一層相對應的量化數據進行編碼，依此類推，通過對所有層進行編碼，所述比特封裝單元130建立了比特流。在比特封裝單元130對每一層的量化數據執行的編碼中，通過用由預定的相同數目比特組成的二進位數據來表示每一層的量化數據，把所述量化數據分成多個比特單元，並按照從頂層比特序列到基層比特序列的順序進行編碼，所述頂層比特序列由分出的比特中的最高有效位組成。
圖2是根據本發明一個實施例的用於編碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的方框圖。參照圖2，所述設備包括量化處理器200、可用比特計算器220、可用比特修正器240、及比特封裝單元260。
所述量化處理器200將時域音頻信號轉換成頻域音頻信號，利用心理聲學模型對音頻信號進行量化，並包括時/頻轉換器20、心理聲學建模單元22、及量化/比特率控制器24。時/頻轉換器20、心理聲學建模單元22、和量化/比特率控制器24分別對應於上述圖1中的時/頻轉換器100、心理聲學建模單元110、和量化/比特率控制器120，並執行相同的功能。
所述可用比特計算器220通過使用量化音頻數據的比特數和層數而獲得每一層的可用比特數，並包括比特計數器26和副層可用比特計算器28。所述比特計數器26計數比特率受控的音頻數據的比特數。所述副層可用比特計算器28利用由比特計數器26所計數的音頻數據的比特數和預定層數而獲得每一層的可用比特數。
所述可用比特修正器240通過獲得要嵌入的輔助信息的大小，來修正由可用比特計算器220所計算的每一層的可用比特數。
所述比特封裝單元260根據由可用比特修正器240修正的每一層的可用比特數，而以層為單位編碼實際音頻數據，並在不違背MPEG-4 BSAC語法的情況下，將輔助信息嵌入到所編碼的比特流中。
圖3是用於編碼MPEG-4 BSAC音頻比特流的設備的操作流程圖。
參照圖3，對輸入音頻信號進行編碼，轉換成比特流，並存儲為文件。首先，時/頻轉換器100利用修正的離散餘弦變換器(MDCT)或子帶濾波器把輸入音頻信號轉換成頻域信號。所述心理聲學建模單元110以預定子帶為單元捆綁頻率信號，並計算掩蔽閾值。在此，由於所採用的子帶主要用於量化處理，因此上述子帶又被稱為量化帶。在操作300中，所述量化/比特率控制器120對所述頻率信號進行分級量化，以使每個量化帶的量化噪聲的量值小於掩蔽閾值，從而允許人們聽到卻感覺不到。比特封裝單元130把由量化/比特率控制器120量化的數據編碼成由一個基層和多個增強層組成的分層比特流。所述基層是具有最低比特率的層。所述增強層具有比基層高的比特率，並且如果層得到增強，則比特率也隨著增高。從而，在操作310中計數BSAC的比特數，並在操作320中通過考慮到所要使用的比特數而計算層結構，來計算每一層的可用比特數。通過對所要使用的音頻數據的比特數進行計數，可以計算出每一幀所要分配的比特數。這裡，以幀為單位對音頻信號進行編碼。比特率的控制是指控制量化以適於分配給一幀的比特數。例如，如果可以給一幀分配1000比特，則必須確定適於該比特數的量化電平，並且如果可以給一幀分配10000比特，則可以比較精細地對量化電平進行劃分。
在計算出每一層的層結構和每層的可用比特數之後，根據該層結構，在操作330中對從基層到頂層的數據進行編碼，並在操作340中將所編碼的比特流存儲為文件。
圖4是根據本發明一個實施例的用於編碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的操作流程圖。
參照圖4，操作400中的轉換/量化過程、操作410中的BSAC比特計數過程、操作420中的通過考慮到所要使用的比特數並計算層結構來計算可用的比特數的過程、及操作460中將編碼比特流存儲為文件的過程，與上述圖3中的操作300中的轉換/量化過程、操作310中的BSAC比特計數過程、操作320中的通過考慮到所要使用的比特數並計算層結構來計算可用的比特數的過程、及操作340中將編碼比特流存儲為文件的過程相同。
因此，現在將描述根據本發明一個實施例的用於編碼具有輔助信息的MPEG-4 BSAC音頻比特流的設備的特殊操作。
在操作410中，可用比特計算器220中的比特計數器26對比特率受控的音頻數據的比特數進行計數，並且在操作420中，副層可用比特計算器28利用所要用的比特數和層數而獲得每一層的可用比特數。在操作430中，可用比特修正器240通過獲得要嵌入的輔助信息的大小來修正每一層的可用比特數。同樣，在操作440中，比特封裝單元260根據計算的層結構而編碼從基層到頂層的數據，並在操作450中，在編碼比特流的最後部分嵌入輔助信息。
所述輔助信息可以是關於音樂曲調的信息，例如歌名、歌詞、作曲者的姓名、及歌手姓名，或者是用戶的元數據如ID3v1。而且，所述輔助信息可以是用於改善音質的後處理信息和關於多通道數據的信息。
圖5是用於解碼MPEG-4 BSAC音頻比特流的設備的方框圖。參照圖5，所述設備包括比特拆分單元500、逆量化器510、及逆轉換器520。
比特拆分單元500按照在具有層結構的比特流中產生層的順序對量化數據進行解碼。即比特拆分單元500對包含在比特流中的比特的重要性進行分析，並按從頂層到基層的順序及每一層中從最高有效位到最低有效位的順序，對比特流中的比特進行解碼。逆量化器510把所解碼的量化數據恢復成具有原始大小的信號。逆轉換器520通過把頻域音頻信號轉換為時域音頻信號而允許用戶再現音頻信號。
圖6是根據本發明一個實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的設備的方框圖。參照圖6，所述設備包括比特拆分單元600、音頻解碼器610、層結構計算器630、輔助信息計算器640、及輔助信息提取器650。
比特拆分單元600解碼音頻比特流的報頭。層結構計算器630通過從報頭信息中獲得幀大小來計算所述音頻比特流的層結構。輔助信息計算器640從所述層結構中獲得一直到頂層的數據大小和幀的大小，並將一直到頂層的數據大小與幀的大小之間的差值確定為輔助信息的大小。輔助信息提取器650從音頻比特流中提取輔助信息，也就是對應於輔助信息大小的多個比特。所述音頻解碼器610根據所計算的層結構對一直到頂層的音頻比特流進行解碼，並包括逆量化器60和逆轉換器65。所述逆量化器60和所述逆轉換器65與圖5中的逆量化器510和逆轉換器520具有相同的功能。
圖7是根據本發明一個實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的方法的流程圖。
以與編碼處理相反的順序執行比特流解碼處理。首先，在操作700中對比特流的報頭信息進行解碼。在操作710中通過獲得來自報頭信息的幀的大小，來計算解碼所需的音頻數據的層結構。
考慮幀的大小來計算層結構的情況表明，當接收到幀的大小為1000比特而層數為10的信息時，每一層被分配100比特。在操作740中，從層結構中獲得一直到頂層的比特流的大小與幀的大小，並將所述一直到頂層的比特流的大小與幀的大小之間的差值確定為輔助信息的大小。而且，可以在執行操作700、710和740之後，判斷是否嵌入了MPEG-4音頻輔助信息。即如果幀的大小大於一直到頂層的數據的大小，則確定嵌入了所述輔助信息，而如果幀的大小不大於一直到頂層的數據的大小，則確定沒有嵌入輔助信息。
當在操作740中通過計算一直到頂層的數據的大小與幀的大小的差值而獲得所述輔助信息的大小時，如果一直到頂層的比特數為1000，即每一層100比特，並且所接收到的幀長度信息的大小為1050比特，則所述輔助信息的大小為50比特。因此，最後50比特被提取作為輔助信息。
也就是說，來自音頻比特流的輔助信息的大小對應於操作750中的輔助信息的大小。
另一方面，在操作720中，根據所計算的層結構而解碼所述一直到頂層的音頻數據。所述音頻信號的解碼從基層信息的解碼開始。在完成對分配給基層的大小的音頻數據的解碼後，解碼高一層的音頻數據的量化值。依此類推，解碼所有層的音頻數據和輔助信息。可以通過圖6中的逆量化器60和逆轉換器65來恢復該解碼處理所量化的數據。在操作730中，通過對量化數據進行逆量化和逆轉換來產生恢復的信號。
圖8是根據本發明另一實施例的用於解碼具有輔助信息的MPEG-4BSAC音頻比特流的另一方法的流程圖。
參照圖8，首先，在操作800中解碼比特流的報頭信息。在操作810中，通過獲得來自報頭信息的幀的大小而計算比特流的層結構。在操作820中，解碼來自比特流的層結構的、與一直到頂層的比特流的大小對應的音頻數據。在操作830中提取剩餘比特流作為輔助信息，並進行解碼。
所述MPEG-4 BSAC可利用層結構執行細粒度可量測性(FGS)。BSAC語法定義了所述層結構信息，並通過在操作700中提取所述信息和在操作710中使用所述信息來計算實際層數據。下面是用於計算每一層的可用比特數的偽代碼。所述偽代碼均勻應用於編碼器/解碼器中。在ISO/IEC 14496-3標準文件的第4.5.2.6.2款中示出了用於偽代碼的變量名。
For(layer＝0；layer＜(top_layer+slayer_size)；layer++){layer_si_maxlen[layer]＝0；for(cband＝layer_start_cband[layer]；cband＜layer_end_cband[layer]；cband++){for(ch＝0；ch＜nch；ch++){if(cband＝＝0)layer_si_maxlen[layer]+＝max_cband0_si_len；elselayer_si_maxlen[layer]+＝max_cband_si_len[cband_si_type[ch]]；}}1for(sfb＝layer_start_sfb[layer]；sfb＜layer_end_sfb[layer]；sfb++)for(ch＝0；ch＜nch；ch++)layer_si_maxlen[layer]+＝max_sfb_si_len[ch]+5；}for(layer＝slayer_size；layer＜＝(top_layer+slayer_size)；layer++){layer_bitrate＝nch*((layer-slayer_size)*1000+16000)；layer_bit_offset[layer]＝layer_bitrate*BLOCK_SIZE_SAMPLES_IN_FRAME；layer_bit_offset[layer]＝(int)(layer_bit_offset[layer]/SAMPLING_FREQUENCY/8)*8；if(layer_bit_offset[layer]＞frame_length*8)layer_bit_offset[layer]＝frame_length*8；}for(layer＝(top_layer+slayer_size-1)；layer＞＝slayer_size；layer--){bit_offset＝layer_bit_offset[layer+1]-layer_si_maxlen[layer]if(bit_offset＜layer_bit_offset[layer])layer_bit_offset[layer]＝bit_offset}for(layer＝slayer_size-1；slayer_size＞0；slayer--)layer_bit_offset[layer]＝layer_bit_offset[layer+1]-layer_si_maxlen[layer]；overflow_size＝(header_length+7)*8-layer_bit_offset
；layer_bit_offset
＝(header_length+7)*8；if(overflow_size＞0){for(layer＝(top_layer+slayer_size-1)；layer＞＝slayer_size；layer--){layer_bit_size＝layer_bit_offset[layer+1]-layer_bit_offset[layer]；layer_bit_size-＝layer_si_maxlen[layer]；if(layer_bit_size＞＝overflow_size){layer_bit_size＝overflow_size；overflow_size＝0；}elseoverflow_size＝overflow_size-layer_bit_size；for(m＝1；m＜＝layer；m++)layer_bit_offset[m]+＝layer_bit_size；if(overflow_size＜＝0)break；}}else{underflow_size＝-overflow_size；for(m＝1；m＜slayer_size；m++){layer_bit_offset[m]＝layer_bit_offset[m-1]+layer_si_maxlen[m-1]；layer_bit_offset[m]+＝underflow_size/slayer_size；if(layer＜＝(underflow_size％slayer_size))；layer_bit_offset[m]+＝1；}}for(layer＝0；layer＜(top_layer+slayer_size)；layer++)available_len[layer]＝layer_bit_offset[layer+1]-layer_bit_offset[layer]；如上所示，得到與每一層可用比特數對應的layer_bit_offset，並根據layer_bit_offset而解碼層內的音頻數據。
圖9是BSAC比特流的配置。圖10示出了在BSAC比特流中嵌入輔助信息的位置。
可按如下所示使用本發明。
第一，當利用MPEG-4 BSAC音頻編碼器以48Kbps的速率壓縮音頻數據時，可在以下情況下使用本發明，編碼音頻數據使得所述音頻數據僅覆蓋0-7KHz的頻率子帶，利用光譜帶複製(SBR)為7-16KHz的信息產生比特流，嵌入所述SBR比特流作為輔助信息，以及將嵌入了所述SBR比特流的比特流存儲為文件。在這種情況下，可以在能識別所述SBR輔助信息的解碼器中解碼0-16KHz的聲音數據，並且在低比特率的情況下提供好質量。但是，由於在傳統的MPEG-4 BSAC解碼器中不可能提取所述SBR輔助信息，所以能聽到具有0-7KHz頻帶的聲音，並所述SBR數據被認為為偽數據。
第二，當用MPEG-4 BSAC音頻編碼器壓縮具有128Kbps的速率的音頻數據時，可以用本發明嵌入歌詞。即，可以通過在音頻比特流中安排音頻數據的歌詞和時間信息、以及將對應於每個時間的歌詞信息編碼為輔助信息，而在沒有附加時間信息的情況下輸出歌詞。在傳統的MPEG-4 BSAC解碼器中，不能接收歌詞信息，僅能解碼聲音。
本發明還可以實施為計算機可讀記錄介質上的計算機可讀代碼。所述計算機可讀記錄介質為可以存儲以後可被計算機系統讀出的數據的任何數據存儲裝置。計算機可讀記錄介質的例子包括只讀存儲器(ROM)、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤、光數據存儲裝置。
如上所述，在根據本發明實施例的用於編碼/解碼嵌入了輔助信息的MPEG-4 BSAC音頻比特流的方法和設備中，在通過嵌入輔助信息來提供使用BSAC的服務的情況下，可以通過提供能改善音頻內容的元數據或音質的附加數據來提供與眾不同的服務。
並且，由於所述方法和設備允許插入不能使用MPEG-4 BSAC語法的輔助信息，所以當再現音頻數據時，也可以通過嵌入音頻元數據來向用戶附加地提供媒體信息。
也可以通過嵌入用於音頻後處理的輔助信息，而在低比特率的情況下提供高音質。
並且，由於即使嵌入了輔助信息，所述方法和設備也允許使用傳統的解碼器，所以可以合適地使用傳統的解碼器。而且，通過提供輔助信息，而改善了能夠處理輔助信息的解碼器與傳統解碼器相比的競爭力。
儘管已參考本發明的示範實施例而具體示出和描述了本發明，但是本領域技術人員應明白在不脫離以下權利要求限定的本發明的精神和範圍的情況下，可在其中進行形式和細節的各種改變。
權利要求
1.一種用於編碼具有輔助信息的MPEG-4 BSAC音頻比特流的方法，所述方法包括
把時域音頻信號轉換為頻域音頻信號，並利用心理聲學模型對該音頻信號進行量化；
對比特率受控的音頻數據的比特數進行計數；
利用要使用的比特數和要使用的層數而獲得每一層可用的比特數；
通過獲得輔助信息的大小而修正每一層可用的比特數；
以層為單位編碼實際音頻數據；及
在編碼比特流中嵌入輔助信息。
2.如權利要求1所述的方法，其中所述輔助信息是關於音質改善的信息。
3.如權利要求1所述的方法，其中所述輔助信息是關於音樂曲調的信息。
4.如權利要求1所述的方法，其中所述輔助信息是關於多通道數據的信息。
5.一種用於編碼具有輔助信息的MPEG-4 BSAC音頻比特流的設備，所述設備包括
量化處理器，用於把時域音頻信號轉換為頻域音頻信號，並利用心理聲學模型量化所述音頻信號；
可用比特計算器，用於利用音頻數據的比特數和層數而獲得每一層可用的比特數；
可用比特修正器，用於通過獲得輔助信息的大小，而修正由可用比特計算器計算出的每一層可用的比特數；及
比特封裝單元，用於根據由可用比特修正器修正的每一層可用的比特數，而編碼實際音頻數據，並把輔助信息嵌入到所編碼的比特流中。
6.如權利要求5所述的設備，其中所述可用比特計算器包括
比特計數器，用於對比特率受控的音頻數據的比特數進行計數；和
副層可用比特計算器，用於利用由所述比特計數器計數得到的比特數和預定層數，而獲得每一層可用的比特數。
7.一種用於解碼具有輔助信息的MPEG-4 BSAC音頻比特流的方法，所述方法包括
解碼音頻比特流的報頭；
通過從報頭信息中獲得幀的大小，來計算音頻比特流的層結構；
從層結構中獲得一直到頂層的數據大小和幀的大小，並將一直到頂層的數據的大小與幀的大小之間的差值確定為輔助信息的大小；
根據所述輔助信息的大小，而從所述音頻比特流中提取所述輔助信息；及
根據所計算的層結構，而解碼所述音頻比特流一直到頂層。
8.如權利要求7所述的方法，其中所提取的輔助信息是關於音質改善的信息。
9.如權利要求7所述的方法，其中所提取的輔助信息是音頻數據用戶的元數據。
10.一種用於解碼具有輔助信息的MPEG-4 BSAC音頻比特流的方法，所述方法包括
解碼比特流的報頭；
通過從報頭信息中獲得幀的大小，來計算比特流的層結構；
對來自比特流的層結構的與一直到頂層的音頻數據大小對應的音頻數據進行解碼；和
提取剩餘比特流作為輔助信息，並解碼所述輔助信息。
11.如權利要求10所述的方法，其中所提取的輔助信息是關於音質改善的信息。
12.如權利要求10所述的方法，其中所提取的輔助信息是音頻數據用戶的元數據。
13.一種用於區分在用MPEG-4 BSAC音頻數據編碼的音頻數據中是否嵌入有輔助信息的方法，方法包括
解碼比特流的報頭；
通過從所述報頭信息中獲得幀的大小，來計算所述比特流的層結構；和
從層結構中獲得一直到頂層的數據大小和幀的大小，並利用所述一直到頂層的數據大小和幀的大小之間的差值，來區分是否存在輔助信息。
14.一種用於解碼具有輔助信息的MPEG-4 BSAC音頻比特流的設備，所述設備包括
比特拆分單元，用於解碼音頻比特流的報頭；
層結構計算器，用於通過從所述報頭信息中獲得幀的大小，而計算所述音頻比特流的層結構；
輔助信息計算器，用於從層結構中獲得一直到頂層的數據大小和幀的大小，並將所述一直到頂層的數據大小與幀的大小之間的差值確定為輔助信息的大小；
輔助信息提取器，用於根據所述輔助信息的大小，而從所述音頻比特流中提取所述輔助信息；和
音頻解碼器，用於根據所計算的層結構，而解碼所述音頻比特流一直到頂層。
15.一種在其上記錄有計算機可讀程序的計算機可讀介質，所述計算機可讀程序用於執行權利要求1至4和7至13中的任一個的方法。
全文摘要
提供了一種用於編碼/解碼具有輔助信息的MPEG－4位片算術編碼(BSAC)音頻比特流的方法和設備。所述編碼方法包括把時域音頻信號轉換為頻域音頻信號，並量化所述音頻信號；對數據比特數進行計數；獲得每一層可用的比特數；考慮到輔助信息的大小而修正每一層可用的比特數；以層為單位編碼實際音頻數據；並在編碼比特流中嵌入輔助信息。所述解碼方法包括解碼報頭；計算音頻比特流的層結構；將一直到頂層的數據的大小與幀的大小之間的差值確定為輔助信息的大小；根據所述輔助信息的大小，而提取所述輔助信息；並解碼所述音頻比特流。當通過持有輔助信息而提供使用BSAC的服務時，能改善音頻內容的元數據和音質。
文檔編號H03M7/30GK1684523SQ20041010379
公開日2005年10月19日申請日期2004年11月26日優先權日2003年11月26日
發明者金重會, 李時和, 金尚煜, 吳殷美, 金度亨申請人:三星電子株式會社

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

用於編碼/解碼具有輔助信息的音頻比特流的方法和設備的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法