轉碼方法、裝置和通信設備的製作方法
2023-05-07 12:13:41 1
專利名稱:轉碼方法、裝置和通信設備的製作方法
技術領域:
本發明關於網絡通信技術,特別關於轉碼方法及其裝置。
背景技術:
基於碼激勵線性預測(CELP :Code-Excited Linear Prediction)的語音編碼是當今語音在網際網路協議中的應用(VoIP:Voice on Internet Protocol)和移動通信系統中的核心技術之一,為了實現不同供應商之間通信設備的兼容與互通,需要進行不同CELP語音編碼標準間的轉碼工作。 目前,解決這種問題的方法包括直接轉碼(DTE :Decode Then Encode),即用發送端的解碼器將傳輸的比特流進行解碼後恢復出重建語音,再應用接收端的編碼器對重建語音進行編碼,生成接收端解碼器可以解碼的比特流,再傳送至接收端。發明人在實現本發明的過程中發現現有技術的缺陷在於降低了合成語音質量,增加了計算複雜度和總的延遲。[OO(H] 在涉及到非連續性傳輸(DTX-Discontinuous Transmission)的轉碼算法中,發明人在實現本發明的過程中發現現有技術的缺陷在於需要在媒體網關或基站中要恢復成合成語音,且對於目標端非語音參數的求取均要採用DTE方法求得,這些操作增加了轉碼部分的計算複雜度及總的延遲、增加成本且效率降低。 此外,目前所涉及的非連續性傳輸(DTX)轉碼算法僅僅針對發送端和目標端都打開DTX情況下提出了解決方案,但是無法滿足發送端或目標端只有一方打開非連續傳輸情況、或者在不知道發送端是否打開非連續性傳輸的情況下的轉碼操作。因為在發送端不打開DTX而目標端打開DTX轉碼情況下,源比特流的幀類型信息均為語音幀,這樣,無法確定目標幀的類型信息;在發送端打開DTX而目標端不打開DTX的情況下,則不需要確定目標幀類型,此時目標幀的類型信息均為語音幀,目前無法獲知從SID幀或者不傳輸幀向語音幀轉碼的方式。
發明內容
本發明實施例的目的在於提供一種轉碼方法、裝置和通信設備,根據接收端使用非連續性傳輸DTX屬性、輸入的比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。 為實現上述目的,本發明實施例提供一種轉碼方法,該方法包括接收發送端輸入
的比特流;確定接收端使用非連續性傳輸屬性、以及所述輸入的比特流的幀類型;根據確
定的結果採用相應的處理方式對所述輸入的比特流進行轉碼。
為實現上述目的,本發明實施例提供一種轉碼裝置,該裝置包括 接收單元,所述接收單元用於接收發送端輸入的比特流; 確定單元,所述確定單元用於確定接收端使用非連續性傳輸屬性、以及所述輸入的比特流的幀類型; 第一處理單元,所述第一處理單元用於根據確定的結果採用相應的處理方式對所述輸入的比特流進行轉碼。 為實現上述目的,本發明實施例提供一種通信設備,該通信設備包括權利要求14至16的任意一項權利要求的轉碼裝置。 本發明實施例的有益效果在於,本發明實施例根據接收端使用非連續性傳輸DTX屬性、以及輸入的比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。
此處所說明的附圖用來提供對本發明實施例的進一步理解,構成本申請的一部分,並不構成對本發明實施例的限定。在附圖中
圖1是本發明實施例1的轉碼方法流程圖; 圖2是本發明實施例2的在發送端不使用DTX且接收端使用DTX的情況下步驟103的處理流程圖; 圖3是本發明實施例2的在發送端使用DTX且接收端不使用DTX的情況下步驟103的處理流程圖; 圖4是本發明實施例2的在發送端使用DTX且接收端使用DTX的情況下步驟103的處理流程圖; 圖5是本發明實施例2的圖4的步驟403中目標幀為非語音幀時的處理流程 圖6是本發明實施例3的轉碼方法流程 圖7是本發明實施例3中FEC算法流程 圖8是本發明實施例4的轉碼裝置構成示意 圖9是本發明實施例5的轉碼裝置構成示意圖。
具體實施例方式
為使本發明實施例的目的、技術方案和優點更加清楚明白,下面結合附圖,對本發明實施例作進一步詳細說明。在此,本發明的示意性實施例及其說明用於解釋本發明,但並不作為對本發明的限定。
實施例1 本發明實施例提供一種轉碼方法,如圖1所示,該方法包括接收發送端輸入的比特流(見步驟101);確定接收端使用非連續性傳輸屬性、以及該輸入的比特流的幀類型(見步驟102);根據確定的結果採用相應的處理方式對該輸入的比特流進行轉碼(見步驟103)。 在本發明實施例中,在步驟102中,確定接收端是否使用非連續性傳輸、以及該輸入的比特流的幀類型可包括以下幾種情況接收端使用DTX且該輸入的比特流的幀類型為語音幀或非語音幀、接收端不使用DTX且該輸入的比特流的幀類型為語音幀或非語音幀。
6這樣,可對各種類型的輸入的比特流進行處理,並能夠按照接收端的要求對輸入的比特流
進行相應的轉碼。並且該方法對發送端使用或不使用DTX的情況均適用。 由上述實施例可知,該方法根據接收端使用非連續性傳輸DTX屬性、以及該輸入
的比特流幀類型,對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比特
流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降低
合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。 實施例2 本發明實施例提供一種轉碼方法,該方法所採用的步驟如圖1所示。 在步驟102中,確定接收端使用非連續性傳輸屬性、以及該輸入的比特流的幀類
型可採用如下方式 可根據預先配置的參數確定該接收端是否使用非連續性傳輸DTX。例如,根據DTX開關,即DTX_0N或者DTX_0FF來確定該接收端是否使用非連續性傳輸。
可通過對該輸入的比特流的幀類型進行解碼,以獲取輸入的比特流的幀類型,該幀類型包括語音幀和非語音幀,其中,該非語音幀可包括非傳輸幀(N0_DATA)和靜音插入描述幀(SID:Silence Insertion Descriptor)。其中,可根據當前幀的幀類型標識確定當前幀的幀類型。例如,在G. 729ab中應用的幀類型FrameType有三類,分別由0,1,2來代表。O表示當前幀為不傳輸幀(N0_DATA Frame) , 1表示當前幀為語音幀(Active SpeechFrame),2代表當前幀為舒適噪聲插入幀(SID Frame)。 以下參考附圖對步驟103中的根據確定的結果採用相應的處理方式對處理後的該輸入的比特流進行轉碼進行詳細說明。 第一種接收端使用DTX且該輸入的比特流的幀類型為語音幀。
以下以從AMR碼流向G. 729ab碼流轉碼為例進行詳細說明。
如圖2所示,可採用如下方式對輸入的比特流進行轉碼。
步驟201,對輸入的比特流進行解碼後生成合成語音; 在本實施例中,可採用與該發送端相應的編碼方式對該輸入的比特流進行解碼並生成合成語音,這樣,可根據該合成語音用於判斷目標語音激活檢測(VAD :Voice ActivityDetector)結果。其中,該解碼算法和生成合成語音的方法可採用現有的任何一種,此處不再贅述。 步驟202,根據該合成語音判斷目標幀類型; 在本實施例中,可採用AMR-VADl算法和接收端的非連續性傳輸(DTX)算法確定該目標幀的類型。例如,可根據該合成語音應用自適應多速率窄帶編碼器(AMR-NB)編碼中的VAD算法(AMR-VAD1)來確定目標幀VAD結果,即判斷該目標幀是語音幀還是靜音幀),結合VAD結果及接收端(如AMR向729轉碼,接收端指729)DTX算法確定目標幀類型。在這種情況下,從AMR向G. 729ab轉碼算法中,使用AMR中所使用的VAD1檢測算法來代替729的VAD算法具有以下效果(l)該算法不需要LPC分析的部分結果,只需要輸入語音,且其計算複雜度與729ab中所用的計算複雜度相當;(2)AMR所用的VAD1算法針對輸入160個樣點做一次VAD判決,原729ab針對輸入80個樣點做一次VAD判決。應用AMR VAD1算法可以節省VAD判決部分一半的計算複雜度。但不限於此,還可採用其它算法確定目標幀類型。
步驟203,若該目標幀類型為語音幀,則採用語音幀參數轉碼算法對該合成語音進行轉碼,以獲得輸出的比特流;其中,該語音幀參數轉碼算法可採用現有技術的任何一種,此處不再贅述。 步驟204,若該目標幀類型為非語音幀,並確定該非語音幀為非傳輸幀,或者為靜音插入描述(SID)幀。 步驟205,若該非語音幀為非傳輸幀,即N0_DATA幀,則將該非傳輸幀,N0_DATA的幀類型傳出。 步驟206,若該非語音幀為靜音插入描述幀(SID),則對該目標幀,即SID幀需要的參數信息進行轉碼。 在本實施例中,該參數信息可包括線譜對(LSP :Line Spectrum Pair)參數和能量參數。其中, 對該LSP參數轉碼將原比特流,即輸入的比特流中LSP信息解碼後按照目標編碼器量化方法重新量化後寫入輸出的比特流。 對該能量參數轉碼由於AMR-NB與G. 729ab所量化的能量信息所衡量的信號域不同,因此,在能量參數轉碼時,需要進行一定的轉換,步驟如下 1)將解碼部分參數得到的AMR-NB各幀的激勵信號傳出(因為接收端VAD需要合成語音,因此,激勵信號是可以得到的)。 2)以80個樣點為單位,求取激勵信號的平均增益值Gare :
"ve ,^ - " 但不限於此,還可根據實際需要採用其它數量的樣點。
3)計算用於729ab內SID幀的能量值POWER :POWER = 101ogl。 (Gave)2
4)按照目標端能量量化方法,如729,進行量化後寫入輸出的比特流。
步驟207,將獲得的輸出的比特流進行輸出。 由上述可知,以從AMR碼流向729碼流轉碼為例進行詳細說明。下面參照附圖2對從G. 729ab碼流向AMR碼流轉碼的情況進行說明。 在步驟202中,目標幀類型的確定可採用如下方式可使用目標編碼器中所提供的VAD檢測算法VAD1或者VAD2,其中該VAD1或VAD2算法為AMR的兩種VAD判決方法。應用該VAD算法來確定目標幀是否屬於語音幀。 步驟203、204、205與上述類似,在步驟206中,若該非語音幀為SID幀,且該SID幀為SID_FIRST幀或SID_UPDATE幀,則需要針對接收端SID的要求將各個參數信息進行轉碼,可採用如下方式 1)根據DTX機制判斷是否需要HANGOVER控制,如果需要,則需要進行緩存處理,用於SID_FIRST幀時提供相應的信息;2)若當該目標幀類型被判定為SID_UPDATE幀,則需要將目標幀,即SID幀需要的參數信息進行轉碼操作,該參數信息包括LSP參數和能量參數;
其中,LSP參數轉碼將原比特流,即輸入的比特流中LSP信息解碼後按照目標編碼器量化方法重新量化後寫入輸出的比特流; 能量參數轉碼由於AMR-NB與G. 729ab對能量信息進行計算的信號域不同,因此,在能量參數轉碼時,需要進行一定的轉換。由於接收端用於VAD算法時需要合成語音,因此,在能量參數轉碼時,採用採用AMR-NB或者G. 729ab的能量參數求取方法的方法進行轉碼操作。
第二種接收端不使用DTX、輸入的比特流的幀類型為非語音幀。
在這種情況下,可先獲得目標幀所需要的參數信息;然後採用接收端的參數編碼
算法,對獲得的該目標幀所需要的參數信息進行編碼並寫入輸出的比特流。
如圖3所示,該方法包括 步驟301,對該輸入的比特流進行解碼,以提取出該輸入的非語音幀所包含的LSP參數和能量參數。在本實施例中,採用DTX解碼算法提取該輸入的非語音幀所包含的LSP參數和能量參數。 步驟302,對該LSP參數和能量參數進行轉碼,生成目標幀所需要的LSP參數信息和代數碼書增益信息。 在本實施例中,對該LSP參數進行轉碼可根據實際情況採用上述方式進行轉碼。
在本實施例中,可採用如下方式將能量參數向代數碼書增益信息進行轉碼
1)將由輸入的比特流轉換為參數得到AMR-NB各子幀的激勵信號傳出;
2)以40個樣點為單位,求取激勵信號的平均增益值Gare :
n~~^G,二」一Zexc —畫K02 但不限於此,還可根據實際需要採用其它數量的樣點進行計算。
3)對平均增益值進行幅度調整後得到目標域代數碼書增益G' _ :
G' are = 3XGare 4)按照接收端代數碼書量化方法進行量化後寫入輸出的比特流。 步驟303,使用基音延遲產生算法、增益產生算法和代數碼書產生算法分別生成目
標幀所需要的基音、碼書增益和代數碼書參數信息;其中,該基音延遲產生算法、增益產生
算法和代數碼書產生算法可採用現有的任何一種,此處不再贅述。 其中,該步驟303可與步驟302同時進行。 步驟304,在獲得上述全部目標語音幀所需要的參數後,使用接收端的參數編碼算法對獲得的各個參數進行編碼處理後寫到輸出比特流中。
步驟305,將輸出比特流進行輸出。 第三種接收端使用DTX且輸入的比特流的幀類型為非語音幀。
以下參考附圖4對這種情況下的轉碼方法進行說明。
步驟401,對輸入的比特流進行解碼後生成合成語音;
步驟402,根據該合成語音判斷目標幀類型; 其中,步驟401、402與第一種情況中的步驟201、202類似,此處不再贅述。
步驟403,根據該目標幀類型對該輸入的比特流進行相應的轉碼。
步驟404,對獲得的輸出的比特流進行輸出。 在本實施例中,若該目標幀為語音幀,在步驟403中,該根據目標幀類型對該輸入的比特流進行相應的轉碼可採用如圖3所示的第二種情況的流程,即接收端不使用DTX且輸入的比特流的幀類型為非語音幀的情況進行處理,此處不再贅述。 在本實施例中,若該目標幀為非語音幀,獲得目標幀所需要的參數信息;採用接收端的參數編碼算法對獲得的目標幀所需要的參數信息進行編碼並寫入輸出的比特流。如圖5所示,包括 步驟501,採用非連續性傳輸解碼(DTX)算法提取該輸入的比特流中包含的LSP參 數和能量參數; 步驟502,對該LSP參數和該能量參數進行轉碼,以獲取目標幀所需要的LSP參數 信息和能量參數信息; 步驟503,採用接收端的參數編碼算法對獲得的該目標幀所需要的參數信息進行 編碼並寫入輸出的比特流。 第四種,接收端未使用非連續性傳輸且輸入的比特流的幀類型為語音幀。 這種情況可採用語音幀參數轉碼算法對該輸入的比特流進行轉碼。 由上述實施例可知,該方法根據接收端使用非連續性傳輸DTX屬性、以及輸入比
特流的幀類型的四種情況對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸
入的比特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可
在不降低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。 實施例3 本發明實施例提供一種轉碼方法,在實施例2的基礎上進一步考慮到丟幀的情
況,如圖6所示,該方法包括 步驟601,接收發送端輸入的比特流; 步驟602,判斷該輸入的比特流是否丟幀。 步驟603,若判斷結果為未丟幀,則確定接收端使用非連續性傳輸屬性、以及所述 輸入的比特流的幀類型; 在本實施例中,確定接收端使用非連續性傳輸屬性、以及輸入的比特流的幀類型 可採用實施例2的方式,此處不再贅述。 步驟604,根據確定的結果採用相應的處理方式對該輸入的比特流進行轉碼。這
時,可採用實施例2的四種情況下的轉碼過程進行處理,此處不再贅述。 步驟605,在步驟602中,若判斷結果為丟失幀,則採用FEC算法對丟失幀的輸入的
比特流進行處理。 步驟606,確定接收端使用DTX屬性; 步驟607,根據確定的結果採用相應的處理方式對處理後的該輸入的比特流進行 轉碼。在本實施例中,該確定的結果為接收端是否使用DTX、輸入的比特流的幀類型,其中, 該比特流的幀類型在採用FEC算法對丟幀的比特流進行處理時已經確定。可採用實施例2 的四種情況下的轉碼過程進行處理,此處不再贅述。 其中,步驟605、606的順序僅僅為本發明實施例,可先執行步驟606、再執行步驟 605. 步驟608,將轉碼後的輸出的比特流進行輸出。 在本實施例中,在步驟605中,對丟失幀的輸入的比特流進行處理可採用如下方 式,如圖7所示,包括 步驟701,判斷發生丟幀的輸入的比特流的幀類型; 在本實施例中,對當前幀的幀類型進行判斷可採用如下方式如果當前幀發生丟 失,若前一個幀的類型為語音幀,則當前幀的類型也判定為語音幀。若前一個丟失幀的類型
10是SID幀或者N0_DATA幀,則當前幀的類型被定為SID幀或N0_DATA幀。這是因為N0_DATA
幀內不包含任何有用信息,因此,該N(U)ATA幀的丟失不會對解碼造成影B向。步驟702,若發
生丟幀的輸入的比特流的幀類型為語音幀,則對待轉碼的參數進行恢復。 步驟703,若發生丟幀的輸入的比特流的幀類型為非語音幀,判斷該非語音幀為非
傳輸幀或SID幀, 步驟704,若為非傳輸幀,則對該發生丟幀的輸入的比特流不作處理。 步驟705,若為靜音插入描述幀,則對待轉碼的參數進行恢復。 在步驟702中,當判斷該丟失幀的輸入的比特流的幀類型為語音幀時,以下分別
對從AMR碼流向729ab碼流轉碼、從729ab碼流向AMR碼流進行轉碼時對待轉碼參數進行
恢復進行說明。 第一種情況在從AMR碼流向729ab碼流轉碼的情況,需要恢復的參數可包括LSP 參數、基音參數、代數碼書參數和增益參數,對這些參數進行恢復可採用如下方式
l)LSP參數的恢復 丟失幀的LSP參數lsp_ql、 lsp_q2由前一個幀的LSP參數past_lsp_q和LSP參 數均值meanjsp決定,如下式 lsp_ql(i) =lsp_q2(i) = 0. 9 Xpast_lsp_q (i)+0. 1 Xmean_lsp (i) , i = 0____9 上式中的插值因子取值為0.9。在非AMR122模式下,只恢復出一組LSP參數;在 AMR122模式下,恢復出兩組相同的LSP參數。其中pastjsp—q(i)為前一個幀量化後的LSP 參數,mean—lsp(i)為LSP參數的均值。用於偏移平均(MA :Moving Average)預測的歷 史狀態的更新與正常解碼時相同。
2)基音參數的恢復 在發生幀丟失時,通常用前一個幀的基音信息作為當前丟失幀的基音值。當前丟 失幀的基音值的精度直接影響著合成語音的質量。由丟失幀之前多幀的信息來恢復當前的 丟失幀信息比只用丟失幀前一個幀信息來恢復當前丟失幀信息的性能會更加好。在本實施 例中,應用線性預測的方法來得到當前幀的基音信息。預測模型如下
Pitch' (i) = x+yXi 其中Pitch(i), i = 0,1,2,3,4為丟失幀之前各幀的基音值,Pitch(0)是最早的 基音值。
當前丟失幀Pitch' (5)由下式得到
Pitch' (5) = x+5y 為了確定係數a和b,採用均方誤差最小準則推倒出a, b的值
4 4
五=Z [乃Yc//(0 —屍//(^(/)]2 = Z [X +少X Z'—屍Z'/C/Z(/)]2
Z=0 '.=0
使服/& = 0和朋/^ = 0,得到
4 4 3Z屍"A(0 — x
》x賜(/)-2Z賜(/)
少_
0130] 3)代數碼書參數的恢復
0131] 代數碼書參數採用隨機生成的方法,在所提出的非DTX轉碼算法中,只在AMR795 和AMR74兩個模式下需要對代數碼書參數進行恢復。生成兩個隨機數,第一個隨機數由13 比特構成,按3,3,3,4比特進行截斷,分別對應各個軌道上脈衝的位置;第二個隨機數由4 比特構成,分別代表4個軌道上脈衝的符號。
0132] 4)增益參數的恢復
0133] 根據解碼端的轉碼情況,對增益參數gP、 gE採用下述的恢復方法,見下式
0134]gP叫 —一
0135] 其中,mean_gp_past5代表歷史5點自適應碼書增益量化後的均值,state為解 碼端確定的狀態號,P(l) = P(2) = 0. 98, P(3) = 0. 8, P(4) = 0. 3, P(5) = P(6) = 0. 2。 gp(-l)代表上一幀量化後得到的自適應碼書增益值。
0136]g( = <j — 一
0137] 其中,mean_gC_paSt5代表歷史5點代數碼書增益量化後的均值,state為解碼端 確定的狀態號,C(l) = C(2) = C(3) = C(4) = C(5) = 0. 98, C(6) = 0. 7。 gc(_l)代表上 一幀量化後得到的代數碼書增益值。
0138] 針對增益參數量化時MA預測用的歷史需要進行更新,將歷史殘差的均值對當前 歷史ener(O)進行更新,如下式
第二種情況在從729ab碼流向AMR碼流轉碼的情況,需要恢復的參數可包括如下 l)LSP參數的恢復
LSP參數由上一個接收到的好幀的LSP參數替代,用於LSP參數量化的MA預測器 的狀態由下式更新
酬/,=[《)-i> -i>a) i ="…",10
0144] 其中,MA預測器的係數Pi,k是由上一個好幀來代替的。 0145] 2)基音參數的恢復
0146] 對基音參數進行恢復時,如果是第一個壞幀,則用上一個好幀第二子幀的整數基 音作為當前丟失幀的整數基音延遲,分數基音延遲置零;此後將上一個好幀第二子幀的整 數基音值加1存儲起來,在發生連續錯幀時,則用加1後的基音值進行代替即可。自加後的 基音值上限規定為143,但不限於此。
3)代數碼書參數的恢復
0139]
0140]
參數 0141] 0142]
12
對代數碼書參數進行恢復時,生成兩個隨機數,第一個隨機數由13比特構成,按 3,3,3,4比特進行截斷,分別對應各個軌道上脈衝的位置;第二個隨機數由4比特構成,分 別代表4個軌道上脈衝的符號。
4)增益參數的恢復對於增益參數gf0 、 gr的恢復,均採用將上一幀增益參數值的衰減值作 為當前幀的增益參數,見下式 其中g。代表代數碼書增益,m代表當前幀,m-1代表上一幀。g,)二0.9《-" 其中gp代表自適應碼書,m代表當前幀,m-l代表上一幀。 針對增益參數量化時MA預測用的歷史需要進行更新,將歷史殘差的均值進行衰 減後對當前歷史進行更新,如下式 =(0.25t"(w—')) —4.0
/ = 1 5)激勵信號的構成 激勵信號由上述生成基音延遲並且插值後的自適應碼書和上述隨機生成的代數 碼書構成,分別再乘以上述的恢復得到的自適應碼書和代數碼書增益。 由上述可知,對待轉碼的參數進行恢復後,可採用實施例2中的第一種或第四種 情況對應的處理過程對恢復後的輸入的比特流進行處理,處理過程如實施例2所述,此處 不再贅述。 在步驟705,若為靜音插入描述幀(SID),以下分別對從AMR碼流向729ab碼流轉 碼、從729ab碼流向AMR-NB碼流進行轉碼時對待轉碼的參數進行恢復的兩種情況進行說 明。 第一種情況在從AMR碼流向729ab碼流轉碼的情況 可直接應用前一個SID幀的LSP參數代替當前幀的LSP參數,前一個SID幀的能
量參數代替當前SID幀的能量參數。 第二種情況從729ab碼流向AMR-NB碼流進行轉碼的情況
若當丟失幀為SID幀時,則需要分以下兩種情況進行討論 (1)如果丟失的SID幀不是非語音段的第一個SID幀,則可以用前一個SID幀的 LSP參數代替當前幀的LSP參數,前一個SID幀的能量參數代替當前SID幀的能量參數;
(2)如果丟失的SID幀是非語音段的第一個SID幀,LSP參數則由上一個好幀的 LSP參數替代;將上一個好幀的激勵信號能量經過SID增益量化後的增益值作為當前丟失 SID幀的能量參數。 由上述可知,對待轉碼的參數進行替換後,可採用實施例2中的第二種或第三種 情況對應的處理過程對代替後的輸入的比特流進行處理,處理過程如實施例2所述,此處 不再贅述。 由上述實施例可知,該方法根據接收端使用非連續性傳輸DTX屬性、以及輸入的
13比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比特 流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降低 合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。
實施例4 本發明實施例提供一種轉碼裝置。如圖8所示,該裝置包括接收單元801 、確定單 元802和第一處理單元803 ;該接收單元801用於接收發送端輸入的比特流;該確定單元 802用於確定接收端使用非連續性傳輸屬性、以及該輸入的比特流的幀類型;該第一處理 單元803用於根據確定的結果採用相應的處理方式對該輸入的比特流進行轉碼。
在本實施例中,該確定單元802確定該接收端是否使用連續性傳輸(DTX)、該輸入 的比特流的幀類型的確定方式以及確定結果如實施例2、3所述,此處不再贅述。
該轉碼裝置的工作流程與實施例1類似,此處不再贅述。
該裝置可單獨使用,也可與基站或媒體網關集成在一起使用。 由上述實施例可知,該裝置可根據接收端使用非連續性傳輸DTX屬性、以及輸入 的比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比 特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降 低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。
實施例5 本發明實施例提供一種轉碼裝置。如圖9所示,該裝置包括接收單元801 、確定單 元802和第一處理單元803,其作用與實施例4類似。 此外,如圖9所示,該裝置還包括輸出單元901 ,該輸出單元901用於輸出轉碼後的 輸出的比特流。 在該第一處理單元803進行處理之前,還可對輸入的比特流進行檢測,檢測該輸 入的比特流是否丟失幀,因此,該裝置還包括檢測單元902和第二處理單元903 ;其中,該檢 測單元902與該確定單元802和該第一處理單元803連接,用於檢測該輸入的比特流是否 丟失幀;若檢測結果為未丟失幀,則該第一處理單元803根據確定的結果採用相應的處理 方式對該輸入的比特流進行轉碼;若該檢測單元902檢測結果為丟失幀,則該第二處理單 元903採用幀擦除掩蔽(FEC)算法對該輸入的比特流進行處理; 並且該第一處理單元803用於根據確定的結果採用相應的處理方式對該第二處 理單元903處理後的該輸入的比特流進行轉碼。 在本實施例中,該第一處理單元803可根據確定單元802確定的不同情況對輸入
的比特流進行處理,該處理過程如實施例2的四種情況所述,此處不再贅述。 在本實施例中,該第二處理單元903採用FEC算法進行處理,該處理過程如實施例
3所述,此處不再贅述。 由上述實施例可知,該裝置可根據接收端使用非連續性傳輸DTX屬性、以及輸入 的比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比 特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降 低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。並且對 於發送端使用和不使用DTX的情況均適用。
實施例6
14
本發明實施例還提供一種通信設備,該設備可包括轉碼裝置,其中該轉碼裝置可
採用實施例4、實施例5中的任何一種,此處不再贅述。 在本實施例中,該通信設備可以為基站或媒體網關等通信設備。 由上述實施例可知,該通信設備可根據接收端使用非連續性傳輸DTX屬性、以及
輸入的比特流的幀類型對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入
的比特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在
不降低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。並
且對於發送端使用和不使用DTX的情況均適用。 以上所述的具體實施例,對本發明的目的、技術方案和有益效果進行了進一步詳 細說明,所應理解的是,以上所述僅為本發明的具體實施例而已,並不用於限定本發明的保 護範圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本 發明的保護範圍之內。
權利要求
一種轉碼方法,其特徵在於,所述方法包括接收發送端輸入的比特流;確定接收端使用非連續性傳輸屬性、以及所述輸入的比特流的幀類型;根據確定的結果採用相應的處理方式對所述輸入的比特流進行轉碼。
2. 根據權利要求1所述的方法,其特徵在於,所述確定接收端是否使用非連續性傳輸, 包括根據配置的參數判斷所述接收端是否使用非連續性傳輸;所述確定輸入的比特流的幀類型,包括 對所述輸入的比特流進行解碼,以獲取幀類型信息;根據所述幀類型信息確定所述輸入的比特流的幀類型;所述幀類型包括語音幀和非語 音幀。
3. 根據權利要求1所述的方法,其特徵在於,若確定所述接收端使用非連續性傳輸且 所述輸入的比特流的幀類型為語音幀,則所述根據確定的結果採用相應的處理方式對所述 輸入的比特流進行轉碼,包括對所述輸入的比特流進行解碼後生成合成語音; 根據所述合成語音判斷目標幀類型;若所述目標幀類型為語音幀,則採用語音幀參數轉碼算法對所述合成語音進行轉碼; 若所述目標幀類型為非語音幀且為非傳輸幀,則將所述非傳輸幀的幀類型傳出; 若所述目標幀類型為非語音幀且為靜音插入描述幀,則對所述目標幀需要的參數信息 進行轉碼。
4. 根據權利要求1所述的方法,其特徵在於,若確定所述接收端不使用非連續性傳輸 且所述輸入的比特流的幀類型為非語音幀,則所述根據確定的結果採用相應的處理方式對 所述輸入的比特流進行轉碼,包括獲得目標幀所需要的參數信息;採用接收端的參數編碼算法對獲得的所述目標幀所需要的參數信息進行編碼並寫入 輸出的比特流。
5. 根據權利要求1所述的方法,其特徵在於,若確定所述接收端使用非連續性傳輸且 所述輸入的比特流的幀類型為非語音幀,則所述根據確定的結果採用相應的處理方式對所 述輸入的比特流進行轉碼,包括對所述輸入的比特流進行解碼後生成合成語音; 根據所述合成語音判斷目標幀類型;根據所述目標幀類型對所述輸入的比特流進行相應的轉碼。
6. 根據權利要求5所述的方法,其特徵在於,若所述目標幀為語音幀,則所述根據目標 幀類型對所述輸入的比特流進行相應的轉碼,包括獲取目標幀所需要的參數信息;採用接收端的參數編碼算法對獲取的所述目標幀所需要的參數信息進行編碼並寫入 輸出的比特流。
7. 根據權利要求4或6所述的方法,其特徵在於,所述獲得目標幀所需要的參數信息, 包括採用非連續性傳輸解碼算法提取所述輸入的比特流中包含的LSP參數和能量參數;對所述LSP參數和所述能量參數進行轉碼,以獲取目標幀所需要的LSP參數信息和代 數碼書增益信息;生成目標幀所需要的基音、碼書增益和代數碼書參數信息。
8. 根據權利要求5所述的方法,其特徵在於,若所述目標幀為非語音幀,則所述根據目 標幀類型對所述輸入的比特流進行相應的轉碼,包括採用非連續性傳輸解碼算法提取所述輸入的比特流中包含的LSP參數和能量參數; 對所述LSP參數和所述能量參數進行轉碼,以獲取目標幀所需要的參數信息; 採用接收端的參數編碼算法對獲得的所述目標幀所需要的參數信息進行編碼並寫入 輸出的比特流。
9. 根據權利要求1所述的方法,其特徵在於,若確定所述接收端未使用非連續性傳輸 且所述輸入的比特流的幀類型為語音幀,則所述根據判斷結果採用相應的處理方式對所述 輸入的比特流進行轉碼,包括採用語音幀參數轉碼算法對所述輸入的比特流進行轉碼。
10. 根據權利要求1所述的方法,其特徵在於,在所述接收輸入的比特流之後,所述方 法還包括判斷所述輸入的比特流是否丟失幀;若判斷結果為未丟失幀,則根據確定的結果採用相應的處理方式對所述輸入的比特流 進行轉碼。
11. 根據權利要求io所述的方法,其特徵在於,若判斷結果為丟失幀,則所述方法還包括採用幀擦除掩蔽算法對所述輸入的比特流進行處理;並且所述根據確定的結果採用相應的處理方式對所述輸入的比特流進行轉碼,包括 根據確定的結果採用相應的處理方式對處理後的所述輸入的比特流進行轉碼。
12. 根據權利要求11所述的方法,其特徵在於,若確定發生丟幀的輸入的比特流的幀 類型為語音幀、或者為非語音幀且為靜音插入描述幀,所述對輸入的比特流進行處理,包括對待轉碼的參數進行恢復。
13. 根據權利要求11所述的方法,其特徵在於,若確定發生丟幀的輸入的比特流的幀 類型為非語音幀且為非傳輸幀,則所述對輸入的比特流進行處理,包括對所述發生丟幀的 輸入的比特流不作處理。
14. 一種轉碼裝置,其特徵在於,所述裝置包括 接收單元,所述接收單元用於接收發送端輸入的比特流;確定單元,所述確定單元用於確定接收端使用非連續性傳輸屬性、以及所述輸入的比 特流的幀類型;第一處理單元,所述第一處理單元用於根據確定的結果採用相應的處理方式對所述輸 入的比特流進行轉碼。
15. 根據權利要求14所述的裝置,其特徵在於,所述裝置還包括檢測單元,所述檢測單元與所述確定單元和所述第一處理單元連接,用於檢測所述輸 入的比特流是否丟失幀;若檢測結果為未丟失幀,則所述第一處理單元根據確定的結果採 用相應的處理方式對所述輸入的比特流進行轉碼;第二處理單元,若所述檢測單元檢測結果為丟失幀,則所述第二處理單元採用幀擦除掩蔽算法對所述輸入的比特流進行處理;並且所述第一處理單元用於根據確定的結果採用相應的處理方式對所述第二處理單元處理後的所述輸入的比特流進行轉碼。
16. 根據權利要求14所述的裝置,其特徵在於,所述裝置還包括輸出單元,所述輸出單元用於輸出轉碼後的輸出的比特流。
17. —種通信設備,其特徵在於,所述通信設備包括權利要求14至16的任意一項權利要求的轉碼裝置。
全文摘要
本發明提供一種轉碼方法、裝置和通信設備。該方法包括接收發送端輸入的比特流;確定接收端使用非連續性傳輸屬性、以及所述輸入的比特流的幀類型;根據確定的結果採用相應的處理方式對所述輸入的比特流進行轉碼。本發明實施例根據接收端使用非連續性傳輸DTX屬性、以及輸入比特流的幀類型的情況對輸入的比特流進行相應的轉碼操作,這樣,可對各種類型的輸入的比特流進行處理,並能夠按照接收端的要求對輸入的比特流進行相應的轉碼。因此,可在不降低合成語音質量的前提下,將平均計算複雜度和最壞計算複雜度進行有效地降低。
文檔編號G10L19/00GK101783142SQ20091000964
公開日2010年7月21日 申請日期2009年1月21日 優先權日2009年1月21日
發明者唐繁榮, 徐昊, 胡翔宇, 鮑長春 申請人:北京工業大學;華為技術有限公司