信號能量參數優化的數字語聲編碼器的製作方法

2023-09-20 05:33:40 2

專利名稱：信號能量參數優化的數字語聲編碼器的製作方法
該發明主要涉及語聲編碼器。尤其是採用增益可調的語聲表達元的數字語聲編碼器。
語聲編碼器是眾所周知的技術。某些語聲編碼器將模擬語聲樣值轉化為數字式表示，進而通過採用線性預測編碼表示了語聲的頻譜信息。其它的一些語聲編碼器則通過提供與原始語聲信號相關的激勵信號改進普通的線性預測編碼技術。
美國專利№.4，817，157描述了一種具有改進向量激勵源的數字語聲編碼器，其中有一個碼錶激勵向量的碼錶，對其估計可選擇出最體現所獲信息的碼錶激勵信號，利用它可提供與原始信號最接近的復原語聲信號。在這樣一個系統中，產生音高十激勵信息和碼錶激勵信息並且兩者結合構成合成信號從而用於產生復原語聲信息。
在這些信號結合以前，每一路信號都設有一增益因子用於控制各信號的能量成分，從而使得各信號的能量成分與原始語聲信號中各相應部分的能量相匹配。該語聲編碼器在確定了適當的音高激勵和碼錶激勵信息的同時也就確定了合適的增益因子，包含有所有這些元素的編碼信息提供給解碼器從而可復原出原始的語聲信息。一般情況下，先前技術的語聲編碼器是以分散的形式向解碼器提供這些增益因子信息。這一過程的完成是通過將上述信息包傳輸而實現，或者採用其它形式(比如矢量量化)將它們合成起來，不過這只是為了傳輸的方便，他們依然是各自相互獨立的成分。
先前的語聲編碼技術還遺留了相當多有待改進的地方。前邊提及的增益因子的傳輸方式可能要求傳輸媒介具備相當大的容量以用於差錯保護(否則，傳輸錯誤將會損失增益信息，這樣也就致使恢復的語聲信息嚴重失真，難以接受)。
因此，有必要尋求一種語聲編碼方案，既降低了對傳輸媒介的要求，同時又加強了對增益因子信息的差錯保護。
這裡提出的語聲編碼方案基本上解決了上述的問題。該編碼方案將導致增益信息的產生，這包括與語聲樣值第一個代表成分相關的第一增益值和與該語聲樣值第二個代表成分相關的第二增益值。根據這一方案，這些增益值要經過處理然後提供與該樣值全部能量相關的第一參數以及一個第二參數，這第二參數是基於第一增益值和第二增益值，或至少其中之一的值與該樣值全部能量值的相對大小。關於這第一、二參數的信息然後傳輸至解碼器。
在該發明的一個實施例中，增益信息可以至少包括一個與該樣值第三成分增益相關的第三增益值，這些增益值的處理將會產生一第三參數，該參數至少部分地決定了第一、第二、和第三增益值中不同的一個對整體能量值的貢獻的大小。
在該發明的另一實施方案中第一、第二參數(若第三參數存在的話也包括在內)經過矢量量化以提供一個碼。該碼包含了將要傳送至解碼器的信息。
該發明的另一方面是編碼器產生的增益信息包括與語聲信號長時能量值相關的第一值(例如，多個樣值所具有的能量值，或者是個預先確定的語聲信息幀所具有的能量值)，和與信號短時能量值(例如，一個信號樣值或者構成預先確定幀的一部分的子幀)相關的第二值，這第二值包含一個校正因子，它可以用於第一個值，以通過對指定樣值或子幀實現對第一值的調節。第一值從編碼器到解碼器的傳輸採用的是第一速率，第二值的傳輸採用第二速率，其中第二速率要比第一速率頻繁。這樣以來，比較重要的信息(長時能量值)，其傳輸的頻率低因而其傳輸可採用較強的保護措施而不會對傳輸媒介容量產生較大影響。而較不重要信息(短時能量值)的傳輸較頻繁，但由於它們在信號恢復中的重要性相對來說要小一些，故而對保護措施的要求也弱一些，這樣對傳輸媒介容量的要求亦可降至最低。
在該發明的另一實施方案中，語聲的編、解碼安裝在無線電設備當中。

圖1是一個框圖，描述了對應於本發明的激勵源結構。
圖2亦是一個框圖，描述了與該發明相關的無線電裝置的結構。
1989年3月28日以Ira Gerson名義發布的題為「具有改進的向量激勵源的數字語聲編碼器」，美國專利號4，817，157中，詳細地描述了採用向量激勵源的數字語聲編碼器，其向量激勵源包括一個碼錶激勵碼向量碼錶。
該發明的特點是在語聲編碼(解碼)器中採用了合適的數位訊號處理器(DSP)，比如Motorola公司的DSP56000系列器件。這些DSP器件的運算功能在圖1中作為等效電路方框圖表示了出來。
一個音高激勵濾波器狀態(102)提供一音高激勵信號，它包含一個即時的音高激勵向量。乘法器(106)接收這一音高激勵向量，並將其乘上GAIN1的標度因子。當正確實現時，所獲得的加權音高激勵向量所具有的能量將與原始語音信息中音高信息的能量相對應。當然，音高信息的能量與初始樣值是不同的;能量上的較大差異將導致最終所復原的語聲樣值有相當程度的失真。
第一碼錶(103)包括一系列基礎向量，它們的線性結合可構成一系列相應的激勵信號。編碼器的功能一般說來就是從這些碼錶激勵源中挑選一個最能表徵原始語聲信息中相應成分代表。解碼器也就是利用編碼器所能挑選出來的碼錶激勵源來恢復語聲信號。(當然，對於所處理的樣值，音高激勵信號和碼錶選擇可通過相應的成分定義來區別)，相應的音高激勵信息是通過乘法器(107)接受碼錶激勵信息然後再乘上GAIN2的加權因子。GAIN2的設置主要是為了調節碼錶激勵信號的能量，使其與對應的語聲信息成分中原始信號的實際能量相一致。
如果需要的話，本方法的具體應用還可利用附加的碼錶(104)，它含有附加的激勵信號。這些附加碼錶的輸出仍將需要通過一個適當的乘法器(108)進行調節，適當的加權因子(如GAIN3)可實現與前述相同的目的。
經過適當選擇和加權調節之後，音高激勵和碼錶激勵信息相加(109)，然後提供給LPC濾波器來產生最終的語聲信號。在編碼器中，這一最終信號將與原始信號進行比較，其它的碼錶成分亦需重複這一過程，這樣可鑑別出一個激勵源，它所提供的最終信號與原始信號最接近。那麼這個音高和碼錶信息將被編碼並通過選擇的傳輸媒介傳送至解碼器。在解碼器端，這一最終信號還要進一步處理，將數位化的信息變換為可聽的形式，從而完成語音信號的恢復。
對於本發明的特點的描述，我們先從解釋解碼過程開始，然後再從編碼器的角度來說明。
增益控制(101)的功能是提供GAIN1和GAIN2的信息(某些情況下，也包括GAIN3的信息)。這一增益信息與恢復的音高激勵和碼錶激勵信號的實際能量由編碼器提供的長時能量值以及由編碼器提供的對長時能量值進行短時修正的增益向量等緊密相關。
由音高激勵濾波器狀態(102)和碼錶(103和104)(即前期成分＊)所分別提供的音高激勵信號和碼錶激勵信號的能量可方便地由增益控制(101)來確定。一般情況下，這些信號的能量，無論是以它們兩個(或三個)之間分攤的形式還是以它們的總和值的形式給出，均不能正確地反映出原始信號中的能量。因此，有必要獲得這一能量信息以便於確定所需的能量校正值。這一能量校正是通過調節GAIN1和GAIN2(如必要，還包括GAIN3)來實現的。校正是以子幀為基礎對各子幀進行的。
在解碼器進行音高激勵信號和碼錶激勵信號能量的計算過程具有特別的優點。尤其是，前邊的傳輸錯誤所導致的音高激勵信號能量的偏差，可在這裡得到補償，這一補償是通過解碼器中對音高激勵能量的精確計算實現的。
為了便於描述，我們假設一個原始語聲樣值(或至少其一部分)是數位化的，並且其最終的數字信息是分成3數據幀和子幀，所有這些與眾所周知的先前技術相一致。在下面的描述中，我們假設每個幀含有4個子幀。
對於這樣的結構，長時能量值佔有一個子幀，構成一個校正因子的短時校正值對應於一個子幀。包含在一個特殊子幀中的殘餘能量(EE)一般情況下可通過下式確定EE= (Eq(o))/(( FILTER POWER GAIN ) ( N - SOBS ))其中Eq(o)＝對應於整個幀的數位化長時信號能量;FILTER POWER GAIN可通過LPC濾波器的資料通過計算而得到，如所周知，它相應於由於濾波器所帶來的能量增量，N_SOBS表示每幀內所含的子幀數。
可以通過下式計算GAIN1A=EEEx(0)]]>其中α＝第一向量參數。
β＝第二向量參數。
Ex(o)＝未加權的音高能量信息。
關於α和β的詳細情況在後邊編碼功能的描述中還要談到。Ex(o)是由音高激勵濾波器狀態(102)所輸出的信號的能量。因而，Ex(o)就是未經過GAIN1加權的在乘法器(106)前端的音高激勵向量的能量。Ex(o)處在A的分母上，將來加權的音高激勵向量的能量規格化為1，而表達式A中的分子則包含了需要給音高激勵向量的能量。在上述分子中，EE項(基於長時信號能量對子幀殘餘能量的估計值)由α加權以匹配該激勵信號中的短時能量，而β則表明音高激勵向量能量佔該合成激勵信號能量的比例。最後取表達式的平方根得到該增益。
同理，GAIN2可通過下式算得B=EE(1-)Ex(1)]]>α和β同前所述，Ex(1)含有未加權的碼錶激勵信息，該信息對應於由第一碼錶(111)輸出的實際信號能量。
一旦GAIN1和GAIN2按上述方法確定，那麼音高激勵和碼錶激勵信息將被適當加權，因而使兩者的值相匹配，合成的結果由加法器(109)輸出，提供了合適的復原信號成份。在解碼器中，採用了一個或多個附加激勵碼錶(104)，附加的加權因子(如GAIN3)可以按同樣的方式確定。
下面將描述本發明中編碼器的一個特點如前所述，對於一整幀數位化語聲樣值，可以計算一個量化信號能量值Eq(o)。這個值不時地由編碼器傳送至解碼器，以提供給解碼器必要的信息。這個信息沒有必要伴隨每個子幀信息傳送，因為這個長時信息傳送的頻率小，所以這個信息可以通過糾錯編碼等措施獲得相對安全的保護。儘管這需要更大的傳輸容量，但由於該信息傳輸的頻度低，所以對整個傳輸容量的影響不大。
又如前邊所述，對應於一幀的長時能量信息在各個子幀期間需作相應的調節使得與該幀的能量最接近。這個調節可視為短時校正參數α為變量之一的函數。
編碼器產生參數α和β同樣也是將編碼器所產生的音高激勵和碼錶激勵信息信號的能量成分作為參變量的函數。α包括一個加權因子，根據該因子長時能量信息經過加數，然後音高激勵信息能量與碼錶1激勵以及碼錶2激勵在該子幀中相加。參數β包含一個比率，這個比率是該子幀的音高激勵信息能量與音高激勵信息，碼錶1激勵、碼錶2激勵三者和的比。與此相似，假定第二碼錶存在的話，一個第三參數π可以表示出第一碼錶能量同音高激勵信息、碼錶1激勵，碼錶2激勵三者和的比率。
在上述的處理方式中，第一參數α與該信號樣值的全部能量值相關，第二(若有的話包括第三)參數β至少與激勵信號之一同全部能量之比相關。因此，參數α，β以及π三者之間存在著某種程度上的相關。這一相互關聯改善了性能和編解碼效率。
作為特點之一，該編碼器並不將α，β和π三個參數值直接傳送給解碼器。而是將這三個參數經過向量量化，轉換成可識別代碼傳送給解碼器。在這裡由於編碼器傳出的碼向量不可能完全等同於原始向量，所以可能引進誤差。為了使該誤差的影響降至最小，編碼器對所有可能獲得的向量碼均計算一個ERROR值，然後選擇一個產生最小誤差的向量碼。對於每一個向量碼(它可產生相應的α和β值，這裡假定是單碼錶編碼器，便於舉例說明)這個ERROR值的計算如下
naβ + λa(1-β)其中
在上面的等式當中，Ev代表了一個理想信號的子幀能量。因此，所選擇的參數同原始參數越接近，誤差則越小。Epc(0)表示理想信號與已加權的音高信息激勵的相關性。Epc(1)表示理想信號與已加權的碼錶激勵之間的相關性。Ecc(0，1)代表已加權音高信息激勵和已加權碼錶的相關性。餘下的，Ecc(0，0)表示已加權音高激勵的能量，Ecc(1，1)代表已加權碼錶激勵的能量。(已加權激勵是指通過熟知的感官加重濾波器處理後的激勵信號)。
當具有最小ERROR值的向量碼被鑑別出來之後，這個向量碼則傳送至解碼器，當解碼器接收到該碼向量後，可用它去查閱向量碼資料庫，因而可恢復出α、β和π(若存在的話)，如前所述，這些參數將用於計算GAIN1，GAIN2，和GAIN3(如果用它的話)。
採用這一方案，可以獲得幾個明顯的好處。例如長時能量值由於傳輸中的保護措施增強，因而從能量信息的角度可以保證恢復的語聲信息基本正常，既便是短時校正因子信息丟失或出錯也關係不大。另外，解碼器中音高能量的計算和補償顯著地降低了音高激勵的誤差傳播。
參數α、β和π所提供的初始增益信息之間的相互關聯可以容許信息的大幅度壓縮，從而使得這一部分信息傳輸所需的傳輸容量降至最小。從效果來看，本方案改善了恢復的語聲並且降低了傳輸容量要求。
在圖2中，體現本發明的一套無線電裝置包括一個接收語聲碼信號(201)的天線(202)，一個RF單元(203)處理接收到的信號以恢復語聲編碼信號。這一信息提供給參數解碼器(204)由此產生各後續過程的控制參數。激勵源(100)如前所述利用提供給它的參數產生激勵信號。由激勵源(100)輸出的激勵信號提供給LPC濾波器(206)，由此產生與編碼信息相一致的合成語聲信號。這一合成語聲信號然後通過音高后濾波(207)和頻譜後濾波(208)以增強恢復語聲的質量。如果需要，還可以包括一個後加重濾波器(209)來進一步改善語聲信號。這一語聲信號在語音處理單元(211)經過處理然後由語音轉換器(212)輸出可聽見的聲音信號。
本發明在權利要求書中的主要特點如下與單個樣值的增益信息有關的信息傳輸方案，其中的增益信息包括與第一成分增益相關的一個第一增益值;
與第二成分增益相關的至少一個第二增益值;
其特徵表現為有如下步驟A)處理最少限度的信號樣值以提供與這些信號樣值的總體能量相關的第一參數;
至少部分與第一和第二增益值中的至少一個對總體能量值的相對貢獻有關的第二參數，B)與第一和第二參數相關的傳輸信息。
增益信息至少包括一個第三增益值，該值與第三成分相關;
處理過程包括提供一個第三參數，該參數至少是基於第一、第二、第三增益值中不同的一個對總體能量值的相對貢獻有關;
信息傳輸的步驟包括了與第三成分相關聯的信息的傳輸。
其處理步驟包括至少將第一參數和第二參數信息進行矢量量化以提供一個碼。
其傳輸步驟包括傳輸該碼。
它還下述傳輸步驟，即不時地傳輸與多個信號樣值相關的長時能量值信息。
其第一參數包括一個與長時能量值信息相關的校正因子。
其傳輸步驟的特徵是還有下列步驟
B1).不時地傳輸與該第一值相關的信息;
B2).與第二值相關的信息的傳輸比第一值信息的傳輸更頻繁。
一種與信號各成分的增益信息相關的信息的復原方法，其特徵表現為A)至少要接收一個與該信號的至少一種成分的能量相關的第一參數;
B)接收該至少一個成分的成分定義信息;
C)處理該成分定義信息，以提供一前期成分，該前期成分具有一個能量值;
D)如有必要，至少利用第一參數該前期成分的能量值進行修正，以得到復原的信號成分。
權利要求
1.與單個樣值的增益信息有關的信息傳輸方案，其中的增益信息包括與第一成分增益相關的一個第一增益值；與第二成分增益相關的至少一個第二增益值；其特徵表現為有如下步驟A)處理最少限度的信號樣值以提供與這些信號樣值的總體能量相關的第一參數；至少部分與第一和第二增益值中的至少一個對總體能量值的相對貢獻有關的第二參數，B)與第一和第二參數相關的傳輸信息。
2.權利要求1中的方法，其中增益信息至少包括一個第三增益值，該值與第三成分相關;處理過程包括提供一個第三參數，該參數至少是基於第一、第二、第三增益值中不同的一個對總體能量值的相對貢獻有關;信息傳輸的步驟包括了與第三成分相關聯的信息的傳輸。
3.權利要求1的方法，其處理步驟包括至少將第一參數和第二參數信息進行矢量量化以提供一個碼。
4.權利要求3的方法，其傳輸步驟包括傳輸該碼。
5.權利要求1的方法，它還下述傳輸步驟，即不時地傳輸與多個信號樣值相關的長時能量值信息。
6.權利要求5中的方法，其第一參數包括一個與長時能量值信息相關的校正因子。
7.權利要求1的方法，其傳輸步驟的特徵是還有下列步驟B1).不時地傳輸與該第一值相關的信息;B2).與第二值相關的信息的傳輸比第一值信息的傳輸更頻繁。
8.一種與信號各成分的增益信息相關的信息的復原方法，其特徵表現為A)至少要接收一個與該信號的至少一種成分的能量相關的第一參數;B)接收該至少一個成分的成分定義信息;C)處理該成分定義信息，以提供一前期成分，該前期成分具有一個能量值;D)如有必要，至少利用第一參數該前期成分的能量值進行修正，以得到復原的信號成分。
全文摘要
一種語聲編碼器和解碼器實現方案，其音高激勵和碼錶激勵源能量由參數表示，這些參數的傳輸所要求的傳輸容量可降至最小。這些參數是長時能量值，一個作用於長時能量值以匹配短時能量的校正因子，和一個(或多個)比例因子，這(些)因子表明了激勵源與該短時能量值的相對大小。
文檔編號G10L19/00GK1051099SQ9010842
公開日1991年5月1日申請日期1990年10月16日優先權日1989年10月17日
發明者傑森·艾拉·阿蘭, 詹修克·馬克·安東尼申請人:莫託羅拉公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

信號能量參數優化的數字語聲編碼器的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法