新四季網

聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置的製作方法

2023-04-30 10:44:26 1

專利名稱:聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置的製作方法
技術領域:
本發明涉及能得到高品質合成聲音的聲源矢量生成裝置以及能用低位速率對高品質的聲音信號進行編碼/解碼的聲音編碼裝置和聲音解碼裝置。
背景技術:
CELP(Code Excited Linear Prediction編碼激勵線性預測)型的聲音編碼裝置,是對每個以一定的時間劃分聲音的幀進行線性預測,用存儲過去的驅動聲源的自適應碼本和存儲多個噪聲向量的噪聲碼本,對每幀線性預測的預測殘差(激勵信號)進行編碼的方式。例如在「低位速率高品質量話音」(「High Quality Speechat Low Bit Rate」M.R.Schroeder,Proc.ICASSP』85,PP937-940)中公開的CELP型聲音編碼裝置。


圖1表示CELP型的聲音編碼裝置的概略結構。CELP型的聲音編碼裝置將聲音信息分離成聲源信息和聲道信息並進行編碼。對於聲道信息,將輸入聲音信號10輸入到濾波器係數分析單元11中並進行線性預測,在濾波器係數量化單元12對線性預測係數(LPG)進行編碼。藉助於對合成濾波器13提供線性預測係數,在合成濾波器13能將聲道信號摻入聲源信息中。對於聲源信息,在每個進一步細分幀的區間(稱為子幀)進行自適應碼本14的檢索和噪聲碼本15的聲源檢索。自適應碼本14的檢索和噪聲碼本15的聲源檢索,是決定使式(1)的編碼失真最小的自適應碼矢量的碼號及其增益(音調增益)、和噪聲碼矢量的碼號及其增益(噪聲碼增益)的處理。
‖v·(gaHp+gcHc)‖2(1)V聲音信號(矢量)H合成濾波器的脈衝響應卷積矩陣
H=h(0)000h(1)h(0)000h(2)h(1)h(0)000MMMO00MMMOh(0)0h(L-1)h(1)h(0)]]>其中,h合成濾波器的脈衝響應(矢量)L幀長p自適應碼矢量c噪聲碼矢量ga自適應碼增益(音調增益)gc噪聲碼增益但是,因當閉環檢索使式(1)為最小的前述碼時,碼檢索中所要的運算量變得膨大,所以在一般的CELP型聲音編碼裝置中,首先進行自適應碼本檢索,規定自適應碼矢量的碼號,接著接受其結果,進行噪聲碼本檢索,規定噪聲碼矢量的碼號。
這裡,參照圖2A~圖2C對CELP型聲音編碼裝置的噪聲碼本檢索進行說明。
圖中,符號x是基於式(2)求得的噪聲碼本檢索用的目標矢量。設自適應碼本檢索已經結束。
x=v-gaHp(2)x噪聲碼本檢索目標(矢量)v聲音信號(矢量)H合成濾波器的脈衝響應卷積矩陣p自適應碼矢量ga自適應碼增益(音調增益)如圖2所示,噪聲碼本檢索是規定使計算單元16中用式(3)定義的編碼失真最小的噪聲碼矢量c的處理。
‖x-gcHc)‖2(3)x噪聲碼本檢索目標(矢量)H合成濾波器的脈衝響應卷積矩陣
c噪聲碼矢量gc噪聲碼增益失真計算單元16對控制開關21進行控制,切換從噪聲碼本15讀出的噪聲編碼矢量,直到定出噪聲碼矢量c為止。
為了減少計算的費用,實際的CELP型聲音編碼裝置為圖2B的結構,在失真計算單元16』中進行規定使式(4)的失真估算值最大的碼號的處理。
(xHc)2||Hc||2=((xH)c)2||Hc||2=(xc)2||Hc||2=(xc)2cHHc-----(4)]]>x噪聲碼本檢索目標(矢量)H合成濾波器的脈衝響應卷積矩陣H』H的轉置矩陣x』在H對x進行時間反轉合成倒置所得矢量(x」=x』H)c噪聲碼矢量具體地說,將噪聲碼本控制開關21連接到噪聲碼本15的1端,從對應於該端的地址讀出噪聲碼矢量c。由合成濾波器13,將讀出的噪聲碼矢量c與聲道信息合成,生成合成矢量Hc。接著,用對目標x進行時間反轉、合成、時間反轉得到的矢量x』、以合成濾波器合成噪聲碼矢量的所得矢量Hc和噪聲碼矢量c,失真計算單元16』算出式(4)的失真估算值。然後,切換噪聲碼本控制開關21,對噪聲碼本內的全部噪聲矢量,算出上述失真估算值。
最後,將式(4)的失真估算值為最大時連接的噪聲碼本控制開關21的號碼,作為噪聲碼矢量的碼號,輸出到編碼輸出單元17中。
圖2C表示聲音解碼轉置的部分結構。切換控制噪聲碼本控制開關21,以便讀出被傳送來的碼號的噪聲碼矢量。在放大電路23和合成濾波器24中設定被傳送來的噪聲編碼增益gc和濾波器係數後,讀出噪聲碼矢量並復原合成聲音。
在前述的聲音編碼裝置和解碼裝置中,存儲在噪聲碼本15中作為聲源信息的噪聲碼矢量的越多,越能檢索接近實際聲音的聲源的噪聲碼矢量。但是,因噪聲碼本(ROM)的容量有限制,所以不能將對應於全部聲源的無數的噪聲碼矢量存儲在噪聲碼本中。因此,在謀求聲音品質的改善方面有其極限。
此外,提議有能大幅度地降低失真計算單元的編碼失真計算,而且能減小噪聲碼本(ROM)的代數結構的聲源(記載在「8KBIT/S ACELP CODING OFSPEECH WITH 10MS SPEECH-FRAMEA CANDIDATE FOR CCITTSTANDARDIZATION」R.Salami,C.Laflamme,J-P.Adoul,ICASSP』94,pp.II-97~II-100,1994中)。
代數結構的聲源預先計算合成濾波器的脈衝響應和時間反轉的目標的卷積運算結果以及合成濾波器的自相關,並在存儲器中展開,因而能大幅度地減少編碼失真計算的費用。藉助於代數生成噪聲碼矢量,能減小存儲噪聲碼矢量的ROM。在噪聲碼本中使用前述代數結構聲源的CS-ACELP和ACELP分別被ITU-T作為G.729建議和G.723.1建議提出。
但是,在將前述代數結構聲源包括在噪聲碼本中的CELP型的聲音編碼裝置/聲音解碼裝置中,因不斷地用脈衝串矢量對噪聲碼本檢索用目標進行編碼,所以在謀求聲音品質的改善方面有其極限。
發明概述鑑於前述實際情況,本發明的第1個目的是提供比原樣在噪聲碼本中存儲噪聲碼矢量的場合能大幅度地減小存儲器容量,並能謀得聲音品質改善的聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。
本發明的第2個目的是提供在噪聲碼本中包括代數結構聲源,與用脈衝串矢量對噪聲碼本檢索用目標進行編碼的場合相比,能生成複雜的噪聲碼矢量,並能謀得聲音品質改善的聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。
本發明將以往的CELP型聲音編碼/解碼裝置的固定矢量讀出單元和固定碼本,分別置換為輸出與被輸入的振種值相對應的不同的矢量系列的振蕩器和存儲多個振種(產生振蕩器)的振種存儲單元中。由此,不必將固定矢量原樣存儲在固定碼本(ROM)中,能大幅度地減小存儲器的容量。
本發明將以往的CELP型聲音編碼/解碼裝置的噪聲矢量讀出單元和噪聲碼本置換為振蕩器和振種存儲單元。由此,不必將噪聲矢量原樣存儲在固定碼本(ROM)中,能大幅度地減小存儲器的容量。
本發明聲源矢量生成裝置的結構是存儲多個固定波形,根據起始端候補位置信息將各固定波形配置在各自的起始端位置上,並對這些固定波形進行加法運算,生成聲源矢量。因此,能生成接近實際聲音的聲源矢量。
本發明是噪聲碼本採用前述聲源矢量生成裝置而構成的CELP型聲音編碼/解碼裝置。固定波形配置單元也可以代數生成固定波形的起始端候補位置信息。
本發明的CELP型聲音編碼/解碼裝置做成存儲多個固定波形,生成與每個固定波形起始端候補位置信息相對應的脈衝,對合成濾波器的脈衝響應和各自的固定波形卷積,生成波形別脈衝響應,計算前述波形別脈衝響應的自相關和互相關,並在相關矩陣存儲器中展開。由此,能得到與以代數結構聲源作為噪聲碼本使用的場合相同程度的計算費用,同時能改善合成聲音的品質的聲音編碼/解碼裝置。
本發明的CELP型聲音編碼/解碼裝置包括多個噪聲碼本和從前述多個噪聲碼本中選擇一個的切換手段,也可以至少以一個噪聲碼本作為前述聲源矢量生成裝置,此外,也可以至少以一個噪聲碼本作為存儲多個隨機數序列的向量存儲單元或者存儲多個脈衝串的脈衝串存儲單元,或者至少有兩個具有前述聲源矢量生成裝置的噪聲碼本,而且各噪聲碼本存儲的固定波形個數不同,還可以使切換手段選擇任一噪聲碼本,使噪聲碼本檢索時編碼失真為最小,或者根據聲音區間分析結果,自適應選擇任一個噪聲碼本。
附圖簡要說明圖1表示以往的CELP型聲音編碼裝置的概略圖。
圖2A是圖1的聲音編碼裝置的聲源矢量生成單元的方框圖。
圖2B謀求減少計算費用的變形的聲源矢量生成單元的方框圖。
圖2C是與圖1的聲音編碼裝置配對使用的聲音解碼裝置中聲源矢量生成單元的方框圖。
圖3表示與實施形態1相關的聲音編碼裝置的主要部分的方框圖。
圖4表示包括在實施形態1的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖5表示實施形態2的聲音編碼裝置的主要部分的方框圖。
圖6表示包括在實施形態2的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖7表示與實施形態3和4相關的聲音編碼裝置的主要部分的方框圖。
圖8表示包括在實施形態3的聲音編碼裝置中的聲源矢量生成裝置的方框圖。
圖9表示包括在實施形態4的聲音編碼裝置中的非線性數字濾波器的方框圖。
圖10表示圖9所示的非線性數字濾波器的加法特性圖。
圖11表示與實施形態5相關的聲音編碼裝置的主要部分的方框圖。
圖12表示與實施形態6相關的聲音編碼裝置的主要部分的方框圖。
圖13A表示與實施形態7相關的聲音編碼裝置的主要部分的方框圖。
圖13B表示與實施形態7相關的聲音編碼裝置的主要部分的方框圖。
圖14表示與實施形態8相關的聲音解碼裝置的主要部分的方框圖。
圖15表示與實施形態9相關的聲音編碼裝置的主要部分的方框圖。
圖16表示包括在實施形態9的聲音編碼裝置中的量化對象LSP增加部分的方框圖。
圖17表示包括在實施形態9的聲音編碼裝置中的LSP量化·解碼單元的方框圖。
圖18表示與實施形態10相關的聲音編碼裝置的主要部分的方框圖。
圖19A表示與實施形態11相關的聲音編碼裝置的主要部分的方框圖。
圖19B表示與實施形態11相關的聲音解碼裝置的主要部分的方框圖。
圖20表示與實施形態12相關的聲音編碼裝置的主要部分的方框圖。
圖21表示與實施形態13相關的聲音編碼裝置的主要部分的方框圖。
圖22表示與實施形態14相關的聲音編碼裝置的主要部分的方框圖。
圖23表示與實施形態15相關的聲音編碼裝置的主要部分的方框圖。
圖24表示與實施形態16相關的聲音編碼裝置的主要部分的方框圖。
圖25表示與實施形態16相關的矢量量化部分的方框圖。
圖26表示與實施形態17相關的聲音編碼裝置的參數編碼部分的方框圖。
圖27表示與實施形態18相關的降噪裝置的方框圖。
實施發明的最佳方式下面,參照附圖對本發明的實施形態具體地進行說明。
實施形態1圖3表示與實施形態1相關的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元31和振蕩器32的聲源矢量生成裝置30,和LPC合成濾波器單元33。
將從振種存儲單元31輸出的振種(產生振蕩的「種子」)34輸入到振蕩器32中。與輸入的振種值相對應,振蕩器32輸出不同的矢量系列。振蕩器32用對應于振種(產生振蕩的「種子」)34的值的內容進行振蕩,並輸出作為矢量系列的聲源矢量35。LPC合成濾波器單元33用合成濾波器的脈衝響應卷積矩陣的形式,提供聲道信息,以脈衝響應對聲源矢量35進行卷積運算後輸出合成話音36。將以脈衝響應對聲源矢量35進行卷積運算稱為LPC合成。
圖4表示聲源矢量生成裝置30的具體的結構。按照由失真計算單元提供的控制信號,振種存儲單元控制開關41切換從振種存儲單元31讀出的振種。
這樣,僅將從振蕩器32輸出不同的矢量系列的多個振種預先存儲在振種存儲單元31中,與將複雜的噪聲碼向量原樣存儲在噪聲碼本中的場合相比,能用較小的容量發生更多的噪聲碼矢量。
此外,雖然在本實施形態中對聲音編碼裝置進行了說明,但也能將聲源矢量生成裝置30用於聲音解碼裝置中。這種場合,在聲音解碼裝置中具有與聲音編碼裝置的振種存儲單元31相同內容的振種存儲單元,並將編碼時選擇的振種號碼提供給振種存儲單元控制開關41。
實施形態2圖5表示基於本實施形態的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元51和非線性振蕩器52的聲源矢量生成裝置50,和LPC合成濾波器單元53。
將從振種存儲單元51輸出的振種(產生振蕩的「種子」)54輸入到非線性振蕩器52中。從非線性振蕩器52輸出的作為矢量系列的聲源矢量55,輸入到LPC合成濾波器單元53中。合成濾波器單元53的輸出是合成話音56。
非線性振蕩器52輸出對應於輸入的振種54的值的不同的矢量系列,LPC合成濾波器單元53對輸入的聲源矢量55進行LPC合成,並輸出合成話音56。
圖6表示聲源矢量生成裝置50的功能的方框圖。按照由失真計算單元提供的控制信號,振種存儲單元控制開關41切換從振種存儲單元51讀出的振種。
這樣,藉助於在聲源矢量生成裝置50的振蕩器中使用非線性振蕩器52,利用遵循非線性特性的振蕩,能抑制發散,得到實用的聲源矢量。
此外,雖然在本實施形態中對聲音編碼裝置進行了說明,但也能將聲源矢量生成裝置50用於聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元51相同內容的振種存儲單元,並將編碼時選擇的振種號碼提供給振種存儲單元控制開關41。
實施形態3圖7表示基於本實施形態的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有振種存儲單元71和非線性數字濾波器72的聲源矢量生成裝置70,和LPC合成濾波器單元73。74是從振種存儲單元71輸出並輸入到非線性數字濾波器72中的振種(產生振蕩的「種子」),75是作為從非線性數字濾波器72輸出的矢量系列的聲源矢量,76是從LPC合成濾波器73輸出的合成話音。
如圖8所示,聲源矢量生成裝置70具有利用由失真計算單元供給的控制信號,切換從振種存儲單元71讀出的振種74的振種存儲單元控制開關41。
非線性數字濾波器72輸出對應於輸入的振種的值的不同的矢量系列,LPC合成濾波器單元73對輸入的聲源矢量75進行LPC合成,並輸出合成話音76。
這樣,藉助於在聲源矢量生成裝置70的振蕩器中使用非線性數字濾波器72,利用遵循非線性特性的振蕩,能抑制發散,得到實用的聲源矢量。
此外,雖然在本實施形態中對聲音編碼裝置進行了說明,但也能將聲源矢量生成裝置70用於聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元71相同內容的振種存儲單元,並將編碼時選擇的振種號碼提供給振種存儲單元控制開關41。
實施形態4如圖7所示,與本實施形態相關的聲音編碼裝置包括具有振種存儲單元71和非線性數字濾波器72的聲源矢量生成裝置70,和LPC合成濾波器單元73。
特別指出的是,非線性數字濾波器72具有圖9所示的結構。這種非線性數字濾波器72包括具有如圖10所示的非線性加法特性的加法器91,具有保存數字濾波器的狀態(y(k-1)~y(k-N)的值)的作用的狀態變量保持單元92~93,以及並聯連接到各狀態變量保持單元92~93的輸出上,將狀態變量中乘以增益後,輸出到加法器91中的乘法器94~95。根據從振種存儲單元71讀出的振種,狀態變量保持單元92~93設定狀態變量初始值。乘法器94~95限定增益的值,使數字濾波器的極點存在於Z平面的單位圓外。
圖10.是表示包括在非線性數字濾波器72中的加法器91的非線性加法特性的概念圖,表示具有2的補數特性的加法器91的輸入輸出關係。加法器91首先求得作為對加法器91的輸入值總和的加法器輸入和,接著使用圖10所示的非線性特性,以算出對該輸入和的加法器輸出。
特別是,因非線性數字濾波器72採用2次全極結構,所以串聯連接2個狀態變量保持單元92、93,並對狀態變量保持單元92、93連接乘法器94、95。採用加法器91的非線性加法特性為2的補數的數字濾波器。此外,振種存儲單元71,特別存儲記載在表1中的32字的振種矢量。
表1噪聲矢量生成用的振種矢量

在前述結構的聲音編碼裝置中,將從振種存儲單元71讀出的振種矢量作為初始值,供給非線性數字濾波器72的狀態變量保持單元92、93。非線性數字濾波器72每從輸入矢量(0系列)將0輸入到加法器91中,就輸出1個採樣(y(k)),並作為狀態變量順次地傳送到狀態變量保持單元92、93中。這時,對從狀態變量保持單元92、93輸出的狀態變量,分別由各乘法器94、95乘以增益a1、a2。用加法器91對乘法器94、95的輸出進行相加,求出加法器輸入和,並根據圖10的特性,發生抑制在+1~-1之間的加法器輸出。在輸出這種加法器輸出(y(k+1))作為聲源矢量的同時,順次地傳送到狀態變量保持單元92、93中,生成新的採樣(y(k+2))。
在本實施形態中,作為非線性數字濾波器,為了極存在於Z平面的單位圓外,特地固定乘法器94~95的係數1~N,使加法器91持有非線性加法特性,因而即使非線性數字濾波器72的輸入變大,也能抑制輸出發散,可連續生成能實用的聲源矢量。還能確保生成的聲源矢量的隨機性。
此外,雖然在本實施形態中對聲音編碼裝置進行了說明,但也能將聲源矢量生成裝置70用於聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的振種存儲單元71相同內容的振種存儲單元,並將編碼時選擇的振種號碼提供給振種存儲單元控制開關41。
實施形態5圖11表示基於本實施形態的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置包括具有聲源存儲單元111和聲源加法矢量生成單元112的聲源矢量生成裝置110,和LPC合成濾波器單元113。
聲源存儲單元111存儲過去的聲源矢量,利用接受來自未圖示的失真計算單元的控制信號的控制開關,讀出聲源矢量。
聲源加法矢量生成單元112,對從聲源存儲單元111讀出的過去的聲源矢量,施行用生成矢量特定號碼指示的規定的處理,生成新的聲源矢量。聲源加法矢量生成單元112,具有對應於生成矢量特定號碼,切換對過去的聲源矢量的處理內容的功能。
在如前所述結構的聲音編碼裝置中,從例如執行聲源檢索的失真計算單元供給生成矢量特定號碼。聲源加法矢量生成單元112,根據輸入生成矢量特定號碼的值對過去的聲源矢量進行不同的處理,生成不同的聲源加法矢量,而且LPC合成濾波器單元113對輸入的聲源矢量進行LPC合成並輸出合成話音。
採用本實施形態,則僅將少數的過去的聲源矢量預先存儲在聲源存儲單元111中,並切換在聲源加法矢量生成單元112的處理內容,就能生成隨機的聲源矢量,因不必預先將噪聲矢量原樣地存儲在噪聲碼本(ROM)中,所以能大幅度地減小存儲器的容量。
此外,雖然在本實施形態中對聲音編碼裝置進行了說明,但也能將聲源矢量生成裝置110用於聲音解碼裝置中。這種場合,在聲音解碼裝置中包括與聲音編碼裝置的聲源存儲單元111相同內容的聲源存儲單元,並對聲源加法矢量生成單元112提供編碼時選擇的生成矢量特定號碼。
實施形態6圖12表示與本實施形態相關的聲源矢量生成裝置的功能的方框圖。這種聲源矢量生成裝置包括聲源加法矢量生成單元120和存儲多個要素矢量1~N的聲源存儲單元121。
聲源加法矢量生成單元120包括進行從聲源存儲單元121的不同的位置讀出多個不同長度的要素矢量的處理的讀出處理單元122,進行對讀出處理後的多個要素矢量作倒置排列變換的處理的倒置處理單元123,進行對倒置處理後的多個矢量分別乘以不同的增益的處理的乘法處理單元124,進行縮短乘法處理後的多個矢量的矢量長度的處理的間抽處理單元125,進行伸長間抽處理後的多個矢量的矢量長度的處理的內插處理單元126,進行使內插處理後的多個矢量相加的處理的加法處理單元127,以及同時具有決定對應於所輸入生成矢量特定號碼值的具體處理方法並對決定各處理單元作指示的功能及保持決定該具體處理內容時參照的號碼變換對應映射表2的功能的處理判定和指示單元128。
表2號碼變換對應映射

這裡,對聲源加法矢量生成單元120進一步詳細地進行說明。聲源加法矢量生成單元120將輸入生成矢量特定號碼(用7位的位串取0到127的整數)與號碼變換對應映射表2進行比較,以決定讀出處理單元122、倒置處理單元123、乘法處理單元124、間抽間距處理單元125、內插處理單元126、加法處理單元127的各自的具體地處理方法,並向各處理單元輸出其具體的處理方法。
首先,著眼於輸入生成矢量特定號碼的低端的4位串(n1從0到15的整數值),從聲源存儲單元121的一端到n1的位置為止,切出長度100的要素矢量1(V1)。接著,著眼於結合輸入生成矢量特定號碼的低端的2位串和高端3位串的5位串(n2從0到31的整數值),從聲源存儲單元121的一端到n2+14(從14到45的整數值)的位置為止,切出長度78的要素矢量2(V2)。進而,著眼於輸入生成矢量特定號碼的高端5位串(n3從0到31的整數值),從聲源存儲單元121的一端到n3+46(從46到77的整數值)的位置為止,切出長度Ns(=52)的要素矢量3(V3)。讀出處理單元122進行向倒置處理單元123輸出V1、V2、V3的處理。
如果生成矢量特定號碼的最低端的1位是「0」,則倒置處理單元123進行以倒置排列變換V1和V2和V3的矢量作為新的V1、V2、V3並輸出到乘法處理單元124中的處理,如果生成矢量特定號碼的最低端的1位是「1」,則進行原樣地將V1和V2和V3輸出到乘法處理單元124中的處理。
乘法處理單元124著眼於組合輸入生成矢量特定號碼的高端第7位和高端第6位的2位串,如果該位串是『00』,則V2的振幅乘-2倍、如果該位串是『01』,則以V3的振幅的-2,如果該位串是『10』,則V1的振幅乘-2,如果該位串是『11』,則V2的振幅乘2,所得各矢量分別作為新的V1、V2、V3,輸出到間抽單元125中。
間抽單元125著眼於組合輸入生成矢量特定號碼的高端第4位和高端第3位的2位串,如果該位串是(a)『00』,則從V1、V2、V3開始間隔1個採樣,取出26個採樣的矢量作為新的V1、V2、V3,輸出到內插處理單元126中,如果該位串是(b)『01』,則從V1、V3開始間隔1個採樣,從V2開始間隔2個採樣,取出26個採樣的矢量作為新的V1、V2、V3,輸出到內插處理單元126中,如果該位串是(c)『10』,則從V1開始間隔3個採樣,從V2、V3開始間隔1個採樣,取出26個採樣的矢量作為新的V1、V2、V3,輸出到內插處理單元126中,如果該位串是(d)『11』,則從V1開始間隔3個採樣,從V2開始間隔2個採樣,從V3開始間隔1個採樣,取出26個採樣的矢量作為新的V1、V2、V3,輸出到內插處理單元77中,
內部插處理單元126著眼於輸入生成矢量特定號碼的高端第3位,如果其值是(a)『0』,則以將V1、V2、V3分別代入長度Ns(=52)的0矢量的偶數號採樣中的矢量作為新的V1、V2、V3,輸出到加法處理單元75中,如果其值是(b)『1』,則以將V1、V2、V3分別代入長度Ns(=52)的0矢量的奇數號採樣中的矢量作為新的V1、V2、V3,輸出到加法處理單元75中。
加法處理單元127對由內插處理單元126生成的3個矢量(V1、V2、V3)進行加法運算,生成並輸出聲源加法矢量。
這樣,本實施形態,因對應於生成矢量特定號碼隨機地組合多個處理,生成隨機的聲源矢量,所以不必預先將噪聲矢量原樣地存儲在噪聲碼本(ROM)中,能大幅度地減小存儲器的容量。
此外,藉助於在實施形態5的聲音編碼裝置中使用本實施形態的聲源矢量生成裝置,不必持有大容量的噪聲碼本,就能生成複雜隨機的聲源矢量。
實施形態7下面,在以作為日本國內的PDC數字便攜電話的聲音編碼/解碼標準方式的PSI-CELP為基礎做成的CELP型聲音編碼裝置中,使用前述的實施形態1~實施形態6的任一個所示的聲源矢量生成裝置的例,作為實施形態7進行說明。
圖13A和圖13B表示與實施形態7相關的聲音編碼裝置的方框圖。在這種編碼裝置中,將數位化的輸入聲音數據1300以幀為單位(幀長Nf=104)供給到緩存器1301中。這時,由供給的新的數據更新緩衝器1301中的舊的數據。幀功率量化和解碼單元1302首先從緩存器1301中讀出長度Nf(=104)的處理幀s(i)(0≤i≤Nf-1),由式(5)求出該處理幀內採樣的平均功率amp。
amp=i=0Nfs2(i)Nf-----(5)]]>amp處理幀內採樣的平均功率i處理幀內的要素號碼(0≤i≤Nf-1)s(i)處理幀內採樣Nf處理幀長(=52)利用式(6),將求得的處理幀內採樣的平均功率amp變換成對數變換值amplog。
amplog=log10(255amp+1)log10(255+1)-----(6)]]>amplog處理幀內採樣的平均功率的對數變換值amp處理幀內採樣的平均功率將求得的amplog存儲在功率量化表存儲單元1303中,用表3所示的10字的標量量化用表Cpow進行標量量化,得到4位的功率索引Ipow,從得到4位的功率索引Ipow求出解碼幀功率spow,並將功率索引Ipow和解碼幀功率spow輸出到參數編碼單元133中。功率量化表存儲單元1303存儲16字的功率標量量化表(表3),在幀功率量化·解碼單元1302對處理幀內採樣的平均功率的對數變換值進行標量量化時參照該表。
表3功率標量量化用表

LPC分析單元1304,首先從緩存器1301讀出分析區間長度Nw(=256)的分析區間數據,在讀出的分析區間數據上乘以窗長Nw(=256)的漢明窗Wh,得到乘以漢明窗後的分析區間數據後,多次求所得乘以漢明窗後的分析區間數據的自相關函數,直到次數為預測次數Np(=10)為止。。在求得的自相關函數上乘以存儲在滯後窗存儲單元1305中的10字的滯後窗表(表4),得到乘以滯後窗後的自相關函數,對於得到的乘以滯後窗後的自相關函數,進行線性預測分析,算出LPC的參數α(i)(1≤i≤Np),並輸出到音調預選單元1308中。
表4滯後窗表

接著,將求得的LPC參數α(i)變換成LSP(線頻譜對)ω(i)(1≤i≤Np),並輸出到量化/解碼單元1306中。滯後窗存儲單元1305存儲LPC分析單元參照的滯後窗。
LSP量化/解碼單元1306,首先參照LSP量化表存儲單元1307中存儲的LSP的矢量量化用表,對從LPC分析單元1304接收到的LSP進行矢量量化,選擇最佳索引,並以選擇的索引作為LSP碼Ilsp輸出到參數編碼單元1331中。接著,從LSP量化表存儲單元1307讀出對應於LSP碼的形心作為解碼LSPωq(i)(1≤i≤Np),並將讀出的解碼LSP輸出到LSP插入單元1311中。此外,將解碼LSP變換成LPC,得到解碼LSPαq(i)(1≤i≤Np),並將得到的解碼LPC輸出到矢量加權濾波器係數運算單元1312和聽覺加權LPC合成濾波器係數運算單元1314中。
LSP量化表存儲單元1307存儲LSP量化/解碼單元1306對LSP進行矢量量化時參照的LSP矢量量化表。
音調預選單元1308,首先對從緩存器1301讀出的處理幀數據s(i)(1≤i≤Nf-1),施行根據由LPC分析單元1304接收到的LSPα(i)(1≤i≤Np)構成的線性預測反濾波,得到線性預測殘差信號res(i)(1≤i≤Nf-1),計算得到的線性預測殘差信號res(i)的功率,求得用處理子幀聲音採樣功率使計算的殘差信號功率歸一化的值的歸一化預測殘差功率resid,並輸出到參數編碼單元1331中。接著,在線性預測殘差信號res(i)上乘以長度Nw(=256)的漢明窗,生成乘以漢明窗後的線性預測殘差信號resw(i)(1≤i≤Nw-1),在Lmin-2≤i≤Lmax+2(其中,Lmin為長期預測係數的最短分析區間為16、Lmax為長期預測係數的最長分析區間,分別取為16的128)的範圍內,求得生成的resw(i)的自相關函數φint(i)。在求得的自相關函數φint(i)上疊加存儲在多相係數存儲單元1309上的28字的多相濾波器係數Cppf(表5),分別求得整數滯後int的自相關函數φint(i)、偏離整數滯後int-1/4的分數位置的自相關函數φdq(i)、偏離整數滯後int+1/4的分數位置的自相關函數φaq(i)、偏離整數滯後int+1/2的分數位置的自相關函數φah(i)。
表5多相濾波器係數Cppf

此外,分別對Lmin-2≤i≤Lmax+2範圍內的自變量i,將φiht(i)、φdq(i)、φaq(i)、φah(i)中最大的代入到φmax(i)中,進行式(7)的處理,求得Lmax-Lmin+1個的φmax(i)。
φmax(i)=MAX(φint(i)、φdq(i)、φaq(i)、φah(i)) (7)φmax(i)φint(i)、φdq(i)、φaq(i)、φah(i)的最大值I長期預測係數的分析區間(Lmin≤i≤Lmax)Lmin長期預測係數的最短分析區間(=16)
Lmax長期預測係數的最長分析區間(-128)φint(i)預測殘差信號整數滯後(int)的自相關函數φdq(i)預測殘差信號分數滯後(int-1/4)的自相關函數φaq(i)預測殘差信號分數滯後(int+1/4)的自相關函數φah(i)預測殘差信號分數滯後(int+1/2)的自相關函數從求得的(Lmax-Lmin+1)個的φmax(i)中,由高端順次地選出值大的6個,保存作為音調候補psel(i)(0≤i≤5),並將線性預測殘差信號res(i)和音調第1候補psel(0)輸出到音調增強濾波器係數運算單元1310,將psel(i)(0≤i≤5)輸出到自適應矢量生成單元1319中。
多相係數存儲單元1309,存儲音調預選單元1308用分數滯後精度求出線性預測殘差信號的自相關函數時和自適應矢量生成單元1319用分數精度生成自適應矢量時參照的多相濾波器的係數。
音調增強濾波器係數運算單元1310,根據音調預選單元1308中求得的線性預測殘差和res(i)和從音調第1候補psel(0),求3次音調預測係數cov(0≤i≤2)。藉助使用求得的音調預測係數cov(0≤i≤2)的式(8),求音調增強濾波器Q(z)的脈衝響應,並輸出到頻譜加權濾波器係數運算單元1312和聽覺加權濾波器係數運算單元1313中。
Q(z)=1+i=02cov(i)piz-psel(0)+i-1-----(8)]]>Q(z)音調增強濾波器的傳遞函數cov(i)音調預測係數(0≤i≤2)λpi音調增強常數(=0.4)psel(0)音調第1候補LSP內插單元1311,首先藉助使用在LSP量化/解碼單元1306中求得的當前處理幀的解碼LSPωq(i)和以前求得並保持的前處理幀的解碼LSPωqp(i)的式(9),對每個子幀,求解碼mw插LSPωintp(n,i)(1≤i≤Np)。

ωintp(n,i)第n子幀的內插LSPn子幀號碼(=1,2)ωq(i)處理幀的解碼LSPωqp(i)前處理幀的解碼LSP用將求得的ωintp(n,i)變換成LPC,求得解碼內插LPCαq(n,i)(1≤i≤Np),並將求得的解碼內插LPCαq(n,i)(1≤i≤Np)輸出到頻譜加權濾波器係數運算單元1312和聽覺加權LPC合成濾波器係數運算單元1314中。
頻譜加權濾波器係數運算單元1312構成式(10)的MA型頻譜加權濾波器I(z),將其脈衝響應輸出到聽覺加權濾波器係數運算單元1313中。
(z)=i=1Nfirfir(i)z-i-----(10)]]>I(z)MA型頻譜加權濾波器的傳遞函數NfirI(z)的濾波器次數(=11)αfir(i)I(z)的脈衝響應(1≤i≤Nfir)其中,式(10)的脈衝響應αfir(i)(1≤i≤Nfir)是截短到Nfir(=11)項為止的(11)供給的的ARMA型頻譜增強濾波器G(z)的脈衝響應。
G(z)=1+i=1Np(n,i)maiz-i1+i=1Np(n,i)ariz-i-----(11)]]>G(z)頻譜加權濾波器的傳遞函數n子幀號碼(=1,2)NpLPC分析次數(=10)α(n,i)第n子幀的解碼內插LSPλmaG(z)的分子常數(=0.9)λarG(z)的分母常數(=0.4)聽覺加權濾波器係數運算單元1313,首先將疊加從頻譜加權濾波器係數運算單元1312接收到的頻譜加權濾波器I(z)的脈衝響應和從音調增強濾波器係數運算單元1310接收到的音調增強濾波器Q(z)的脈衝響應的結果作為脈衝響應,構成聽覺加權濾波器W(z),並將構成的聽覺加權濾波器W(z)的脈衝響應輸出到聽覺加權LPC合成濾波器係數運算單元1314和聽覺加權單元1315中。
聽覺加權LPC合成濾波器係數運算單元1314,利用從LSP內插單元1311接收到的解碼內插LPCαq(n,i)和從聽覺加權濾波器係數運算單元1313接收到的聽覺加權濾波器W(z),由式(12)構成聽覺加權LPC合成濾波器H(z)。
H(z)=11+i=1Npq(n,i)z-iW(z)-----(12)]]>H(z)聽覺加權合成濾波器的傳遞函數NpLPC分析次數αq(n,i)第n子幀的解碼內插LSPn子幀號碼(=1,2)W(z)聽覺加權濾波器(級聯I(z)和Q(z)而成)的傳遞函數將構成的聽覺加權LPC合成濾波器H(z)的係數,輸出到目標生成單元A1316、聽覺加權LPC倒置合成單元A1317、聽覺加權LPC合成單元A1321、聽覺加權LPC倒置合成單元B1326和聽覺加權LPC合成單元B1329中。
聽覺加權單元1315將從緩衝器1301中讀出的子幀信號輸入到0狀態的聽覺加權LPC合成濾波器H(z)中,並以其輸出作為聽覺加權殘差spw(i)(0≤i≤Ns-1),輸出到目標生成單元A1316中。
目標生成單元A1316從聽覺加權單元1315中求得的聽覺加權殘差spw(i)(0≤i≤Ns-1),減去作為在聽覺加權LPC合成濾波器係數運算單元1314中求得的聽覺加權LPC合成濾波器H(z)中輸入0系列時的輸出的0輸入響應Zres(i)(0≤i≤Ns-1)後,所得結果輸出到LPC倒置合成單元A1317和目標生成單元B1325中,作為聲源選擇用的目標向量r(i)(0≤i≤Ns-1)。
聽覺加權LPC倒置合成單元A1317時間反轉地將從目標生成單元1316接收到的目標系列r(i)(0≤i≤Ns-1)變換排列,並將變換得到的向量輸入到初始狀態為0的聽覺加權LPC合成濾波器H(z)中,將其輸出再次時間反轉變換排列,從而得到目標系列的時間反轉合成向量rh(k)(0≤k≤Ns-1),並輸出到比較單元A1322中。
自適應碼本1318存儲自適應矢量生成單元1319生成自適應矢量時參照的過去的驅動聲源。自適應矢量生成單元1319在生成從音調預選單元1308接收到的6個音調候補psel(j)(0≤j≤5)的同時,生成Nac個自適應矢量Pacb(i,k)(0≤i≤Ns-1、0≤k≤Ns-1、6≤Nac≤24),並輸出到自適應/固定選擇單元1320中。具體地說,如表6所示,在16≤psel(j)≤44的場合,對於相當於一個整數滯後位置的4種分數滯後位置,生成自適應矢量,在45≤psel(j)≤64的場合,對於相當於一個整數滯後位置的2種分數滯後位置,生成自適應矢量,在65≤psel(j)≤128的場合,對整數滯後位置,生成自適應矢量。由此,根據psel(j)(0≤j≤5)的值,自適應矢量的候補數Nac最少為6,最多為24。
表6自適應矢量和固定矢量的總數


此外,生成分數精度的自適應矢量時,利用在以整數精度從自適應碼本1318讀出的過去的聲源矢量中,疊加存儲在多相係數存儲單元1309中的多相濾波器係數的內插處理進行。
這裡,對應於lagf(i)的值的內插,是進行在lagf(i)=0的場合對應於整數滯後位置、在lagf(i)=1的場合對應於從整數滯後位置偏離-1/2的分數滯後位置、在lagf(i)=2的場合對應於從整數滯後位置偏離+1/4的分數滯後位置、在lagf(i)=3的場合對應於從整數滯後位置偏離-1/4的分數滯後位置的內插。
自適應/固定選擇單元1320,首先接受自適應矢量生成單元1319生成的Nac(6~24)一個候補的自適應矢量,並輸出到聽覺加權LPC合成單元A1321和比較單元A1322中。
比較單元A1322,首先為了適應矢量生成單元1319生成的自適應矢量Pacb(i,k)(0≤i≤Ns-1、0≤k≤Ns-1、6≤Nac≤24)從Nac(6~20)個候補中預先Nacb(=4)個候補,利用式(13)求得由聽覺加權LPC倒置合成單元1317受理的目標矢量的時間反轉合成矢量rh(k)(0≤k≤Ns-1)和自適應矢量Pacb(i,k)的內積prac(i)。
prac(i)=k=0Ns-1Pacb(i,k)rh(k)-----(13)]]>prac(i)自適應矢量預選基準值Nac(i)預選後自適應矢量候補數(=6~24)i自適應矢量的號碼(0≤i≤Nac-1)Pacb(i,k)自適應矢量rh(k)目標矢量r(k)的時間反轉合成矢量比較求得的內積prac(i),選擇其值變大時的標號和以該標號作為引數時的內積(直到高端第Nacb(=4)個為止,並分別作為自適應矢量預選後標號apsel(j)(0≤j≤Nacb-1)和自適應矢量預選後基準值prac(apsel(j))進行保存,而且將自適應矢量預選後標號apsel(j)(0≤j≤Nacb-1)輸出到自適應/固定選擇單元1320中。
聽覺加權LPC合成單元A1321對通過在自適應矢量生成單元1319中生成的自適應/固定選擇單元1320的預選後自適應矢量Pacb(apsel(j),k),施行聽覺加權LPC合成,生成合成自適應矢量SYNacb(apsel(j),k),並輸出到比較單元A1322中。接著,比較單元A1322為了對其自身已預選的Nacb(=4)個的預選後適應矢量Pacb(apsel(j),k)進行正式選擇,由式(14)求出自適應矢量正式選擇基準值sacbr(j)。
sacbr(j)=prac2(apsel(j))k=0Ns-1SYNacb2(j,k)-----(14)]]>sacbr(j)自適應矢量正大選擇基準值prac自適應矢量預選後基準值apsel(j)自適應矢量預選標號k矢量次數(0≤k≤Ns-1)
j被預選的自適應矢量的標號的號碼(0≤j≤Nacb-1)Ns子幀長(=52)Nacb自適應矢量的預選數SYNacb(J,K)合成自適應矢量分別用式(14)的值增大時的標號和以該標號作為引數時的式(14)的值,作為自適應矢量正大選擇後標號ASEL和自適應矢量正式選擇後基準值sacbr(ASEL),並輸出到自適應/固定選擇單元1320中。
固定碼本1323對固定矢量讀出單元1324讀出的矢量存儲Nfc(=16)個候補。這裡,比較單元A1322為了對從固定矢量讀出單元1324讀出的固定矢量Pfcb(i,k)(0≤i≤Nfc-1、0≤k≤Ns-1),從Nfc(=16)個候補中預選Nfcb(=2)個候補、利用式(15)求出由聽覺加權LPC倒置合成單元A1317受理的目標矢量的時間反轉合成矢量rh(k)(0≤k≤Ns-1)和固定矢量Pfcb(i,k)的內積的絕對值|prfc(i)|。
|prfc(i)|=k=0Ns-1Pfcb(i,k)rh(k)-----(15)]]>|prfc(i)|固定矢量預選基準值k矢量的要素號碼(0≤k≤Ns-1)I固定矢量的號碼(0≤i≤Nfc-1)Nfc固定矢量數(=16)Pfcb(i,k)固定矢量rh(k)目標矢量r(k)的時間反轉合成矢量比較式(15)的值|prac(i)|,選擇其值變大時的標號和以該標號作為引數時的內積的絕對值(直到高端第Nfcb(=2)為止),並分別作為固定矢量預選後標號fpsel(j)(0≤j≤Nfcb-1)和固定矢量預選後基準值|prfc(fpsel(j))|進行保存,而且將固定矢量預選後標號fpsel(j)(0≤j≤Nfcb-1)輸出到自適應/固定選擇單元1320中。
聽覺加權LPC合成單元A1321,對通過在固定矢量讀出單元1324中讀出的自適應/固定選擇單元1320的預選後固定矢量Pfcb(fpsel(j),k),施行聽覺加權LPC合成,生成合成固定矢量SYNfcb(fpsel(j),k),並輸出到比較單元A1322中。
接著,比較單元A1322為了從其自身預選的Nfcb(=2)個的預選後固定矢量Pfcb(fpsel(j),k)中正式選擇最佳固定矢量,由式(16)求出固定矢量正式選擇基準值sfcbr(j)。
sfcbr(j)=|prfc(fpsel(j)|2k=0Ns-1SYNfcb2(j,k)-----(16)]]>sfcbr(j)固定矢量正式選擇基準值|prfc|固定矢量預選後基準值fpsel(j)固定矢量預選後標號(0≤j≤Nfcb-1)k矢量的要素號碼(0≤k≤Ns-1)j被預選的固定矢量的號碼(0≤j≤Nfcb-1)Ns子幀長(=52)Nacb固定矢量的預選數(=2)SYNacb(J,K)合成固定矢量分別用式(16)的值增大時的標號和以該標號作為引數時的式(16)的值,作為固定矢量正式選擇後標號FSEL和固定矢量正式選擇後基準值facbr(FSEL),並輸出到自適應/固定選擇單元1320中。
自適應/固定選擇單元1320利用從比較單元A1322收到的prac(ASEL)、sacbr(ASEL)、|prfc(FSEL)|和sfcbr(FSEL)的大小和正負關係(記載在式(17)中),選擇正式選擇後自適應矢量或正式選擇後固定矢量,作為自適應/固定矢量AF(k)(0≤k≤Ns-1)。
AF(k)自適應/固定矢量ASEL自適應矢量正式選擇後標號FSEL固定矢量正式選擇後標號k矢量的要素號碼
Pacb(ASEL,k)正式選擇後自適應矢量Pfcb(FSEL,k)正式選擇後固定矢量sacbr(ASEL)自適應矢量正式選擇後基準值sfcbr(FSEL)固定矢量正式選擇後基準值prac(ASEL)自適應矢量預選後基準值prfc(FSEL)固定矢量預選後基準值將選擇的自適應/固定矢量AF(k)輸出到聽覺加權LPC合成濾波器單元A1321中,將表示生成選擇的自適應/固定矢量AF(k)的號碼的標號作為自適應/固定標號AFSEL輸出到參數編碼單元1331中。此外,這裡因設計成自適應矢量和固定矢量的總矢量數為255個(參照表6),所以自適應/固定標號AFSEL為8位編碼。
聽覺加權LPC合成濾波器單元A1321對在自適應/固定選擇單元1320中選擇的自適應/固定矢量AF(k),施行聽覺加權LPC合成濾波,生成合成自適應/固定矢量SYNaf(k)(0≤k≤Ns-1),並輸出到比較單元1322中。
比較單元1322,首先利用式(18)求出從聽覺加權LPC合成濾波器單元A1321收到的合成自適應/固定矢量SYNaf(k)(0≤k≤Ns-1)的功率powp。
k=0Ns-1SYNaf2(k)-----(18)]]>powp自適應/固定矢量(SYNaf(k))的功率k矢量的要素號碼(0≤k≤Ns-1)Ns子幀長(=52)SYNaf(k)自適應/固定矢量接著,由式(19)求出從目標生成單元A1316收到的目標矢量和合成自適應/固定矢量SYNaf(k)的內積pr。
pr=k=0Ns-1SYNaf(k)r(k)-----(19)]]>prSYNaf(k)和r(k)的內積Ns子幀長(=52)SYNaf(k)自適應/固定矢量
r(k)目標矢量k矢量的要素號碼(0≤k≤Ns-1)進而,將由從自適應/固定選擇單元1320收到的自適應/固定矢量AF(k)輸出到自適應碼本更新單元1333中,計算AF(k)的功率POWaf,將合成自適應/固定矢量SYNaf(k)和POWaf輸出到參數編碼單元1331中,並將powp和pr以及rh(k)輸出到比較單元B1330中。
目標生成單元B1325,從目標生成單元A1316收到的聲源選擇用的目標矢量r(i)(0≤k≤Ns-1)減去從比較單元A1322收到的合成自適應/固定矢量SYNaf(k)(0≤k≤Ns-1),生成新的目標矢量,並將生成的新的目標矢量輸出到聽覺加權LPC倒置合成單元B1326中。
聽覺加權LPC倒置合成單元B1326對目標生成單元B1325中生成的新的目標矢量,進行時間反轉排列變換,並將該變換後的矢量輸入到0狀態的聽覺加權LPC合成濾波器中,再次對該輸出向量進行時間反轉排列變換,生成新的目標矢量的時間反轉合成矢量ph(k)(0≤k≤Ns-1),並輸出到比較單元B1330中。
聲源矢量生成裝置1337使用與例如實施形態3中說明了的聲源矢量生成裝置70相同的裝置。聲源矢量生成裝置70從振種存儲單元71讀出第1個振種,輸入到非線性數字濾波器72中,並生成噪聲矢量。將在聲源矢量生成裝置70生成的噪聲矢量輸出到聽覺加權LPC合成單元B1329和比較單元B1330中。接著,從振種存儲單元71輸入到讀出第2個振種,輸入到非線性數字濾波器72中,生成噪聲矢量,並輸出到聽覺加權LPC合成單元B1329和比較單元B1330中。
較單元B1330為了對根據第1振種生成的噪聲矢量,從Nst(=64)個候補中預選Nstb(=6)個候補,由式(20)求出第1噪聲矢量預選基準值cr(i1)(0≤i1≤Nstb1-1))。
cr(i1)=j=0Ns-1Pstbl(i1j)rh(j)-prpowpj=0Ns-1Pstbl(i1j)ph(j)-----(20)]]>cr(i1)第1噪聲矢量預選基準值Ns子幀長(=52)rh(j)目標矢量(rh(j))的時間反轉合成矢量powp自適應/固定矢量(SYNaf(k))的功率
prSYNaf(k)和r(k)的內積Pstb1(i1,j)第1噪聲矢量ph(j)SYNaf(k)的時間反轉合成矢量i1第1噪聲矢量的號碼(0≤i1≤Nst-1)j矢量的要素號碼比較求得的cr(i1)d1值,選擇其值變大時的標號和以該標號作為引數時的式(20)的值(直到高端第Nstb(=6)個為止),分別作為第1噪聲矢量預選後標號s1pse1(j1)(0≤j1≤Nstb-1)和預選後第1噪聲矢量Pstbl(s1pse1(j1),k)(0≤j1≤Nstb-1,0≤k≤Ns-1))進行保存。接著,對於第2噪聲矢量也進行與第1噪聲矢量相同的處理,分別作為第2噪聲矢量預選後標號s2pse1(j2)(0≤j2≤Nstb-1)和預選後第2噪聲矢量Pstb1(s2pse2(j2),k)(0≤j2≤Nstb-1,0≤k≤Ns-1))進行保存。
聽覺加權LPC合成單元B1329,對預選後第1噪聲矢量Pstb1(s1pse1(j1),k),施行聽覺加權LPC合成,生成合成第1噪聲矢量SYNstb1(s1pse1(j1),k),並輸出到比較單元B1330中。接著,對預選後第2噪聲矢量Pstb2(s2pse1(j2),k),施行聽覺加權LPC合成,生成合成第2噪聲矢量SYNstb2(s2pse1(j2),k),並輸出到比較單元B1330中。
比較單元B1330為了對其自身預選的預選後第1噪聲矢量和預選後第2噪聲矢量進行正式選擇,對在聽覺加權LPC合成單元B1329中計算的合成第1噪聲矢量SYNstb1(s1pse1(j1),k),進行式(21)的計算。
SYNOstb1(s1pse1(j1),k)=SYNstb1(s1pse1(j1),k)-SYNaf(j1)powpk=0Ns-1Pstbl(s1pse1(j1),k)ph(k)-----(21)]]>SYNOstb1(s1pse1(j1),k)=(21)SYNOstb1(s1pse1(j1),k)正交化合成第1噪聲矢量SYNstb1(s1pse1(j1),k)合成第1噪聲矢量Pstb1(s1pse1(j1),k)預選後第1噪聲矢量SYNaf(j)自適應/固定矢量powp自適應/固定矢量(SYNaf(j))的功率
Ns子幀長(=52)ph(k)SYNaf(j)的時間反轉合成矢量j1預選後第1噪聲矢量的號碼k矢量的要素號碼(0≤k≤Ns-1)求出正交化合成第1噪聲矢量SYNOstb1(s1pse1(j1),k)後,對合成第2噪聲矢量SYNOstb2(s2pse1(j2),k)也進行同樣的計算,求出正交化合成第2噪聲矢量SYNOstb2(s2pse1(j2),k),並分別用式(22)和式(23),對((s1pse1(j1),s2pse1(j2))的全部組合(36項),以閉環方式計算第1噪聲矢量本選擇基準值scr1和第2噪聲矢量本選擇基準值scr2。
scr1=cscr12k=0Ns-1[SYNOstb1(s1pse1(ji),k)+SYNOstb2(s2psel(j2),k)]2-----(22)]]>scr1第1噪聲矢量本選擇基準值c scr1由式(24)事先計算的常數SYNOstb1(s1pse1(j1),k)正交合成第1噪聲矢量SYNOstb2(s2pse1(j2),k)正交合成第2噪聲矢量r(k)目標矢量s1pse1(j1),k第1噪聲矢量預選後標號s2pse1(j2),k第2噪聲矢量預選後標號Ns子幀長(=52)k矢量的要素號碼scr2=cscr22k=0Ns-1[SYNOstbl(s1pse1(j1),k-SYNOstb2(s2pse1(j2),k)]2-----(23)]]>scr2第2噪聲矢量本選擇基準值c scr1由式(25)事先計算的常數SYNOstb1(s1pse1(j1),k)正交合成第1噪聲矢量SYNOstb2(s2pse1(j2),k)正交合成第2噪聲矢量r(k)目標矢量s1pse1(j1),k第1噪聲矢量預選後索引
s2pse1(j2),k第2噪聲矢量預選後標號Ns子幀長(=52)k矢量的要素號碼其中,式(22)中的cs1cr和式(23)中的cs2cr,分別是由式(24)和式(25)預先計算的常數cscr1=k=0Ns-1YNOstb1(s1pse1(j1),k)r(k)+k=Ns-1SYNOstb2(s2pse1(j2),k)r(k)---(24)]]>cscr1式(22)用常數SYNOstb1(s1pse1(j1),k)正交合成第1噪聲矢量SYNOstb2(s2pse1(j2),k)正交合成第2噪聲矢量r(k)目標矢量s1pse1(j1),k第1噪聲矢量預選後標號s2pse1(j2),k第2噪聲矢量預選後標號Ns子幀長(=52)k矢量的要素號碼cscr1=k=0Ns-1SYNOstb1(s1pse1(j1),k)r(k)-K=0Ns-1SYNOstb2(s2pse1(j2),k)r(k)----(25)]]>cscr2式(23)用常數SYNOstb1(s1pse1(j1),k)正交合成第1噪聲矢量SYNOstb2(s2pse1(j2),k)正交合成第2噪聲矢量r(k)目標矢量s1pse1(j1),k第1噪聲矢量預選後標號s2pse1(j2),k第2噪聲矢量預選後標號Ns子幀長(=52)k矢量的要素號碼比較單元B1330進一步將s1cr的最大值代入到MAXs1cr中、將s2cr的最大值代入到MAXs2cr中,並用MAXs1cr和MAXs2cr中大的一個作為scr,將求得到scr時參照的s1pse1(j1)的值作為第1噪聲矢量正式選擇後標號SSEL1,輸出到參數編碼單元1331中。保存對應於SSEL1的噪聲矢量作為正式選擇後第1噪聲矢量Pstb1(SSEL1,k),求出對應於Pstb1(SSEL1,k)的本選擇後合成第1噪聲矢量SYNstb1(SSEL1,k)(0≤k≤Ns-1),並輸出到參數編碼單元1331中。
同樣,將求得scr時參照的s2pse1(j2)的值作為第2噪聲矢量正式選擇後標號SSEL2輸出到參數編碼單元1331中,而且保存對應於SSEL2的噪聲矢量作為正式選擇後第2噪聲矢量Pstb2(SSEL2,k),求出對應於Pstb2(SSEL2,k)的正式選擇後合成第2噪聲矢量SYNstb2(SSEL2,k)(0≤k≤Ns-1),並輸出到參數編碼單元1331中。
比較單元B1330進一步求出分別乘以Pstb1(SSEL1,k)和Pstb2(SSEL2,k)的符號S1和S2,並以求得的S1和S2的正負信息作為增益正負標號Is1s2(2位信息),輸出到參數編碼單元1331中。
S1正式選擇後第1噪聲矢量的符號S2正式選擇後第2噪聲矢量的符號scr1式(22)的輸出scr2式(23)的輸出cscr1式(24)的輸出cscr2式(25)的輸出在根據式(27)生成噪聲矢量ST(k)(0≤k≤Ns-1),並輸出到自適應碼本更新單元1333中的同時,求出其功率POWsf,並輸出到參數編碼單元1331中。
ST(k)=S1×Pstb1(SSEL1,k)÷S2×Pstb2(SSEL2,k)(27)ST(k)隨機矢量S1正式選擇後第1噪聲矢量的符號S2正式選擇後第2噪聲矢量的符號Pstb1(SSEL1,k)正式選擇後第1級確定的矢量Pstb2(SSEL2,k)正式選擇後第2級確定的矢量
SSEL1第1噪聲矢量正式選擇後標號SSEL2第2噪聲矢量正式選擇後標號k矢量的要素號碼(0≤k≤Ns-1)根據式(28)生成合成噪聲矢量SYNst(k)(0≤k≤Ns-1),並輸出到參數編碼單元1331中。
SYNst(k)=S1×SYNstb1(SSEL1,k)÷S2×SYNstb2(SSEL2,k)(28)SYNst(k)合成隨機的矢量S1正式選擇後第1噪聲矢量的符號S2正式選擇後第2噪聲矢量的符號SYNstb1(SSEL1,k)正式選擇後合成第1噪聲矢量SYNstb2(SSEL2,k)正式選擇後合成第2噪聲矢量k矢量的要素號碼(0≤k≤Ns-1)參數編碼單元1331,首先根據利用在幀功率量化/解碼單元1302中求得的解碼幀功率spow、以及音調預選單元1308中求得的歸一化預測殘差功率resid的式(29),求出子幀推定殘差功率rs。
rs=Ns×spow×resid (29)rs子幀推定殘差功率Ns子幀長(=52)spow解碼幀功率resid歸一化預測殘差功率使用求得的子幀推定殘差功率rs、比較單元A1322中計算的自適應/固定矢量的功率POWaf,比較單元B1330中求得的噪聲矢量的功率POWst、表7所示的增益量化表存儲單元1332中存儲的256字的增益量化用表(CGaf[i]、CGst[i])(0≤i≤127)等,根據式(30)求出量化增益選擇基準值STDg。
表7增益量化用表


STDg=k=0Ns-1(rsPOWafCGaf(Ig)SYNaf(k)]]>+rsPOWstCGst(Ig)SYNst(k)-r(k))----(30)]]>STDg量化增益選擇基準值rs子幀推定殘差功率POWaf自適應/固定矢量的功率POWst噪聲矢量的功率i增益量化表的標號(0≤i≤127)CGaf(i)增益量化表中自適應/固定矢量欄的組成部分CGat(i)增益量化表中噪聲矢量欄的組成部分SYNaf(k)合成自適應/固定矢量SYNat(k)合成噪聲矢量r(k)目標矢量Ns子幀長(=52)k矢量的要素號碼(0≤k≤Ns-1)藉助使用選擇1個求得的量化增益選擇基準值STDg為最小時的標號,作為增益量化標號Ig,以選擇的增益量化標號Ig為基礎從增益量化用表讀出的自適應/固定矢量欄的選擇後增益CGaf(Ig),以及以選擇的增益量化標號Ig為基礎從增益量化用表讀出的噪聲矢量側選擇後增益CGst(Ig)等的式(31),求出在AF(k)中實際用的自適應/固定矢量方面的正式增益Gaf和在ST(k)中實際用的噪聲矢量方面的正式增益Gst,並輸出到自適應碼本更新單元1333中。
(Gaf,Gst)=(rsPOWafCGaf(Ig),rsPOWstCGst(ID))---(31)]]>Gaf自適應/固定矢量側本增益Gst噪聲矢量側本增益rsrs子幀推定殘差功率POWaf自適應/固定矢量的功率POWst噪聲矢量的功率CGaf(Ig)固定/適應矢量方面的功率CGst(Ig)噪聲矢量方面的功率Ig增益量化標號參數編碼單元1331收集在幀功率量化和解碼單元1302中求得的功率標號Ipow、在LSP量化和解碼單元1306中求得的LSP碼I1sp、在自適應/固定選擇單元1320中求得的自適應/固定標號AFSEL、在比較單元B1330中求得的第1噪聲矢量正式選擇後標號SSEL1和第2噪聲矢量正式選擇後標號SSEL2以及增益正負標號Is1s2、在參數編碼單元1331自身中求得的增益量化標號Ig,作為聲音碼,並將收集到的聲音碼輸出到傳送單元1334中。
自適應碼本更新單元1333,進行對比較單元A1322中求得的自適應/固定矢量AF(k)和比較單元B1330中求得的噪聲矢量ST(k)分別乘以用參數編碼單元1331求得的自適應/固定矢量正式增益Gaf和噪聲矢量正式噪聲Gst後進行相加的式(32)的處理,生成驅動聲源ex(k)(0≤k≤Ns-1),並將生成的驅動聲源ex(k)(0≤k≤Ns-1)輸出到自適應碼本1318中。
ex(k)=Gaf×AF(k)+Gst*ST(k) (32)ex(k)驅動聲源AF(k)thd適應固定矢量ST(k)噪聲矢量的增益k矢量的要素號碼(0≤k≤Ns-1)這時,用由thd適應碼本更新單元1333收到的新驅動聲源ex(k),更新自適應碼本1318內舊的驅動聲源。
實施形態8下面,對在以作為數字便攜電話的聲音編碼/解碼標準方式的PSI-CELP開發的聲音解碼裝置中,用前述實施形態1~實施形態6說明了的聲源矢量生成裝置的實施形態進行說明。這種解碼裝置是與前述的實施形態7配對的裝置。
圖14表示與實施形態8相關的聲音解碼裝置的功能方框圖。參數解碼單元1402通過傳送單元1401獲得從圖13所述的CELP型聲音編碼裝置送來的聲音編碼(功率標號Ipow、LSP碼I1sp、自適應/固定標號AFSEL、第1噪聲矢量正式選擇後標號SSEL1、第2噪聲矢量正式選擇後標號SSEL2、增益量化標號Ig、增益正負標號Is1s2)。
接著,從存儲在功率量化表存儲單元1405中的功率量化用表(參照表3)讀出功率標號Ipow所示的標量值,並作為解碼幀功率spow輸出到功率復原單元1417中,從存儲在LSP量化表存儲單元1404中的LSP量化用表讀出LSP編碼I1sp的所示的矢量,並作為解碼LSP輸出到LSP內插單元1406中。將自適應/固定標號AFSEL輸出到自適應矢量生成單元1408固定矢量讀出單元1411以及自適應/固定選擇單元1412中,將第1噪聲矢量正式選擇後標號SSEL1和第2噪聲矢量正式選擇後標號SSEL2輸出到聲源矢量生成裝置1414中。從存儲在增益量化表存儲單元1403中的增益量化用表(參照表7)讀出增益量化索引Ig。所示的矢量(CAaf(Ig),CGst(Ig)),與編碼裝置側相同,根據式(31)求出在AF(k)中實際用的自適應/固定矢量正式增益Gaf和在ST(k)中實際用的噪聲矢量正式增益Gst,並將求得的自適應/固定矢量正式增益Gaf和噪聲矢量正式增益Gst與增益正負標號Is1s2一起輸出到驅動聲源生成單元1413中。
LSP內插單元1406用與編碼裝置相同的方法,根據從參數編碼單元1402收到的解碼LSP對每一子幀求出解碼內插LSPωintp(n,i)(0≤i≤Np),用求得的LSPωintp(n,i)變換成LPC,從而得到解碼內插LPC,並將得到的解碼內插LPC輸出到LPC合成濾波器單元1413中。
自適應矢量生成單元1408根據從參數解碼單元1402收到的自適應/固定標號AFSEL,在從自適應碼本1407讀出的矢量上疊加存儲在多相係數存儲單元1409中的多相係數(參照表5)的一部分,生成分數滯後精度的自適應矢量,並輸出到自適應/固定選擇單元1412中。固定矢量讀出單元1411根據從參數解碼單元1402收到的自適應/固定標號AFSEL,從固定碼本1410讀出固定矢量,並輸出到自適應/固定選擇單元1412中。
自適應/固定選擇單元1412根據從參數解碼單元1402收到的自適應/固定標號AFSEL,選擇從自適應矢量生成單元1408輸入的自適應矢量或從固定矢量讀出單元1411輸入的固定矢量作為自適應/固定矢量AF(k),並將被選擇的自適應/固定矢量AF(k)輸出到驅動聲源生成單元1413中。聲源矢量生成裝置1414根據從由參數解碼單元1402收到的第1噪聲矢量正式選擇後標號SSEL1和第2噪聲矢量正式選擇後標號SSEL2,從振種存儲單元71取出第1振種和第2振種,輸入到非線性數字濾波器72中,分別發生第1噪聲矢量和第2噪聲矢量。這樣,在重現的第1噪聲矢量和第2噪聲矢量上分別乘以增益正負標號的第1級信息S1和第2級信息S2,生成聲源矢量ST(k),並將生成的聲源矢量輸出到驅動聲源生成單元1413中。
驅動聲源生成單元1413在從自適應/固定選擇單元1412收到的自適應/固定矢量AF(k)和從聲源矢量生成裝置1414收到的聲源矢量ST(k)上分別乘以在參數編碼單元1402求出的自適應/固定矢量正式增益Gaf和噪聲矢量正式增益Gst後,根據增益正負標號Is1s2進行相加或者相減,得到驅動聲源ex(k),並將得到驅動器聲源輸出到LPC合成濾波器14136和自適應碼本1407中。在這裡,用從驅動聲源生成單元1413輸入的新的驅動聲源更新自適應碼本1407內的舊的驅動聲源。
LPC合成濾波器1416對在驅動聲源生成單元1413生成的驅動聲源,採用以從LSP內插入單元1406收到的解碼內插LPC構成的合成濾波器進行LPC合成,並將濾波器的輸出送到功率復原單元1417中。功率復原單元1417首先求出在LPC合成濾波器單元1413求得的驅動聲源合成矢量的平均功率,接著用將從參數解碼單元1402收到的解碼功率spow除以求得的平均功率,並將所得結果與驅動聲源的合成矢量乘,從而生成合成話音518。
實施形態9圖15表示與實施形態9相關的聲音編碼裝置的主要部分的方框圖。這種聲音編碼裝置是在圖13所示的聲音編碼裝置上增加量化對象LSP增加單元151LSP量化/解碼單元152和LSP量化誤差比較單元153,或者變更一部分功能。
LPC分析單元1304對緩存器1301內的處理幀進行線性預測分析並得到LPC後,對得到的LPC進行變換生成量化對象LSP,並將生成的量化對象LSP輸出到量化對象LSP增加單元151中。具體地說,兼備對緩存器內的首讀區間進行線性預測分析,得到對首讀區間的LPC後,對得到的LPC進行變換,生成對先讀區間的LSP,並輸出到量化對象LSP增加單元151中的功能。
量化對象LSP增加單元151藉助LPC分析單元1304中變換處理幀的LPC,除直接得到的量化對象LSP以外,還生成多個量化對象LSP。
LSP量化表存儲單元1307存儲LSP量化/解碼單元152參照的量化表,LSP量化/解碼單元152對生成的量化對象LSP進行量化和解碼,生成各自的解碼LSP。
LSP量化誤差比較單元153對生成的多個解碼LSP進行比較,以閉環的方式選擇1個異常噪聲最少的解碼LSP,並將選擇的解碼LSP作為對於處理幀的解碼LSP重新採用。
圖16表示量化對象LSP增加部分151的方框圖。
量化對象LSP增加部分151由存儲LPC分析單元1304中所求處理幀的量化對象LSP的當前幀LSP存儲單元161、存儲LPC分析單元1304中求出的首讀區間的LSP的首讀區間LSP存儲單元162、存儲前處理幀的解碼LSP的前幀LSP存儲單元163和對於從前述3個存儲單元讀出的LSP進行線性內插計算、並增加多個量化對象LSP的線性內插單元164構成。
對處理幀的量化對象LSP、首讀區間的LSP以及前處理幀的解碼LSP,進行線性內插計算,增加多個生成量化對象LSP,並將生成的量化對象LSP輸出到全部LSP量化/解碼單元152中。
這裡,對量化對象LSP增加單元151進一步詳細地進行說明。LPC分析單元1304,對緩存器內的處理幀進行線性預測分析,得到預測次數Np(=10)次的LPCα(i)(0≤i≤Np),對得到的LPC進行變換生成量化對象LSPω(i)(0≤i≤Np),並將生成的量化對象LSPω(i)(0≤i≤Np)存儲到量化對象LSP增加單元151內的當前幀LSP存儲單元161中。此外,對緩存器內的首讀區間進行線性預測分析,得到對首讀區間的LPC,變換得到的首讀區間的LPC,生成對首讀區間的LSPω(i)(0≤i≤Np),並將生成的首讀區間的LSPω(i)(0≤i≤Np)存儲在量化對象LSP增加單元151內的首讀區間LSP存儲單元162中。
接著,線性內插單元164分別從當前幀LSP存儲單元161讀出對應於處理幀的量化對象LSPω(i)(0≤i≤Np),從首讀區間LSP存儲單元162讀出對應於首讀區間的LSPωf(i)(0≤i≤Np),從前幀LSP存儲單元163讀出對應於前處理幀的解碼LSPωqp(i)(0≤i≤Np),藉助於進行式(33)所示的變換,分別生成量化對象增加第1LSPω1(i)(0≤i≤Np),量化對象增加第2LSP2ω(i)(0≤i≤Np),量化對象增加第3LSPω3(i)(0≤i≤Np)。
1(i)2(i)3(i)=0.80.20.00.30.30.20.80.30.5q(i)qp(i)f(i)---(33)]]>ω1(i)量化對象增加第1LSPω2(i)量化對象增加第2LSPω3(i)量化對象增加第3LSPiLPC次號(0≤i≤Np)NpLPC分析次數(=10)ωq(i)對應於處理幀的解碼LSPωqp(i)對應於前處理幀的複合LSPωf(i)對應於首讀區間的LSP將生成的ω1(i)、ω2(i)、ω3(i)輸出到LSP量化/解碼單元152中。LSP量化/解碼單元152在對4個量化對象LSPω(i)、ω1(i)、ω2(i)、ω3(i)全部進行矢量量化/解碼後,分別求出對應於ω(i)的量化誤差的功率Epow(ω)、對應於ω1(i)的量化誤差的功率Epow(ω1)、對應於ω2(i)的量化誤差的功率Epow(ω2)、對於ω3(i)的量化誤差的功率Epow(ω3),並對求出的各個量化殘差功率施行式(34)的變換,求出解碼LSP選擇基準值STDlsp(ω)、STDlsp(ω1)、STDlsp(ω2)、STDlsp(ω3)。
STDlspSTDlsp(1)STDlsp(2)STDlsp(3)=EpowEpow(1)Epow(2)Epow(3)-0.00100.00050.00020.0000----(34)]]>STDlsp(ω)對應於ω(i)的的複合LSP選擇基準值STDlsp(ω1)對應於ω1(i)的複合LSP選擇基準值
STDlsp(ω2)對應於ω2(i)的複合LSP選擇基準值STDlsp(ω3)對應於ω3(i)的複合LSP選擇基準值Epow(ω)對應於ω(i)的量化誤差的功率Epow(ω1)對應於ω1(i)的量化誤差的功率Epow(ω2)對應於ω2(i)的量化誤差的功率Epow(ω3)對應於ω3(i)的量化誤差的功率比較求出的解碼LSP選擇基準值,在選擇並輸出該基準值最小的量化對象LSP所對應的解碼LSP作為對應於處理幀的解碼LSPωq(i)(0≤i≤Np),同時在前幀LSP存儲單元163中存儲下一個幀的LSP,以便能在矢量量化時參照。
本實施形態有效地利用LSP具有的內插特性的優越性(即使用內插後的LSP合成也不會發生異常噪聲),能對LSP進行向量量化,即使象話頭那樣頻譜變動大的區間,也不發生異常噪聲,所以能減小在LSP的量化特性不充分的情況下可能發生的合成語音中的異常噪聲。
圖17表示本實施形態的LSP量化/解碼單元152的方框圖。LSP量化/解碼單元152包括增益信息存儲單元171、自適應增益選擇單元172、乘增益運算單元173、LSP量化單元174和LSP解碼單元175。
增益信息存儲單元171存儲自適應增益選擇單元172中選擇自適應增益時參照的多個增益候補。乘增益運算單元173將由LSP量化表存儲單元1307讀出的碼矢量乘以自適應增益選擇單元172中選擇的自適應增益。LSP量化單元174用乘以自適應增益後的碼矢量,對量化對象LSP進行矢量量化。LSP解碼單元175具有對矢量量化的LSP進行解碼,生成並輸出解碼LSP的功能,還具有求出作為量化對象LSP與解碼LSP的差分的LSP量化誤差,輸出到自適應增益選擇單元172中的功能。自適應增益選擇單元172以矢量量化時在碼矢量上乘以前處理幀的LSP的自適應增益的大小,和對應於前幀的LSP量化誤差的大小為基準,以存儲在增益存儲單元171中的增益生成信息為基礎進行自適應調節,同時求出對處理幀的量化對象LSP進行矢量量化時乘到碼矢量上自適應增益,並將求得的自適應增益輸出到乘法增益運算單元173中。
這樣,LSP量化/解碼單元152是在自適應碼矢量上的自適應增益的同時,對量化對LSP進行矢量量化和解碼。
這裡,對LSP量化/解碼單元152進一步詳細地進行說明。增益信息存儲單元171存儲自適應增益選擇單元103參照的4個增益候補(0.9,1.0,1.1,1.2),適應增益選擇單元103,利用在量化前幀的量化對象LSP時生成的功率ERpow除以矢量量化前處理幀的量化對象LSP時選擇的自適應增益Gqlsp的平方的式(35),求出自適應增益選擇基準值Slsp。
Slsp=ERpowGqlsp2----(35)]]>Slsp自適應增益選擇基準值ERpow量化前幀的LSP時生成的量化誤差的功率Gqlsp量化前幀的LSP時選擇的自適應增益根據使用求得的自適應增益選擇基準值Slsp的式(36),從由增益信息存儲單元171讀出的4個增益候補(0.9,1.0,1.1,1.2)中選擇1個增益。並且,在將被選擇的自適應增益Gqlsp的值輸出到乘增益運算單元173中的同時,將用於指定被選擇的適應增益是4種中的哪一種的信息(2位信息)輸出到參數編碼單元中。
Glsp乘在LSP量化用碼矢量上的自適應增益Slsp自適應增益選擇基準值在變量Gqlsp和變量ERpow中,保持所選擇的自適應增益Glsp和伴隨量化產生的誤差,直到矢量量化下一幀的量化對象LSP時為止。
乘增益運算單元173在由LSP量化表存儲單元1307讀出的碼矢量上乘以自適應增益選擇單元172中選擇的自適應增益Glsp,並輸出到LSP量化單元174中。LSP量化單元174,用乘以自適應增益的碼矢量,對量化對象LSP進行矢量量化,並將其標號輸出到參數編碼單元中。LSP解碼單元175對在LSP量化單元174量化的LSP進行解碼,得到解碼LSP,輸出到得到的解碼LSP,同時從量化對象LSP減去得到的解碼LSP,求出LSP量化誤差,計算求出的LSP量化誤差的功率ERpow,並輸出到自適應增益選擇單元172中。
本實施形態能減小在LSP的量化特性不充分的場合可能發生的合成話音中的異常噪聲。
實施形態10圖18表示與本實施形態相關的聲源矢量生成裝置的結果的方框圖。這種聲源矢量生成裝置包括存儲通道CH1、CH2、CH3的3個固定波形(V1(長度L1)、V2(長度L2)、V3(長度L3))的固定波形存儲單元181,具有各通道的固定波形起始端候補位置信息,並將從固定波形存儲單元181讀出的固定波形(V1、V2、V3)分別配置在P1、P2、P3的位置上的固定波配置在單元182和對基於固定波形配置單元182配置的固定波形相加,並輸出聲源矢量的加法運算單元183。
下面,對如前所述結構的聲源矢量生成裝置的動作進行說明。
在固定波形存儲單元181上預先存儲3個固定波形V1、V2、V3。固定波形配置單元182根據表8所示的其本身具有的固定波形起始端候補位置信息,在從CH1用的起始端候補位置中選擇的位置P1上配置(移位)從固定波形存儲單元181讀出的固定波形V1,同樣,在從CH2、CH3用的起始端候補位置中選擇的位置P2、P3上分別配置固定波形V2、V3。
表8固定波形起始端候補位置信息

加法運算單元183對由固定波形配置單元182配置的固定波形進行加法運算並生成聲源矢量。
其中,對固定波形配置單元182具有的固定波形起始端候補位置信息,分配與能被選擇的各固定波形的起始端候補位置的組合信息(表示選擇哪一個位置作為P1、選擇哪一個位置作為P2、選擇哪一個位置作為P3的信息)一一對應的碼號。
採用這樣結構的聲源矢量生成裝置,則在能利用傳送與固定波形配置單元182具有的固定波形起始端候補位置信息有對應關係的碼號,行聲音信息的傳送的同時,藉助於碼號僅存在於各起始端候補數的積的部分,能不增加計算和必要的存儲器,生成接近實際聲音的聲源矢量。
為了能利用碼號的傳送進行聲音信息的傳送,可前述聲源矢量生成裝置作為噪聲碼本用在聲音編碼/解碼裝置中。
在本實施形態中,雖然對圖18所示的用3個固定波形的場合進行了說明,但固定波形的個數(圖18和表8的通道數一致)為其它的個數的場合,也能得到同樣的作用和效果。
此外,在本實施形態中,雖然對固定波形配置單元182具有表8所示的固定波形起始端候補位置信息的場合進行了說明,但對於具有表8以外的固定波形起始端候補位置信息的場合,也能得到同樣的作用·效果。
實施形態11圖19A表示與本實施形態相關的CELP型聲音編碼裝置的結構方框圖。圖19B表示與CELP型聲音編碼裝置配對的CELP型聲音解碼裝置的結構方框圖。
與本實施形態相關的CELP型聲音編碼裝置包括由固定波形存儲單元181A和固定波形配置單元182A以及加法運算單元183A組成的聲源矢量生成裝置。固定波形存儲單元181A存儲多個固定波形,固定波形配置單元182A根據自己具有的固定波形起始端候補位置信息將從固定波形存儲單元181A讀出的固定波形分別配置(移位)在選擇的位置上,加法運算單元183A對由固定波形配置單元182A配置的固定波形進行加法運算、生成聲源矢量C。
這種CELP型聲音編碼裝置包括對被輸入的噪聲碼本檢索用目標X進行時間反轉的時間反轉單元191、對時間反轉單元191的輸出進行合成的濾波器192、對合成濾波器192的輸出再次進行反轉並輸出到時間反轉合成目標X』的時間反轉單元193、對乘以噪聲編碼矢量增益gc的聲源矢量C進行合成並輸出合成聲源矢量S的合成濾波器194,以及輸入X』、C、S並計算失真的失真計算單元205和傳送單元196。
在本實施形態中,固定波形存儲單元181A、固定波形配置單元182A和加法運算單元183A,對應於圖18所示的固定波形存儲單元181、固定波形配置單元182和加法運算單元183,各通道的固定波形起始端候補位置對應於表8,因而下文中表示通道號、固定波形號及其長度和位置的記號,使用圖18和表8所示的。
另一方面,圖19B的CELP型聲音解碼裝置包括存儲多個固定波形的固定波形存儲單元181B、根據基於自己具有的固定波形起始端候補位置信息,將從固定波形存儲單元181B讀出的固定波形分別配置(移位)在選擇的位置上的固定波形配置單元182B、對由固定波形配置單元182B配置的固定波形進行加法運算,生成聲源矢量C的加法運算單元183B、乘以噪聲編碼矢量增益gc的乘增益運算單元197和對聲源矢量C進行合成並輸出合成聲源矢量S的合成濾波器198。
聲音解碼裝置的固定波形存儲單元181B和固定波形配置單元182B,與聲音編碼裝置的固定波形存儲單元181A和固定波形配置單元182A具有相同的結構,固定波形存儲單元181A和181B存儲的固定波形,是具有藉助於將以使用噪聲碼本檢索用目標的式(3)的編碼失真計算式作為價值函數的學習,使式(3)的價值函數統計上最小的特性的固定波形。
下面,對如前所述結構的聲音編碼裝置的動作進行說明。
噪聲碼本檢索用目標X,在時間反轉單元191被倒置後,在合成濾波器被合成,並在時間反轉單元193再次被倒置後,作為噪聲碼本檢索用的時間反轉合成目標X』輸出到失真計算單元205中。
接著,固定波形配置單元182A根據表8所示的自己具有的固定波形起始端候補位置信息,將從固定波形存儲單元181A讀出的固定波形V1配置(移位)在從CH1用的起始端候補位置選擇的位置P1上,同樣,將固定波形V2、V3配置在從CH2、CH3用的起始端候補位置選擇的位置P2、P3上。被配置的各固定波形輸出到加法器183A中進行相加,成為聲源矢量C,並輸入到合成濾波器194中。合成濾波器194對聲源矢量C進行合成,生成合成聲源矢量S,並輸出到失真計算單元205中。
失真計算單元205輸入時間反轉合成目標X』、聲源矢量C、合成聲源矢量S,計算式(4)的編碼失真。
失真計算單元205在計算失真後,對固定波形配置單元182A能選擇的起始端候補位置的全部組合,重複進行從將信號送到固定波形配置單元182A中,從固定波形配置單元182A選擇分別對應於3個通道的起始端候補位置起,到在失真計算單元205計算失真為止的前述處理。
然後,選擇編碼失真最小的起始端候補位置的組合,將與該起始端候補位置的組合一一對應的碼號、以及這時的最佳噪聲碼矢量增益gc作為噪聲碼本的碼,傳送到傳送單元196中。
接著,對圖19B的聲音解碼裝置的動作進行說明。
固定波形配置單元181B根據從傳送單元196送來的信息,從表8所示的自己具有的固定波形起始端候補位置信息中選擇各通道的固定波形的位置,將從固定波形配置單元181B讀出的固定波形V1配置(移位)在從CH1用的起始端候補位置中選擇的位置P1上,同樣,將固定波形V2、V3配置在從CH2、CH3用的起始端候補位置中選擇的位置P2、P3上。被配置的各固定波形輸出到加法器43中進行相加,成為聲源矢量C,並乘以由來自傳送單元196的信息選擇的噪聲碼矢量增益gc後,輸出到合成濾波器198中。合成濾波器198對乘以gc後的聲源矢量C進行合成,生成並輸出合成聲源矢量S。
採用這樣結構的聲音編碼/解碼裝置,則因由固定波形存儲單元、固定波形配置單元和加法器組成的聲源矢量生成單元生成聲源矢量,所以增加具有實施形態10的效果,此外,用合成濾波器合成這種聲源矢量而得的合成聲源矢量還具有與實際的目標統計上接近的特性,因而能得到高品質的合成聲音。
在本實施形態中,雖然示出了將學習得到的固定波形存儲在固定波形存儲單元181A和181B中的情況,但在採用其它的統計分析噪聲碼本檢索用目標X,並根據其分析結果生成的固定波形的情況下,在採用根據實際見識生成的固定波形的情況下,也能同樣地得到高品質的合成聲音。
在本實施形態中,雖然對固定波形存儲單元存儲3個固定波形的情況進行了說明,但在固定波形的個數為其它的個數的情況下也能得到同樣的作用和效果。
此外,在本實施形態中,雖然對固定波形配置單元具有表8所示的固定波形起始端候補位置信息的情況進行了說明,但在具有表8以外的固定波形起始端候補位置信息的情況下也能得到同樣的作用和效果。
實施形態12圖20是表示本實施形態的CELP型聲音編碼裝置的結構的方框圖。
該CELP型聲音編碼裝置具有存儲多個固定波形(本實施形態中是CH1W1、CH2W2、CH3W3個)的固定波形存儲器200,以及有作為對固定波形存儲器200中存儲的固定波形由代數規則生成其起始端位置用的信息的固定波形起始端候補位置信息的固定波形配置單元201。又,該CELP型聲音編碼裝置具備波形別脈衝響應運算單元202、脈衝發生器203及相關矩陣運算器204,還具備時間反轉單元193及失真計算單元205。
波形別脈衝響應運算單元202具有對固定波形存儲器200來的3個固定波形和合成濾波器的脈衝響應h(長度L=子幀長度)進行卷積,計算出3種波形別脈衝響應(CH1h1、CH2h2、CH3h3,長度L=子幀長度)的功能。
波形別合成濾波器192』具有對使輸入的噪聲碼檢索目標X時間反轉的時間反轉單元191的輸出與來自波形別脈衝響應運算單元202的各個波形別脈衝響應h1、h2、h3進行卷積的功能。
脈衝發生器203隻在固定波形配置單元201選擇的起始候補位置P1、P2、P3分別使振幅1(有極性)的脈衝上升,產生不同通道的脈衝(CH1d1、CH2d2、CH3d3)。
相關矩陣運算器204計算來自波形別脈衝響應運算單元202的波形別脈衝響應h1、h2與h3各自的自相關,以及h1與h2、h1與h3、h2與h3的互相關,將求得的相關值在相關矩陣存儲器RR中展開。
失真運算單元205用3個波形別時間反轉合成目標(X』1、X』2、X』3)、相關矩陣存儲器RR、3個通道別脈衝(d1、d2、d3),藉助於式(4)的變形式(37)指定使編碼失真最小的噪聲碼矢量。
(i=13xirdi)2i=13j=13HiHjdj-----------(37)]]>di通道別脈衝(矢量)di=±1×δ(k-pi),k=0~L-1,pi第i通道n固定波形起始端候補位置
Hi=波形別脈衝響應卷積矩陣(Hi=HWi)Wi=固定波形卷積矩陣Wi=wi(0)00000wi(1)wi(0)00000wi(2)wi(1)wi(0)00000MMMO0000wi(Li-1)wi(Li-2)OOO0000wi(Li-1)wi(Li-2)OO00M0wi(Li-1)OO000MM0OOO00MMMOOOO00000wi(Li-1)wi(1)wi(0)]]>其中Wi為第i通道的固定波形(長度Li)x』i在Hi將x時間反轉合成倒置的矢量(x’ti=Hi)這裡對從式(4)變成式(37)的變換,分別用式(38)和式(39)表示出分母項和分子項的變換。
(xHc)2]]>=(xH(W1d2+W2d2+W3d3))2]]>=(x(H1d1+H2d2+H3d3))2]]>=((xH1)d1+(xH2)d2+(xH3)d3)2]]>=(x1d1+x2d2+x3d3)2]]>=(i=13xidi)2------(38)]]>x噪聲碼檢索目標(矢量)xtx的倒易矢量H合成濾波器的脈衝響應卷積矩陣c噪聲碼矢量(c=W1d1+W2d2+W3d3)Wi固定波形卷積矩陣
di通道別脈衝(矢量)Hi波形別脈衝響應卷積矩陣(Hi=HWi)x’t在Hi將x時間反轉合成倒置的矢量(x’ti=xtHi)||Hc||2]]>=||H(W1d1+W2d2+W3d3)||2]]>=||H1d1+H2d2+H3d3||2]]>=(H1d1+H2d2+H3d3)(H1d1+H2d2+H3d3)]]>=(d1H1+d2H2+d3H3)(H1d1+H2d2+H3d3)]]>=i=13j=13diHidjHj----------(39)]]>H合成濾波器的脈衝響應卷積矩陣c噪聲碼矢量(c=W1d1+W2d2+W3d3)Wi固定波形卷積矩陣di通道別脈衝(矢量)Hi波形別脈衝響應卷積矩陣(H=HWi)下面對具有如上所述結構的CELP型聲音編碼裝置的動作加以說明。
首先,對波形別脈衝響應運算單元202存儲的3個固定波形W1、W2、W3和脈衝響應h進行卷積,計算出3種波形別脈衝響應h1、h2、h3,輸出到波形別合成濾波器192』及相關矩陣運算器204。
接著,波形別合成濾波器192』對由時間反轉單元191進行過時間反轉的噪聲碼檢索目標X和輸入的3種波形別脈衝響應h1、h2、h3的各個進行卷積,用時間反轉單元193再度對來自波形別合成濾波器192』的3種輸出矢量進行時間反轉,分別生成3個波形別時間反轉合成目標X』1、X』2、X』3輸出到失真計算單元205。
接著,相關矩陣運算單元204計算輸入的3種波形別脈衝響應h1、h2、h3各自的自相關和h1與h2、h1與h3、h2與h3的互相關,將求得的相關值在相關矩陣矩陣存儲器RR展開後輸出到失真運算單元205。
將上述處理作為前處理實施後,固定波形配置單元201在每一個通道各選一個固定波形的起始端候補位置,向脈衝發生器203輸出該位置信息。
脈衝發生器203在從固定波形配置單元121得到的選擇位置上分別使振幅1(有極性)的脈衝上升,產生通道別脈衝d1、d2、d3並輸出到失真計算單元205。
然後,失真計算單元205用3個波形別時間反轉合成目標X』1、X』2、X』3、相關矩陣RR及3個通道別脈衝d1、d2、d3,計算式(37)的最小編碼失真基準值。
固定波形配置單元201就該單元能夠選擇的起始端候補位置的全部組合,反覆進行從選擇對分別與3個通道對應的起始端候補位置起,到失真計算單元205計算失真為止的上述處理。然後,在將噪聲碼矢量增益gc指定為噪聲碼本的代碼後,將使式(37)的編碼失真檢索基準值最小的起始端候補位置的組合編號所對應的碼號及那時的最佳增益傳送到傳輸單元。
還有,本實施形態的聲音解碼裝置的結構與實施形態10的圖19B相同,聲音編碼裝置的固定波形存儲單元及固定波形配置單元與聲音解碼裝置裝置的固定波形存儲單元及固定波形配置單元有相同的結構。固定波形存儲單元存儲的固定波形是具有將使用噪聲碼本檢索目標的式(3)(編碼畸變計算式)作為價值函數學習,以在統計上使式(3)的價值函數最小的特性的固定波形。
採用這樣構成的聲音編碼/解碼裝置,在能夠以代數計算算出固定波形配置單元內的固定波形起始端修補位置的情況下,將前處理階段求得的波形別時間反轉合成目標的3項相加,取其結果的平方,可以計算式(37)的分子項。又,將前處理階段求得的波形別脈衝響應的相關矩陣的9項相加,可以計算式(37)的分子項。因此,可以用與將已有的代數結構聲源(以振幅1的幾個脈衝構成聲源矢量)用於噪聲碼本的情況相同的運算量完成檢索。
再者用合成濾波器合成的合成聲源矢量與實際目標有在統計上相近的特性,因此可以得到高質量的合成話音。
還有,本實施形態示出了將學習得到的固定形狀存儲於固定波形存儲單元的情況,此外,在使用對噪聲碼本檢索用的目標X進行統計分析,根據該分析結果作成的固定波形的情況下,以及使用根據實際見識作成的固定波形的情況下,也一樣能夠得到高質量的合成話音。
又,本實施形態對固定波形存儲單元存儲3個固定波形的情況作出了說明,但是固定波形的個數取其他數值的時也能得到相同的作用與效果。
又,本實施形態對固定波形配置單元具有表8所示的固定波形起始端候補位置信息的情況作了說明,但如果是能夠以代數方法生成的,則具有表8以外的固定波形起始端候補位置信息的情況也能得到同樣的作用和效果。
實施形態13圖21是本實施形態的CELP型聲音編碼裝置的結構方框圖。本實施形態的編碼裝置具備2種噪聲碼本A211、B212、切換兩種噪聲碼本的開關213、進行噪聲碼矢量乘以增益的運算的乘法器214、將由開關213連接的噪聲碼本輸出的噪聲碼矢量加以合成的合成濾波器215,以及計算式(2)的編碼失真的失真計算單元216。
噪聲碼本A211具有實施形態10的聲源矢量生成裝置的結構,另一噪聲碼本B212由存儲根據隨機數序列作出的多個隨機矢量的隨機數序列存儲單元217構成。以閉環進行噪聲碼本的切換。X是噪聲碼本檢索用的目標。
下成對具有如上所述結構的CRLP型聲音編碼裝置的動作加以說明。
開始時,開關213連接於噪聲碼本A211一側,固定波形配置單元182根據示於表8的本身具有的固定波形起始端候補位置信息,將從固定波形存儲單元181讀出的固定波形分別配置(移位)到從起始端候補位置選擇出的位置上。所配置的固定波形由加法器183進行加法運算,變成噪聲碼矢量,並乘以噪聲碼矢量增益後被輸入合成濾波器215。合成濾波器215將所輸入的噪聲碼矢量加以合成後,輸出到失真計算單元216。
失真計算單元216使用噪聲碼本的檢索用目標×和從合成濾波器215得到的合成,進行式(2)的使編碼失真最小的處理。
失真計算單元216在計算失真之後,向固定波形配置單元182傳送信號,就固定波形配置單元182能選擇的起始端候補位置的全部組合,反覆進行從固定波形配置單元182選擇起始端候補位置起,到失真計算單元216計算失真為止的上述處理。
然後,選擇最小編碼失真的起始端候補位置的組合,存儲與該起始端候補位置的組合一一對應的噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,及編碼失真最小值。
接著,開關213連接於噪聲碼本B212一側,從隨機數序列存儲單元217讀出的隨機數序列成為噪聲碼矢量,乘以噪聲碼矢量增益後,輸出到合成濾波器215。合成濾波器215將所輸入的噪聲碼矢量加以合成後,輸出到失真計算單元216。
失真計算單元216用噪聲碼本檢索用的目標X和從合成濾波器215得到的合成矢量,計算式(2)的編碼失真。
失真計算單元216在計算失真之後向隨機數序列存儲單元217傳送信號,就隨機數序列存儲單元217能選擇的全部噪聲碼矢量,反覆進行從隨機數序列存儲單元217選擇噪聲碼矢量起,到在失真計算單元216計算失真為止的上述處理。
然後,選擇編碼失真最小的噪聲碼矢量,將該噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,以及編碼失真最小值存儲起來。
接著,失真計算單元216將把開關213連接於噪聲碼本A211時得到的編碼失真最小值與把開關213連接於噪聲碼本B212時得到的編碼失真最小值加以比較,將得到較小編碼失真時的開關連接信息及那時的碼號和噪聲碼矢量增益判定為聲音碼,傳送到未圖示的傳輸單元。
還有,與本實施形狀的聲音編碼裝置配對的聲音解碼裝置是將噪聲碼本A、噪聲碼本B、開關、噪聲碼矢量增益,及合成濾波器以同圖21一樣的結構配置而成的,根據由傳輸單元輸入的聲音碼,決定所使用的噪聲碼本。噪聲碼矢量及噪聲碼矢量增益,得到合成聲源矢量作為合成濾波器的輸出,採用這樣構成的聲音編碼裝置/解碼裝置,可以從由噪聲碼本A生成的噪聲碼矢量和由噪聲碼本B生成的噪聲碼矢量中,以閉環的方式選擇使式(2)的編碼失真最小的,因此,能夠生成更接近實際聲音的聲源矢量,同時能夠得到高音質的合成話音。
本實施形態示出以作為已有CELP型聲音編碼裝置的圖2所示結構為基礎的聲音編碼/解碼裝置,但是在圖19A、B或圖20的結構為基礎的CELP型聲音編碼裝置/解碼裝置中使用本實施形態也能得到同樣的作用與效果。
本實施形態設噪聲碼本A211圖18的結構,但是在固定波形存儲單元181具有其他結構的情況(例如有4種固定波形等)等也能得到同樣的作用和效果。
在本實施形態中,對噪聲碼本A211的固定波形配置單元182具有表8中所示的固定波形起始端候補位置信息的情況作了說明,但是,具有其他固定波形起始端候補位置信息時也能得到同樣的作用和效果。
又,本實施形態對噪聲碼本B212由直接在存儲器中存儲多個隨機數序列的隨機數序列存儲單元217構成的情況進行了說明,但是噪聲碼本B212具有其他聲源結構的情況(例如由代數結構聲源生成信息構成的情況)也能得到同樣的作用和效果。
再者,本實施形態對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置作了說明,但採用具有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時,也能取得同樣的作用和效果。
實施形態14圖22表示本實施形態的CELP型聲音編碼裝置的結構。本實施形態的聲音編碼裝置具有兩種噪聲碼本,一種噪聲碼本是實施形態10的圖18所示的聲源矢量生成裝置的結構,另一噪聲碼本由存儲多個脈衝串的脈衝串存儲單元構成,利用噪聲碼本檢索以前已經得到的量化音調增益,自適應地換用噪聲碼本。
噪聲碼本A211由固定波形存儲單元181、固定波形配置單元182、加法器183構成,與圖18的原矢量生成裝置對應。噪聲碼本B221由存儲多個脈衝串的脈衝串存儲單元222構成。開關213』對噪聲碼本A211與噪聲碼本B211進行切換。又,乘法器224輸出自適應碼本223的輸出乘以在噪聲碼本檢索時已經得到的音調增益得出的自適應碼矢量。音調增益量化器225的輸出傳送給開關213』。
下面對具有上述結構的CELP型聲音編碼裝置的動作加以說明。
已有的CELP型聲音代碼裝置首先進行自適應碼本223的檢索,接著接受其結果,進行噪聲碼本檢索。該自適應碼本檢索是從自適應碼本223存儲的多個自適應碼矢量(自適應碼矢量與噪聲碼矢量乘以各自的增益後進行相加而得到的矢量)選擇最合適的自適應碼矢量的處理,結果是生成自適應碼矢量的碼號及音調增益。
本實施形態的CELP型聲音編碼裝置在音調增益量化單元225將該音調增益量化,並在生成量化音調增益之後進行噪聲碼本檢索。音調增益量化單元225得到的量化音調增益送往切換噪聲碼本用的開關213』。
開關213』在量化音調增益的值小的時候判斷為輸入聲音清音性強,連接噪聲碼本A211,在量化音調增益值大的時候判斷為輸入聲音濁音性強,連接噪聲碼本B221。
開關213』連接於噪聲碼本A211一側時,固定波形配置單元182根據示於表8的本身具有的固定波形起始端候補位置信息,將從固定波形存儲單元181讀出的固定波形分別配置(移位)到從起始端候補位置選擇出的位置上。所配置的各固定波形輸出到加法器183進行加法運算,成為噪聲碼矢量,乘以噪聲碼矢量增益後輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量加以合成,輸出到失真計算單元216。
失真計算單元216利用噪聲碼本檢索用目標X和從合成濾波器215得到的矢量,計算式(2)的編碼失真。
失真計算單元216在計算失真之後向固定波形配置單元182傳送信號182,就固定波形配置單元182能夠選擇的起始端候補位置的全部組合,反覆進行從固定波形配置單元182選擇起始端候補位置起,到失真計算單元216計算失真為止的上述處理。
然後,選擇編碼失真最小的起始端候補位置的組合,將與該起始端候補位置的組合一一對應的噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,及量化音調增益作為聲音碼傳送到傳輸單元。本實施形態在進行聲音編碼之前事先使固定波形存儲單元181存儲的固定波形圖呈現清音性質。
另一方面,開關213』連接於噪聲碼本B221一側時從脈衝串存儲單元222讀出的脈衝串成為噪聲碼矢量,開關213』經噪聲碼矢量增益的乘法運算過程後,輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量加以合成,並輸出到失真計算單元216。
失真計算單元216用噪聲碼本檢索用目標X和從合成濾波器215得到的合成矢量,計算式(2)的編碼失真。
失真計算單元216在計算失真之後向脈衝串存儲單元222傳送信號,就脈衝串存儲單元222能夠選擇的所有的噪聲碼矢量,反覆進行從脈衝串存儲單元222選擇噪聲碼矢量起,到失真計算單元216計算失真為止的上述處理。
然後,選擇編碼失真最小的噪聲碼矢量,將該噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,以及量化音調增益作為聲音碼向傳輸單元傳送。
還有,與本實施形態的聲音編碼裝置配對的聲音解碼裝置是具有將噪聲碼本A、噪聲碼本B、開關、噪聲碼矢量增益,以及合成濾波器以與圖22相同的結構配置而成的部分的裝置,首先,接收傳送來的量化音調增益,根據其大小判斷在編碼裝置一方開關213』是連接於噪聲碼本A211一側,還是連接於噪聲碼本B221一側。接著,根據碼號及噪聲碼矢量增益的代碼,得到合成聲源矢量作為合成濾波器的輸出。
採用具有這樣的結構的聲源編碼/解碼裝置,可以相應於輸入聲音的特徵(在本實施形態中,利用量化音調增益的大小作為濁音性/清音性的判斷數據)自適應地切換2種噪聲碼本,能夠在輸入聲音的濁音性強的情況下選擇脈衝串作為噪聲碼矢量,在清音性強的情況下,選擇呈現清音性質的噪聲碼矢量,可生成更接近原聲的聲源矢量,同時可以提高合成話音的音質。在本實施形態中,由於如上所述以開環進行開關切換,可以使傳送的信息增加,以提高有關作用和效果。
本實施形態中示出以作為已有的CELP型聲音編碼裝置的圖2所示結構為基礎的聲音編碼/解碼裝置,但是在以圖19A、B或圖20的結構為基礎的CELP型聲音編碼/解碼裝置中使用本實施形態也可以得到同樣的效果。
本實施形態中,作為用於切換開關213』的參數,使用在音調增益量化器225將自適應碼矢量的音調增益量化而得到的音調增益,但是也可以代之以使用配備音調周期運算器,從自適應碼矢量計算出的音調周期。
本實施形態中,設噪聲碼本A211具有圖18的結構,但是在固定波形存儲單元181具有其他結構的情況下(例如有4種固定波形的情況等),也能得到同樣的作用與效果。
在本實施形態中,對噪聲碼帳A211的固定波形配置單元182具有表8所示的固定波形起始端候補位置信息的情況作了說明,但是具有其他固定波形起始端候補位置信息時也能夠得到同樣的作用與效果。
在本實施形態中,就噪聲碼本B211由直接將脈衝串存儲於存儲器中的脈衝串存儲單元222構成的情況作了說明,但是在噪聲碼本B221具有其他聲源結構(例如由代數結構聲源生成信息構成的情況下)也能夠得到同樣的作用與效果。
還有,在本實施例中,對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置進行了說明,但是採用具有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時,也能夠得到同樣的作用與效果。
實施形態15圖23是本實施形態的CELP型聲音編碼裝置的結構方框圖。本實施形態的聲音編碼裝置具有兩種噪聲碼本,一種噪聲碼本是實施形態10的圖18所示的聲源矢量生成裝置的結構,在固定波形存儲單元存儲3個固定波形,另一噪聲碼本同樣是圖18所示的聲源矢量生成裝置的結構,但固定波形存儲單元存儲的固定波形是2個,而且以閉環進行上述兩種噪聲碼本的切換。
噪聲碼本A211由存儲3個固定波形的固定波形存儲單元A181、固定波形配置單元A182、加法器183構成,與以圖18的聲源矢量生成裝置的結構在固定波形存儲單元存儲3個固定波形的情況對應。
噪聲碼本B230由存儲2個固定波形的固定波形存儲單元B231、具備表9所示的固定波形起始端候補位置信息的固定波形配置單元B232、將由固定波形配置單元B232配置的2個固定波形相加生成噪聲碼矢量的加法器233構成,與以圖18的聲源矢量生成裝置的結構在固定波形存儲單元存儲2個固定波形的情況對應。
表9

其他結構也與上述實施形態13相同。
下面對具有如上所述的結構的CELP型聲音編碼裝置的動作加以說明。
開始時,開關213連接於噪聲碼本A211一側,固定波形存儲單元A181根據表8所示的本身具有的固定波形起始端候補位置信息,將從固定波形存儲單元A181讀出的3個固定波形分別配置(移位)到從起始端候補位置選擇出的位置上。所配置的3個固定波形輸出到加法器183,經過加法運算,成為噪聲碼矢量,經過開關213、乘以噪聲碼矢量增益的乘法器213,輸入合成濾波器215。合成濾波器215將輸入的噪聲代碼量加以合成,並輸出到失真計算單元216。
失真計算單元用噪聲碼本檢索用的目標X和從合成濾波器215得到的合成矢量計算式(2)的編碼失真。
失真計算單元216在計算失真之後向固定波形配置單元A182傳送信號,就固定波形配置單元A182能選擇的起始端候補位置的全部組合,反覆進行從固定波形配置單元A182選擇起始端候補位置起,到失真計算單元216計算失真為止的上述處理。
然後,選擇編碼失真最小的起始端候補位置的組合,存儲與該起始端候補位置的組合一一對應的噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,以及編碼失真最小值。
本實施形態中,在進行聲音編碼之前,存儲於固定波形存儲單元A181的固定波形圖使用學習得到的,該學習在固定波形有3個的條件下使失真最小。
接著,開關213連接於噪聲碼本B230一側,固定波形存儲單元B231根據表9所示的本身具有的固定波形起始端候補位置信息,將從固定波形存儲單元B231讀出的2個固定波形分別配置(移位)到從起始端候補位置選擇出的位置上。所配置的2個固定波形輸出到加法器233,經過加法運算後,成為噪聲碼矢量,經過開關213、將乘以噪聲碼矢量增益的乘法器214,輸入合成濾波器215。合成濾波器215將輸入的噪聲碼矢量合成,並輸出到失真計算單元216。
失真計算單元216用噪聲碼本檢索用的目標X和從合成濾波器215得到的合成矢量,計算式(2)的編碼失真。
失真計算單元216在計算失真之後,將信號傳送到固定波形配置單元B232,就固定波形配置單元B232能夠選擇的起始端候補位置的全部組合,反覆進行從固定波形配置單元B232選擇起始端候補位置,到失真計算單元216計算失真為止的上述處理。
然後,選擇編碼失真最小的起始端候補位置的組合,存儲與該起始端候補位置的組合一一對應的噪聲碼矢量的碼號、那時的噪聲碼矢量增益gc,以及編碼失真最小值。本實施形態在進行聲音編碼之前,存儲於固定波形存儲單元B231的固定波形圖使用學習得到的,該學習在固定波形有2個的條件下使失真最小。
接著,失真計算單元216將開關213連接於噪聲碼本A211時得到的編碼失真最小值與開關213連接於噪聲碼本B230時得到的編碼失真最小值加以比較,將得到較小編碼失真時的開關連接信息、那時的碼號及噪聲碼矢量增益判定為聲音碼,傳送到傳輸單元。
還有,在本實施形態中的聲音解碼裝置是具有將噪聲碼本A、噪聲碼本B、開關、噪聲碼矢量增益及合成濾波器以與圖23一樣的結構配置而成的部分的裝置,根據從傳輸單元輸入的聲音碼,決定所使用的噪聲碼本、噪聲碼矢量及噪聲碼矢量增益,從而得到合成聲源矢量作為合成濾波器的輸出。
採用這樣構成的聲音編碼/解碼裝置,可用閉環從由噪聲碼本A生成的噪聲碼矢量與噪聲碼本B生成的噪聲碼矢量中選擇使式(2)的編碼失真最小的噪聲碼矢量,因此可以生成更接近原聲的聲源矢量,同時可以得到高音質的合成話音。
在本實施形態中,示出以作為已有的CELP型聲音編碼裝置的圖2所示結構為基礎的聲音編碼/解碼裝置,但是,在以圖19A、B或圖20的結構為基礎的CELP型聲音編碼/解碼裝置中使用本實施形態也能夠得到同樣的效果。
在本實施形態中,對噪聲碼本A211的固定波形存儲單元A181存儲3個固定波形的情況進行了說明,但是,在固定波形存儲單元A181具有其他數目的固定波形的情況下(例如有4個固定波形的情況等)也能得到同樣的作用與效果。對於噪聲碼本B230也相同。
又,在本實施形態中,對噪聲碼本A211的固定波形配置單元A182具有表8所示的固定波形起始端候補位置信息的情況作了說明,但是,具有其他固定波形起始端候補位置信息時也能夠得到同樣的作用與效果。對於噪聲碼本B230也相同。
還有,本實施形態對具有2種噪聲碼本的CELP型聲音編碼/解碼裝置進行了說明,但是採用有3種以上噪聲碼本的CELP型聲音編碼/解碼裝置時,也能得到相同的作用與效果。
實施形態16圖24表示本實施形態的CELP型聲音編碼裝置的功能方框圖。該聲音編碼裝置在LPC分析單元242對輸入的聲音數據241進行自相關分析與LPC分析,以此得到LPC係數,又對所得到的LPC係數進行編碼,得到LPC代碼,又將得到的LPC代碼加以編碼,得到解碼LPC係數。
接著,在聲源生成單元245,從自適應碼本243與聲源矢量生成裝置244取出自適應碼矢量與噪聲碼矢量,分別送往LPC合成單元246。聲源矢量生成裝置244使用上述實施形態1~4、10中的任一個聲源矢量生成裝置。並且,在LPC合成單元246,根據LPC分析單元242得到的解碼LPC係數對聲源生成單元245得到的2個聲源進行濾波,從而得到兩個合成話音。
還在比較單元247分析在LPC合成單元246得到的2種合成話音與輸入的聲音的關係,求兩種合成話音的最佳值(最佳增益),把根據該最佳增益進行過功率調整的各合成話音相加,得到總合成話音,計算該總合成話音與輸入的聲音的距離。
又,對自適應碼本243與聲源矢量生成裝置244產生的全部聲源樣本,計算由於使聲源生成單元245、LPC合成單元246起作用而得到的多個合成話音與輸入的聲音的距離,求得在該結果所得到的距離中為最小的時候的聲源樣本的標號,再把與該標號對應的兩個聲源傳送到參數編碼單元248。
參數編碼單元248進行最佳增益的編碼,得到增益代碼,將LPC代碼、聲源樣本標號匯集在一起傳送到傳輸路徑249。又根據增益代碼和對應於標號的兩個聲源生成實際聲源信號,將其存儲於自適應碼本243,同時廢棄舊聲源樣本。
圖25是與參數編碼單元248中增益矢量量化有關的部分的功能方框圖。
參數編碼單元248具備變換為輸入最佳增益2501的組成部分的和以及對該和的比率求量化對象矢量的參數變換單元2502、用解碼矢量存儲單元存儲的過去已解碼代碼矢量和預測係數存儲單元存儲的預測係數求目標矢量的目標提取單元2503,存儲過去已解碼代碼矢量的解碼矢量存儲單元2504、存儲預測係數的預測係數存儲單元2505、用預測係數存儲單元存儲的預測係數,計算矢量碼本存儲的多個代碼矢量與目標提取單元得到的目標矢量之間的距離的距離計算單元2506、存儲多個代碼矢量的矢量碼本2507、以及控制矢量碼本與距離計算單元,根據對從距離計算單元得到的距離的比較,求出最佳代碼矢量的編號,並根據求得的編號取出矢量存儲單元存儲的代碼矢量,用該代碼矢量更新解碼矢量存儲單元的內容的比較單元2508。
下面對具有如上所述結構的參數編碼單元248的動作做詳細說明。預先生成存儲多個量化對象矢量的代表性樣本(代碼矢量)的矢量碼本2507、這通常以分析多個聲音數據得到的多個矢量為基礎,用LBG算法(IEEE TRANSACTIONSON COMMUNICATIONS,VOL.COM-28,NO.1,ppg4-95,JANUARY1980)生成。
又,在預測係數存儲單元2505存儲著用於進行預測編碼的係數。關於該預測係數的算法將在後面進行說明。又在解碼矢量存儲單元2504中預先存儲表示清音狀態的數值作為初始值。例如功率最小的代碼矢量。
首先,在參數變換單元2502將輸入的最佳增益2501(自適應聲源的增益與噪聲聲源的增益)變換成和與比率的要素的矢量(輸入)。變換方法示於式(40)P=log(Ga+Gs)R=Ga/(Ga+Gs)……(40)(Ga+Gs)最佳增益Ga自適應聲源增益Gs隨機聲源增益(P,R)輸入矢量P和R比率上述各量中,Ga不必一定是正值,因而R也有負值的情況。而且,在Ga+Gs為負值的情況下代入預先準備的固定值。
接著,在目標提取單元2503以在參數變換單元2052得到的矢量為基礎,利用解碼矢量存儲單元2504存儲的過去的解碼矢量和預測係數存儲單元2505存儲的預測係數,得到目標矢量。將目標矢量的計算式示於式(41)Tp=P-(i=1lUpipi+i=1lVpiri)]]>Tr=R-(j=1lUripi+j=1lVriri)----(41)]]>(Tp,Tr)目標矢量(P,R)輸入矢量(pi,ri)過去的解碼矢量Upi,Vpi,Uri,Vri預測係數(固定值)i前面第幾個解碼矢量的標號l預測次數接著在距離計算單元2506用預測係數存儲單元2505存儲的預測係數計算在目標提取單元2503得到的目標矢量與矢量碼本2507存儲的代碼矢量的距離。
距離的計算式示於式(42)
Dn=Wp×(Tp-UpO×Cpn-VpO×Crn)2+Wr×(Tr-UpO×Cpn-VrO×Crn)2(42)Dn目標矢量與代碼矢量的距離(Tp,Tr)目標矢量UpO,VpO,UrO,VrO預測係數(固定值)(Cpn,Crn)代碼矢量n代碼矢量的編號Wp,Wr調節對失真的靈敏度的加權係數(固定)接著,比較單元2508控制矢量碼本2507與距離計算單元2506,在矢量碼本2507中存儲的多個代碼矢量中求距離計算單元2506計算出的距離為最小的代碼矢量的編號,以此作為增益的代碼2509。又以得到的增益代碼2509為基礎求解碼矢量,並利用該矢量更新解碼矢量存儲單元2504的內容。求解碼矢量的方法示於式(43)p=(i=1lUpipi+i=1lVpiri)+UpOCpnVpOCrn]]>R=(i=1lUripi+i=1lVriri)+UrOCp+VrOCrn---(43)]]>(Cpn,Crn)代碼矢量(p,r)解碼矢量(pi,ri)過去的解碼矢量Upi,Vpi,Uri,Vri預測係數(固定值)i前面第幾個解碼矢量的標號l預測次數n代碼矢量的編號又,進行更新的方法示於式(44)。
處理的順序pO=CpNrO=CrNpi=pi-1(i=1~1)ri=ri-1(i=1~1)(44)
N增益的代碼另一方面,解碼裝置(解碼器)備有與編碼裝置相同的矢量碼本、預測係數存儲單元以及解碼矢量存儲單元,根據編碼裝置傳送來的增益的代碼,藉助於編碼裝置中比較單元的編碼矢量生成功能和解碼矢量存儲單元的更新功能進行解碼。
這裡對預測係數存儲單元2505存儲的預測係數的設定方法加以說明。
首先對許多學習用的聲音數據進行量化,收集從其最佳增益求出的輸入矢量和量化時的解碼矢量編成組,然後通過使下面的式(45)所示的總失真最小,對該組求預測係數。具體地說,以各Upi、Uri對總失真式進行偏微分,解所得到的聯立方程,從而求出Upi、Uri的值。
Total=i=0T{Wp(pt-i=0lUpipt,i)2+]]>Wr(Rt-i=0lUrirt,i)2}]]>pt,O=Cp]]>rp,O=Crn-------(45)]]>Total總失真t時間(幀編號)T矢量組的數據數目(Pt,Rt)時間t中的最佳增益(pti,rt,i)時間t中的解碼矢量Upi、Vpi、Uri、Vri預測係數(固定值)i表示前面第幾個解碼矢量的標號l預測次數(Cpn(t),Crn(t)時間t中的代碼矢量Wp,Wr調節對失真的靈敏度的權重係數(固定)採取這樣的矢量量化方法,可以把最佳增益原樣矢量量化,能藉助於參數變換單元的特徵,利用功率與各增益的相對大小的相關性,因而可實現藉助於解碼矢量存儲單元、預測係數存儲單元、目標提取單元及距離計算單元的特徵,利用功率與2個增益的相對關係間的相關性的增益預測編碼,並且藉助於這些特徵,可以充分利用參數之間的相關性。
實施形態17圖26是表示本實施形態的聲音編碼裝置的參數編碼單元的功能的方框圖。在本實施形態中,一邊根據與聲源的標號對應的兩個合成話音和聽覺加權輸入聲音估算增益量化引起的失真,一邊進行矢量量化。
如圖26所示,該參數編碼單元具備根據輸入的聽覺輸入聲音、聽覺加權LPC合成自適應聲源、作為聽覺加權LPC合成噪聲聲源2601的輸入數據、解碼矢量存儲單元存儲的解碼矢量,以及預測係數存儲單元儲存的預測係數計算進行距離計算所需的參數的參數計算單元2602、存儲過去解碼的代碼矢量的解碼矢量存儲單元2603、存儲預測係數的預測係數存儲單元2604、使用存儲於預測係數存儲單元的預測係數,計算以矢量碼本中存儲的多個代碼矢量解碼時的編碼失真的距離計算單元2605、存儲多個代碼矢量的矢量碼本2606,以及控制矢量碼本和距離計算單元,根據從距離計算單元得到的編碼失真的比較,求出最佳代碼矢量的編號,並根據求得的編號取出矢量存儲單元所存的代碼矢量,用該代碼矢量更新解碼矢量存儲單元的內容的比較單元2607。
下面對具有如上所述結構的參數編碼單元的矢量量化動作加以說明。預先生成存儲多個量化對象矢量的代表性樣本(代碼矢量)的矢量碼本2606。通常是根據LBG算法(IEEE TRANSACTIONS ON COMMUNICATIONS,VOL.COM-28,NO.1,PP84-95,JANUARY 1980)等生成的。又在預測係數存儲單元2604預先存儲用於進行預測編碼的係數。該係數使用與實施形態16中說明的預測係數存儲單元2505存儲的預測係數相同的係數。又在解碼矢量存儲單元2603存儲表示清音狀態的數值作為初始值。
首先,在參數計算單元2602,根據聽覺加權輸入聲音、聽覺加權LPC合成自適應聲源、聽覺加權LPC合成噪聲聲源2601,以及解碼矢量存儲單元2603存儲的解碼矢量、預測係數存儲單元2604存儲的預測係數,對距離計算所需的參數進行計算。距離算計單元的距離根據下式(46)計算
En=i=0I(Xi-GanAi-GsnSi)2]]>Gan=Ornep(Opn)]]>Gsn=(1-Orn)ep(Opn)]]>Opn=Yp+UpOCpn+VpOCrn]]>Yp=j=1JUpjpj+j=1JVpjrj]]>Yr=j=1JUrjpj+j=1JVrjrj---(46)]]>Gan,Gsn解碼增益(Opn,Orn)解碼矢量(Yp,Yr)預測矢量En使用第n號增益代碼矢量時的編碼失真Xi聽覺加權輸入聲音Ai聽覺加權LPC合成自適應聲源Si聽覺加權LPC合成隨機聲源n代碼矢量的編號i聲源數據標號I子幀長度(輸入聲音的編碼單位)(Cpn,Crn)代碼矢量(pj,rj)過去的解碼矢量Upj,Vpj,Urj,Vrj預測係數(固定值)j表示前面第幾個解碼矢量的標號J預測次數因而,在參數計算單元2602對與代碼矢量的編號無關的部分進行計算。預先計算的是上述預測矢量和3個合成話音之間的相關性及功率。計算式示於式(47)
Yp=j=1JUpjpj+j=1JVpjrj]]>Yr=j=1JUrjpj+j=1JVrjrj]]>Dxx=i=0IXiXi]]>Dxa=i=0IXiAi2]]>Dxs=i=0IXiSi2]]>Daa=i=0IAiAi]]>Das=i=0IAiSi2]]>Dss=i=0ISiSi----(47)]]>(Yp,Yr)預測矢量Dxx,Dxa,Dxs,Daa,Das,Dss合成話音間的相關值、功率Xi聽覺加權輸入聲音Ai聽覺加權LPC合成自適應聲源Si聽覺加權LPC合成隨機聲源i聲源數據標號I子幀長度(輸入聲音的編碼單位)(pj,rj)過去的解碼矢量Upj,Vpj,Urj,Vrj預測係數(固定值)j表示前面第幾個解碼矢量的標號J預測次數接著,在距離計算單元2605,根據參數運算單元2602計算的各參數、預測係數存儲單元2604存儲的預測係數、矢量碼本2606存儲的代碼矢量算出編碼失真。計算式示於式(48)
En=Dxx+(Gan)2×Daa+(Gsn)2×Dss-Gan×Dxa-Gsn×Dxs+Gan×Gsn×DasGan=Orn×exp(Opn)Gsn=(1-Orn)×exp(Opn)Opn=Yp+UpO×Cpn+VpO×CrnOrn=Yr+UrO×Cpn+VrO×Crn(48)En使用第n號增益代碼矢量時的編號失真Dxx,Dxa,Dxs,Daa,Das,Dss合成話音間的相關值、功率Gan,Gsn解碼增益(Opn,Orn)解碼矢量(Yp,Yr)預測矢量UpO,VpO,UrO,VrO預測係數(固定值)(Cpn,Crn)代碼矢量n代碼矢量的編號還有,實際上Dxx與代碼矢量的編號n無關,因此可以省略其加法運算。
接著,比較單元2607對矢量碼本2606和距離運算單元2605進行控制,在矢量碼本2606存儲的多個代碼矢量中,求距離運算單元2605計算出的距離達到最小的代碼矢量的編號,以此作為增益的代碼2608。又以得到的增益代碼2608為基礎求解碼矢量,用它來更新解碼矢量存儲單元2603的內容。解碼矢量根據式(43)求得。
又,使用更新方法式(44)。
另一方面,聲音解碼裝置預先備有與聲音編碼裝置相同的矢量碼本、預測係數存儲單元、解碼矢量存儲單元,根據從編碼器傳送來的增益代碼,利用編碼器比較單元生成解碼矢量的功能和解碼矢量存儲單元的更新功能進行解碼。
採用具有這樣的結構的實施例形態,可以一邊根據與聲源的標號對應的兩種合成話音和輸入聲音估算增益量化引起的失真,一邊進行矢量量化,藉助於參數變換單元的特徵,利用功率與各增益的相對大小的相關性,因而能實現藉助於解碼矢量存儲單元、預測係數存儲單元、目標提取單元、距離計算單元的特徵,利用功率與2個增益的相對關係之間的相關性的增益預測編碼,以此可以充分利用參數之間的相關性。
實施形態18圖27是本實施形態的降噪裝置的主要功能方框圖。該降噪裝置裝備於上述聲音編碼裝置。例如,在圖13所示的聲音編碼裝置中設置在緩衝器1301的前級。
圖27所示的降噪裝置具備A/D變換器272、降噪係數存儲單元273、降噪係數調整單元274、輸入波形設定單元275、LPC分析單元276、傅利葉變換單元277、降噪/頻譜補償單元278、頻譜穩定單元279、反傅利葉變換單元280、頻譜增強單元281、波形匹配單元282、噪聲推定單元284、噪聲頻譜存儲單元285、前頻譜存儲單元286、隨機相位存儲單元287、前波形存儲單元288、最大功率存儲單元289。
首先對初始設定加以說明。表10表示固定參數的名稱和設定例。
表10


又,隨機相位存儲單元287預先存儲用於調整相位的相位數據。這些數據在頻譜穩定化單元279用於使相位轉動。相位數據有8種的例子示於表11。
表11

以使用上述相位數據為目的的計數器(隨機相位計數器)也在隨機相位存儲單元287存儲著。該數值預先初始化為0存儲著。
接著,設定靜態的RAM區域。亦即對降噪係數存儲單元273、噪聲頻譜存儲單元285、前頻譜存儲單元286、前波形存儲單元288、最大功率存儲單元289清零。下面敘述對各存儲單元的說明和設定例。
降噪係數存儲單元273是存儲降噪係數的區域,作為初始值存儲著20.0。噪聲頻譜存儲單元285是對各頻率存儲表示平均噪聲功率、平均噪聲頻率,以及1級候補的補償用噪聲頻譜與2級候補的補償用噪聲頻譜各自的頻譜值在幾幀以前有過變化的幀數(持續數)的區域,而且作為初始值對平均噪聲功率存儲足夠大的值,對平均噪聲頻譜存儲指定的最小功率,對補償用噪聲頻譜和持續數分別存儲足夠大的數。
前頻譜存儲單元286是存儲補償用噪聲功率、以前的幀的功率(全頻帶、中頻帶)(前幀功率)、以前的幀的平滑功率(全頻帶、中頻帶)(前幀平滑功率),以及噪聲持續數的區域,作為補償用噪聲功率,存儲足夠大的值,作為前幀功率、全幀平滑功率都存儲0.0,而作為噪聲持續數存儲噪聲基準持續數。
前波形存儲單元288是存儲用於使輸出信號匹配的先前幀輸出信號末尾首讀數據長度份額的數據的區域,作為初始值全部存儲0。頻譜增強單元281進行ARMA及高頻增強濾波,而且將以此為目的的各濾波器的狀態都清0。最大功率存儲單元289是存儲輸入的信號的功率的最大值的區域,作為最大功率存儲0。
下面用圖27在每個方框圖中對降噪算法加以說明。
首先,用A/D變換器272對含有聲音的模擬輸入信號進行A/D變換,輸入1幀長度+首讀數據長度(上述設定例中為160+80=240點)份額。降噪係數調節單元274根據降噪係數存儲單元273存儲的降噪係數、指定降噪係數、降噪係數學習係數及補償功率上升係數,利用式(49)計算出降噪係數及補償係數。然後,將得到的降噪係數存儲於降噪係數存儲單元273,同時將A/D變換器272得到的輸入信號傳送到輸入波形設定單元275,再將補償係數與降噪係數傳送到噪聲推定單元284與降噪頻譜補償單元278。
q=q*C+Q*(1-C)r=Q/q*D ……(49)q降噪係數Q指定的降噪係數C降噪係數學習係數r補償係數D補償功率上升係數還有,降噪係數是表示噪聲降低的比例的係數,指定降噪係數是指預先指定的固定降噪係數、降噪係數學習係數是表示降噪係數接近指定降噪係數的比例的係數,補償係數是調節頻譜補償的補償功率的係數,補償功率上升係數是調節補償係數的係數。
在輸入波形設定單元275,為了能夠進行FFT(快速傅利葉變換),將來自A/D變換器272的輸入信號從後面開始寫入具有2的乘方的長度的存儲器陣列。前面的部分填上0。在上述設定例中,在長度為256的陣列中0~15寫入0,16~255寫入輸入信號。這一數組在進行8階快速傅利葉變換(FFT)時用作實數部分。又,虛數部分準備與實數部分相同長度的陣列,全部寫著0。
在LPC分析單元276,對輸入波形設定單元275設定的實數區域加上漢明窗,並對加漢明窗後的波形進行自相關分析,求自相關函數,進行基於自相關法的LPC分析,得到線性預測係數。再把得到的線性預測係數傳送到頻譜增強單元281。
傅利葉變換單元277有在輸入波形設定單元275得到的實數部分、虛數部分的存儲器陣列進行採用高速傅利葉變換的離散傅利葉變換。計算得到的複數頻譜的實數部分與虛數部分的絕對值之和,以此求輸入信號的模擬振幅頻譜(下稱輸入頻譜)。又求出各頻率的輸入頻譜值的總和(下稱輸入功率),傳送到噪聲推定單元284。又將複數頻譜本身傳送到頻譜穩定單元279。
下面對噪聲推定單元284的處理加以說明。
噪聲推定單元284將傅利葉變換單元277得到的輸入功率與最大功率存儲單元289存儲的最大功率數值加以比較,在最大功率較小的情況下,以輸入功率數值作為最大功率數值,將該數值存儲於最大功率存儲單元289,然後,在符合下面三個條件中的至少一個時進行噪聲推定,在完全不滿足時不進行噪聲推定。
(1)輸入功率比最大功率乘以無聲檢測係數的積小。
(2)降噪係數比指定降噪係數加0.2的和大。
(3)輸入比從噪聲頻譜存儲單元285得到的平均噪聲功率乘以1.6的積小。
這裡地噪聲推定單元284的噪聲推定算法加以敘述。
首先,對噪聲頻譜存儲單元285存儲的1級候補、2級候補的全部頻率的持續數進行更新(加1)。然後,調查1級候補的各頻率的持續數,在比預先設定的噪聲頻譜基準持續數大時,以2級候補的補償用頻譜與持續數作為1級候補,以2級候補的補償用頻譜作為3級候補的補償用頻譜,取持續數為0。但是,在調換該2級候補的補償用頻譜時不存儲3級候補,而以2級候補經若干放大代用,以此可以節省存儲器。在本實施形態中,以2級候補的補償用頻譜放大1.4倍代用。
在持續數更新後,對各頻率進行補償用噪聲頻譜與輸入頻譜的比較。首先,將各頻率的輸入頻譜與1級候補的補償用噪聲頻譜用比較,如果輸入頻譜較小,就取1級候補的補償用噪聲頻譜與持續數為2級候補,以輸入頻譜作為1級候補的補償用頻譜,並將1級候補的持續數取0。在上述條件以外的情況下,進行輸入頻譜與2級候補的補償用噪聲譜的比較,如果是輸入頻譜較小,取輸入頻譜為2級候補的補償用頻譜,並將2級候補的持續數取0。然後,將得到的1、2級候補的補償用頻率與持續數存儲於補償用噪聲頻譜存儲單元285。同時,對平均噪聲頻譜也按照下面的式(50)進行更新。
si=si*g+Si*(1-g)……(50)s平均噪聲頻譜 S輸入頻譜g0.9(輸入功率比平均噪聲功率的一半大的情況下)0.5(輸入功率比平均噪聲功率的一半小的情況下)i頻率編號還有,平均噪聲頻譜是用模擬的方式求得的平均噪聲頻譜,式(50)中的係數g是調節平均噪聲頻譜學習的快慢的係數。亦即,是具有在輸入功率與噪聲功率相比較小的情況下,判斷為是只有噪聲的區間的可能性大,提高學習速度,在並非較小的情況下判斷為有可能是在聲音區間中,降低學習速度的效果的係數。
然後,求平均噪聲頻譜各頻率值的總和,以此作為平均噪聲功率。補償用噪聲譜、平均噪聲譜、平均噪聲功率存儲於噪聲頻譜存儲單元285。
又,在上述噪聲推定處理中,如果使1個頻率的噪聲頻譜與多個頻率的輸入頻譜對應,則可以節省構成噪聲頻譜存儲單元285用的RAM容量。下面舉出使用本實施形態的256點的FFT的情況下,根據4個頻率的輸入頻譜推定1個頻率的噪聲頻譜時的、噪聲頻譜存儲單元285的RAM容量為例。考慮(模擬)振幅頻譜以頻率軸左右對稱,在所有頻率進行推定的情況下,由於存儲128個頻率的頻譜和持續數,需要128(頻率)×2(頻譜與持續數)×3(補償用的1、2級候補、平均),即共計768W的RAM容量。
與此相反,在使1個頻率的噪聲頻譜與4個頻率的輸入頻譜對應的情況下,需要32(頻率)×2(頻譜與持續數)×3(補償用的1、2級候補、平均),即共計192W的RAM容量即可。實驗證實,雖然在這種情況下,噪聲頻譜頻率的解析度降低,但是在上述1對4的情況下性能幾乎沒有變壞。而且由於這一做法不是以1個頻率的頻譜推定噪聲頻譜,在穩態聲(正弦波、元音等)長時間持續的情況下,也有防止把這種頻譜錯誤推定為噪聲頻譜的效果。
下面對降噪/頻譜補償單元276進行的處理加以說明。
從輸入的頻譜中減去噪聲頻譜存儲單元285存儲的平均噪聲頻譜與降噪係數調節單元274得到的降噪係數的乘積(以下稱差頻譜)。在節約上述噪聲推定單元284的說明中所示的、噪聲頻譜存儲單元285的RAM容量的情況下,減去與輸入頻譜對應的頻率的平均噪聲頻譜與降噪係數的乘積。然後,在差額譜為負的情況下,將噪聲頻譜存儲單元285存儲的補償用噪聲頻譜的1級候補與降噪係數調節單元274求出的補償係數的乘積代入以進行補償。這一點對所有頻率進行。又,對每一頻率生成標誌數據,以便判明補償差頻譜的頻率。例如,每一頻率有一個區域,在不補償時代入0,在補償時代入1。這一標誌數據與差頻譜一起被送到頻譜穩定單元279。又,調查標誌數據的值以求出補償的總數(補償數),也將其送往頻譜穩定單元279。
接著,對頻譜穩定單元279的處理加以說明。這一處理主要是為了起減小對不含聲音的區間的異常感覺的作用。
首先,計算降噪/頻譜補償單元278得到的各頻率的差頻譜之和求當前幀的功率。當前幀功率求全頻帶與中頻帶兩種。全頻帶是對全部頻率(所謂全頻帶,在本實施形態是0~128)求得的,中頻帶是對聽覺重要的中間附近的頻帶(所謂中頻帶,在本實施形態是16~79)求得的。
同樣,求關於噪聲頻譜存儲單元285存儲的補償用噪聲頻譜的1級候補的和,以此作為當前幀噪聲功率(全頻帶、中頻帶)。在這裡,調查降噪/頻譜補償單元278得到的補償數值,在足夠大的情況下,並且又是滿足下述3個條件中的至少1個的情況下,判斷當前幀是只有噪聲的區間,進行頻譜的穩定處理。
(1)輸入功率比最大功率乘以無聲檢測係數的積小。
(2)當前幀功率(中頻帶)比當前幀噪聲功率(中頻帶)乘以5.0的積小。
(3)輸入功率比噪聲基準功率小。
不進行穩定處理時,前頻譜存儲單元286存儲的噪聲持續數為正時減小,又以當前幀噪聲功率(全頻帶、中頻帶)為前幀功率(全頻帶、中頻帶),分別存儲於前頻譜存儲單元286,並進入相位擴散處理。
在這裡對頻譜穩定處理加以說明。這一處理的目的是實現無聲區間(沒有聲音只有噪聲的區間)的頻譜的穩定和減小功率。處理有兩種,在噪聲持續數比噪聲基準持續數小的情況下實施處理1,在前者超過後者的情況下實施處理2。下面對兩種處理進行說明。
處理1對前頻譜存儲單元286存儲的噪聲持續數加1,又將當前幀噪聲功率(全這、中頻帶)當作前幀功率(全頻帶、中頻帶),分別存儲於前頻譜存儲單元286,並進入相位調整處理。
處理2參照前頻譜存儲單元286存儲的前幀功率、前幀平滑功率、還有作為固定係數的無聲功率降低係數,按照式(51)分別使其變更。
Dd80=Dd80*0.8+A80*0.2*PD80=D80*0.5+Dd80*0.5Dd129=Dd129*0.8+A129*0.2*P (51)D129=D129*0.5+Dd129*0.5Dd80前幀平滑功率(中頻帶)D80前幀功率(中頻帶)Dd129前幀平滑功率(全頻帶)D129前幀功率(全頻帶)A80當前幀噪聲功率(中頻帶)A129當前幀噪聲功率(全頻帶)接著,使這些功率反映於差頻譜中。為此,計算中頻帶所乘的係數(以下稱係數1)與全頻帶所乘的係數(以下稱係數2)等兩個係數。首先,以下式(式(52))計算係數1。
r1=D80/A80(A80>0時)1.0 (A80≤0時) (52)r1係數1D80前幀功率(中頻帶)A80當前幀噪聲功率(中頻帶)係數2受係數1的影響,因此,求取的手段有些複雜。其步驟如下。
(1)在前幀平滑功率(全頻帶)比前幀功率(中頻帶)小的情況下,或當前幀噪聲功率(全頻帶)比當前幀噪聲功率(中頻帶)小的情況下,轉入步驟(2),其他情況下轉入步驟(3)。
(2)係數2取0.0,以前幀功率(全頻帶)作為前幀功率(中頻帶),轉入步驟(6)。
(3)在當前幀噪聲功率(全頻帶)與當前幀噪聲功率(中頻帶)相等時轉入步驟(4),在不相等時轉入(5)。
(4)係數取1.0,並轉入(6)。
(5)利用下述式(53)求係數2,並轉入(6)。
r2=(D129-D80)/(A129-A80) (53)r2係數2D129前幀功率(全頻帶)D80前幀功率(中頻帶)A129當前幀噪聲功率(全頻帶)A80當前幀噪聲功率(中頻帶)(6)係數2計算處理結束。
利用上述算法得到的係數1、2都把上限箝於1.0,把下限箝於無聲功率降低係數。然後,把中頻帶的頻率(本例中為16~79)的差頻譜乘以係數1得到的積作為差頻譜,再把該差頻譜的全頻帶中去除中頻帶後的頻率(本例中為0~15,80~128)的差頻譜乘以係數2得到的積作為差頻譜。與此同時,利用下面的式(54)變換前幀功率(全頻帶、中頻帶)。
D80=A80*r1D129=D80+(A129-A80)*r2 (54)r1係數1r2係數2D80前幀功率(中頻帶)A80當前幀噪聲功率(中頻帶)D129前幀功率(全頻帶)A129當前幀噪聲功率(全頻帶)將這樣得到的各種功率數據全部存儲於前頻譜存儲單元286,結束處理(2)。
根據上述要領在頻譜穩定單元279實現頻譜穩定。
下面對相位調整處理加以說明。在已往的頻譜相減中,相位原則上不變,但是本實施形態中,在該頻率的頻譜在削減時得到補償的情況下,進行隨機修改相位的處理。由於這一處理,餘下的噪聲的隨機性加強,因此有在聽覺上不大會給人以不良印象的效果。
首先,得到隨機相位存儲單元287存儲的隨機相位計數器。然後,參照全部頻率的標誌數據(表示有否補償的數據),正在補償時,利用下面的式(55),使在傅利葉變換單元277得到的複數頻譜的相位旋轉。
Bs=Si*Rc-Ti*Rc+1Bt=Si*Rc+1+Ti*RcSi=Bs (55)Ti=BtSi、Ti複數頻譜、i表示頻率的標號R隨機相位數據、c隨機相位計數器Bs、Bt計算基數寄存器在式(55)中,成對使用兩個隨機相位數據。因而,每進行一次上述處理,使隨機相位計數器增加2,在達到上限(在本實施形態中為16)的情況下取0。還有,隨機相位計數器存儲於隨機相位存儲單元287,所得到的複數頻譜傳送到反傅利葉變換單元280。求出差頻譜的總和(以下稱差頻譜功率),將其傳送到頻率增強單元281。
反傅利葉變換單元280,根據頻譜穩定單元279得到的差頻譜的幅和複數頻譜的相位,構成新的複數頻譜,用FFT進行反傅利葉變換。(把所得到的信號稱為第1次輸出信號)。然後,將所得到的第1次輸出信號傳送到頻譜增強單元281。
下面對頻譜增強單元281的處理加以說明。
首先,參照噪聲頻譜存儲單元285存儲的平均噪聲功率、頻譜穩定單元279得到的差頻譜功率、作為常數的噪聲基準功率,選擇MA增強係數與AR增強係數。選擇根據對下述兩個條件進行的評價進行。
條件1差頻譜功率比噪聲頻譜存儲單元285存儲的平均噪聲功率乘以0.6得到的積大,並且平均噪聲功率比噪聲基準功率大。
條件2
差頻譜功率比平均噪聲功率大。
滿足條件(1)時,以此作為「濁音區間」,取MA增強係數為MA增強係數1-1,取AR增強係數為AR增強係數1-1,取高頻增強係數為高頻增強係數1。而在不滿足條件(1),而滿足條件(2)的情況下,將其當作「清音區間」,取MA增強係數為MA增強係數1-0,取AR增強係數為AR增強係數1-0,取高頻增強係數為0。又,在不滿足條件(1),又不滿足條件(2)的情況下,以此作為「無聲區間(只有噪聲的區間)」,取MA增強係數為MA增強係數0,取AR增強係數為AR增強係數0,取高頻增強係數為高頻增強係數0。
然後,使用LPC分析單元276得到的線性預測係數、上述MA增強係數、AR增強係數,根據下述式(56),計算出極點增強濾波器的MA係數與AR係數。
α(ma)i=αi*βiα(ar)i=αi*γi(56)α(ma)iMA係數α(ar)iAR係數αi線性預測係數βMA增強係數γAR增強係數i編號然後,對在反傅利葉變換單元280得到的第1次輸出信號,用上述MA係數與AR係數乘極點增強濾波器。此濾波器的傳遞函數示於下面的式(57)。
1+(ma)1Z-1+(ma)2Z-2++(ma)jZ-j1+(ar)1Z-1+(ar)2Z-2++(ar)jZ-j---(57)]]>α(ma)iMA係數α(ar)iAR係數j次數進而,為了增強高頻成分,用上述高頻增強係數乘高頻增強濾波器。此濾波器的傳遞函數示於下述式(58)。
1-δZ-1……(58)δ為高頻增強係數上述處理得到的信號稱為第2次輸出信號。還有,濾波器的狀態保持於頻譜增強單元281的內部。
最後,在波形匹配單元282,利用三角窗使頻譜增強單元281得到的第2次輸出信號和前波形存儲單元288存儲的信號重迭,得到輸出信號。還把該輸出信號的末尾首讀數據長度份額的數據存儲於前波形存儲單元288。這時的匹配方法示於下面的式(59)。
Oj=(j×Dj+(L-j)×Zj)/L (j=0~L-1)Oj=Dj(j=L~L÷M-1)Zj=OM+1(j=0~L-1)(59)Oj輸出信號Dj第2次輸出信號Zj輸出信號L首讀數據長度M幀長度這裡需要注意的是,作為輸出信號,輸出首讀數據長度+幀長度份額的數據,但是,其中能夠作為信號處理的只有從數據的始端起,長度等於幀長度的區間。這是因為,後面的首讀數據長度的數據在輸出下一輸出信號時被改寫。但是,在輸出信號的全部區間內連續性受到補償,因此能夠使用於LPC分析和濾波器分析等頻率分析中。
採用這樣的實施形態,在聲音區間中和聲音區間外都能夠進行噪聲頻譜推定,即使是在搞不清楚聲音在哪一個時間存在於全部數據的情況下,也能夠推定噪聲頻譜。
此外,可以用線性預測係數增強輸入的頻譜包絡的特徵,即使是在噪聲電平高的情況下也能防止音質劣化。
還可以從平均和最低兩個方向推定噪聲的頻譜,因而能夠進行更恰當的降噪處理。
又,將噪聲的平均頻譜用於降噪處理,可以在更大程度上削減噪聲頻譜,還可以另外推定補償用頻譜,以更恰當地進行補償。
而且,可以使不含聲音、只有噪聲的區間的頻譜平滑,因而能夠防止同區間的頻譜由於噪聲的減小而由極端的頻譜變動引起異常感覺。
還可以使補償的頻率成分具有隨機性,將不削去而留下的噪聲變換成聽覺上異常感覺小的噪聲。
又,在聲音區間,可以實施在聽覺上更恰當的加權,在無聲音的區間和清輔音區間,可以抑制由聽覺加權引起的異常感覺。
工業應用性如上所述,本發明的聲源矢量生成裝置,聲音編碼裝置和聲音解碼裝置對於聲源矢量檢索是有用的,適合於提高音質。
權利要求
1.一種從輸入聲音信號中去除噪聲成分的噪聲消除器,其特徵在於,所述噪聲消除器包括將所述輸入聲音信號變換成數位訊號的A/D變換裝置;調節決定噪聲降低量的降噪係數的降噪係數調節裝置;對由所述A/D變換裝置得到的一定時間長度的數位訊號,進行線性預測分析的LPC分析裝置;對於由所述A/D變換裝置得到的一定時間長度的數位訊號,進行離散傅立葉變換,以得到輸入頻譜和複數頻譜的傅立葉變換裝置;存儲推定的噪聲頻譜的噪聲頻譜儲存裝置;藉助於比較由所述傅立葉變換裝置得到的輸入頻譜和存儲在所述噪聲頻譜存儲裝置中的噪聲頻譜,推定噪聲頻譜,並將得到的噪聲頻譜存儲在所述噪聲頻譜存儲裝置中的噪聲推定裝置;根據利用所述降噪係數調節裝置得到的係數,從利用所述傅立葉變換裝置得到的輸入頻譜減去存儲在所述噪聲頻譜儲存裝置中的噪聲頻譜,並且核對得到的頻譜,對過分降低的頻率的頻譜進行補償的降噪/頻譜補償裝置;對由所述降噪/頻譜補償裝置得到的頻譜,進行穩定處理,同時對由所述傅立葉變換裝置得到的複數頻譜的相位中,在所述降噪/頻譜補償裝置補償的頻率的相位,進行調整的頻譜穩定裝置;根據由所述頻譜穩定裝置作穩定處理的頻譜和調整的相位頻譜,進行反傅立葉變換的反傅立葉變換裝置;對由反傅立葉變換裝置得到的信號,進行頻譜增強的頻譜增強裝置;和使由所述頻譜增強裝置得到的信號與前一幀信號匹配的波形匹配裝置。
2.如權利要求1所述的噪聲消除器,其特徵在於,所述噪聲推定裝置包括預先進行是否噪聲區間的判定的裝置;在判定是噪聲區間的場合,在每個頻率將由所述傅立葉變換裝置得到的輸入頻譜與補償用噪聲頻譜進行比較的裝置;在輸入頻譜比補償用噪聲頻譜小的場合,藉助於將關聯頻率的補償用噪聲頻譜作為輸入頻譜,推定補償用噪聲頻譜的裝置;在輸入頻譜比補償用噪聲頻譜小的場合,藉助於將關聯頻率的補償用噪聲頻譜作為輸入頻譜並用一定的比例對該輸入頻譜進行加法運算,推定平均噪聲頻譜的裝置;將所述補償用噪聲頻譜和所述平均噪聲頻譜存儲在噪聲頻譜儲存裝置中的裝置。
3.如權利要求1所述的噪聲消除器,其特徵在於,所述降噪/頻譜補償裝置將存儲在所述噪聲頻譜儲存裝置中的平均噪聲頻譜乘以用所述降噪係數調節裝置得到的降噪係數,再從用所述傅立葉變換裝置得到的輸入頻譜中減去,對成為負的頻譜值的頻率,利用存儲在所述噪聲頻譜儲存裝置中的補償用噪聲頻譜進行補償。
4.如權利要求1所述的噪聲消除器,其特徵在於,所述頻譜穩定裝置核對用所述降噪/頻譜補償裝置進行降噪和頻譜補償的頻譜的全頻帶功率和聽覺重要的一部分的局部頻帶的功率,判別輸入的信號是不是無聲音區間,在判斷是無聲音區間的場合,對全頻帶功率和中頻帶功率進行穩定處理和功率減小處理。
5.如權利要求1所述的噪聲消除器,其特徵在於,所述頻譜穩定裝置對用所述博裡葉變換得到的複數頻譜,根據是否受到所述降噪/頻譜補償裝置的頻譜補償的信息,進行隨機相位旋轉。
6.如權利要求1所述的噪聲消除器,其特徵在於,所述頻譜增強裝置預先準備多個在增強頻譜中用的加權係數的組,在降噪時,對應於輸入的信號的狀態選擇加權係數的組,並用被選擇的加權係數進行頻譜增強。
全文摘要
本發明揭示一種聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置。將以往的CELP型聲音編碼/解碼裝置的噪聲向量讀出單元和噪聲碼本,分別置換為根據輸入振種的值輸出不同矢量系列的振蕩器和存儲多個振種(產生振蕩器振蕩的「種子」)的振種存儲單元。由此,不必將固定矢量原樣地存儲在固定碼本(ROM)中,能大幅度地減小存儲器容量。
文檔編號G10L21/00GK1495706SQ0316035
公開日2004年5月12日 申請日期1997年11月6日 優先權日1996年11月7日
發明者安永和敏, 幸, 森井利幸, 助, 渡邊泰助, 江原宏幸 申請人:松下電器產業株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀