改善話音信號編碼器性能的方法
2023-09-20 05:41:55
專利名稱:改善話音信號編碼器性能的方法
技術領域:
本發明涉及改善話音信號編碼器性能的方法,特別涉及用於改善代碼激勵的線性預測(CELP)話音信號編碼器性能的新代碼本搜索方法。
話音信號編碼器通過發送殘留信號而不發送所有輸入話音信號來減少數據量,該殘留信號對應於由前一信息的預測信號與原始輸入信號之間的差值。
在30ms和40ms之間的時間軸n期間的輸入話音信號s(n)能夠利用包括s(n-1),s(n-2),…的前面的話音信號預測。
由前面的話音信號預測的話音信號根據下式1表示s′(n)=a1s(n-1)+a2s(n-2)+a3s(n-3)+…+a10s(n-10)因此,s′(n)僅僅可通過發送的上述係數而不是發送的所有的話音信號重構。
線性預測係數(LPC)濾波器用於確定上述係數。
LPC濾波器也稱為頻譜濾波器,使用自相關技術確定具有對時間變量n的十階(ten-order)的LPC係數。
但是,通過上述過程預測的s′(n)與原始信號不是完全相同的,而且話音的音調是不可預測的。
執行音調分析可得到對應於話音信號的長期相關的有關音調時間(pitchperiod)的信息。
由於話音的音調時間是變化的並且被作成代碼本,該對應的音調時間可利用索引的發送從該代碼本中找到。
音調濾波器根據發話聲的音調時間從由LPC濾波器濾波的殘留信號中除去相關。
原始的話音可利用最後殘留信號,LPC係數和音調濾波參數重構。
確定LPC係數和音調濾波參數,以便減小使用輸入話音信號的差錯信號。
確定的LPC係數、音調參數和殘留信號必須量化以用於數字傳輸。
根據如何量化殘留信號,話音信號編碼器是有區別的。
CELP話音信號編碼器使用代碼本量化殘留信號。換句話說,CELP話音信號編碼器在準備的代碼本中選擇最接近該殘留信號的信號並且發送該代碼本索引(codebookindex)到接收機。
當接收機使用相同的代碼本時,接收機得到具有發送的索引的殘留信號。
組成該CELP話音信號編碼器,通過兩個時間變化的線性遞歸濾波器如音調濾波器和LPC濾波器選擇信號以便優化通過傳輸存儲在代碼本中的已激勵的輸入信號而得到的信號中給定的保真度。
為了確定兩信號的保真度,逐步比較兩信號的均方誤差。通過使用合成分析,CELP話音信號編碼器取得高質量的話音,對輸入話音信號進行分析並且用確定的參數與合成的信號相比較。
合成分析包括在所有可能的代碼本的每個代碼本上計算合成的話音信號並且最後選擇最接近原始話音信號的合成話音信號。
通常,一個輸入話音信號被分成子幀,每個子幀包括20個樣值(一個樣值等於0.125ms)。每個子幀選擇一個最佳代碼本。
除了選擇合成信號要求的碼字外,從該代碼本中還選擇重構信號要求的量化代碼本增益。
實際上,音調信號通過將由索引選擇的碼字與也由索引選擇的量化代碼本增益相乘得到。
如何找到每個濾波器的功能特性和如何檢索代碼本及代碼本增益,這在如上所述的用於編碼話音信號的話音信號編碼器中是最重要的。
必須在每個話音信號上執行的代碼本增益檢索要求了大量的計算。
圖1是表示根據現有技術的代碼本檢索方法的圖。假定LPC濾波器、音調濾波器和加權濾波器的功能特性在選擇代碼本之前分別被確定為1/A(Z),1/P(Z)和1/W(Z)。
如圖1所述,代碼本檢索方法包括以下步驟從音調濾波器110輸出零輸入響應;由LPC濾波器120接收音調濾波器110的該輸出和預測話音信號;通過加權濾波器130接收一個值,該值是從輸入話音信號中減去由LPC濾波器120預測的話音信號而得到的;由LPC濾波器150從所有代碼本索引和所有量化的增益中接收代碼本的增殖(multiplication of codebook);選擇最佳代碼本和信號的量化增益,由利用最小平均信號誤差選擇器將從加權濾波器130輸出的輸出目標信號1中減去LPC濾波器150的輸出2而獲得信號量化的增益。
首先,音調濾波器110產生零輸入響應,該響應用作給LPC濾波器120的輸入。
在從輸入話音信號中減去LPC濾波器120的輸出信號之後,加權濾波器使用該結果產生目標信號1。然後,LPC濾波器150通過濾波來自代碼本索引的所有可能的代碼本和所有量化的增益產生輸出信號2。
選擇代碼本和量化的增益以使目標信號1和輸出信號2之間的均方誤差最小。
對每個子幀和最佳化的代碼本執行這樣的過程,並且根據子幀內的目標信號1和輸出信號2之間的差執行代碼本增益。
因此,確定一個最佳代碼本和量化增益的過程必須對每個子幀都執行。
如上所述,利用每個子幀內的最佳化來對每個子幀單獨地確定代碼本。然後,提供目前子幀的輸入話音信號和提供所有前面的信息作為每個濾波器的初始值而不影響代碼本檢索。
但是,執行代碼本檢索不需要有關下一個來的信號的任何信息。在話音變化區,特別是在瞬變區,短期子幀內的最佳化不保證最佳代碼本的選擇。
而且,每個子幀的單獨最佳化問題是在邊界上的特性信號較少被重複。子幀越短,子幀邊界的問題越大。
根據現有技術在通信系統中使用的CELP標準話音信號編碼器由於上述原因提供了差的合成話音的質量,並因此提供質量差的通信系統業務。
但是,設定新標準的話音信號編碼器需要大量的金錢和時間,因為大量的移動站和基站系統已經使用了現有技術的話音信號編碼器以提供蜂窩式通信業務。
有鑑於此,本發明提供了在兩個連續子幀內執行同時最佳化的方法。具體地說,該方法利用有關下一個來的輸入信息檢索代碼本。根據本發明優選實施例的CELP話音信號編碼器與常規的CELP話音信號編碼器兼容,並且通過改變常規話音信號編碼器的軟體來改善話音質量。
在本發明的優選實施例中,用於改善話音信號編碼器性能的方法包括以下步驟計算一個窗口的目標信號;從一個窗口的所述目標信號、所有代碼本索引和所有代碼本最佳增益中確定K個最佳侯選代碼本和最佳侯選代碼本增益;從一個窗口的所述目標信號和第一子幀的所述最佳侯選代碼本及最佳侯選代碼本增益中計算第二子幀的K個目標信號;從第二子幀的所述目標信號以及第一子幀的所述最佳侯選代碼本和最佳侯選代碼本增益中確定第二子幀的L個最佳侯選代碼本和最佳侯選代碼本增益;和從一個窗口的所述目標信號、所述第一子幀的所述最佳侯選增益和所有可能量化的增益,以及所述第二子幀的所述最佳代碼本和最佳侯選代碼本增益中分別選擇所述兩個子幀的最佳代碼本和最佳代碼本增益。
下面將參照附圖對本發明詳細進行敘述。
圖1是根據現有技術的代碼本檢索方法的方框圖;圖2是表示根據本發明優選實施例的代碼本檢索方法的方框圖;圖3是表示根據本發明優選實施例在第一子幀上的最佳代碼本檢索方法的方框圖;圖4是表示計算第二子幀的目標信號的方法的方框圖;圖5是表示根據本發明優選實施例在第二子幀上的最佳代碼本檢索方法的方框圖;圖6是表示根據本發明優選實施例的最佳代碼本和量化增益檢索方法的方框圖。
本發明的方法利用了有關下一個輸入的信息和在兩個連續子幀內同時最佳化通過代碼本檢索來改善話音質量。
通過在較寬話音頻帶上的代碼本檢索可取得合成話音質量的這種改善。
另外,本發明提供了用於兩個連續子幀同時最佳化的兩個方法一個方法是為了減少計算負擔,而另一個方法是可變地調整計算負擔。
兩個連續子幀定義為一個窗口,通過兩個連續的子幀執行代碼本檢索。
Lc是一個子幀的時間間隔,而時間軸的索引從0運行至2Lc-1。第一子幀對應0,1,…Lc-1,第二子幀對應Lc,Lc+1,2Lc-1。
第一子幀的K個最佳侯選代碼本在每個窗口內選擇,而第二子幀的L個最佳侯選代碼本的選擇相關於K個確定的侯選代碼本中的每個代碼本。因此,選擇K×L的組合。
在每個窗口對選擇的K×L組合的所有可能的量化代碼本增益進行檢索,和確定最佳代碼本組合及相應的量化增益。
圖2是表示根據本發明優選實施例的代碼本檢索方法的方框圖。如上所述,該方法包括步驟計算一個窗口的目標信號11[框210];從一個窗口的目標信號11、所有代碼本索引和所有代碼本最佳增益中確定第一子幀的K個最佳侯選代碼本21和最佳侯選代碼本增益22[框220];從一個窗口的目標信號11和第一子幀的最佳侯選代碼本21及最佳侯選代碼本增益22中計算第二子幀的K個目標信號31,[框230];從第二子幀的目標信號31以及第一子幀的最佳侯選代碼本21和最佳侯選代碼本增益22中確定第二子幀的L個侯選最佳代碼本41和最佳侯選代碼本增益42[框240];和從一個窗口的目標信號11、第一子幀的最佳侯選增益22和所有可能量化的增益,以及第二子幀的最佳代碼本41和最佳侯選代碼本增益42中分別選擇兩個子幀的最佳代碼本51、52和最佳代碼本增益53、54[框250]。
現在對照
代碼本檢索技術。音調濾波器產生一個零輸入響應,該響應用作給LPC濾波器的輸入,而LPC濾波器以與現有技術中相同的方式產生LPC濾波的輸出信號。
減法器從對應於兩個子幀的話音信號中減去LPC濾波器的輸出,並由加權濾波器使用已相減的輸出,該加權濾波器提供一個窗口的目標信號。
將一個窗口的目標信號用於第一子幀的最佳代碼本檢索。
圖3是表示根據本發明優選實施例第一子幀的代碼本檢索方法的方框圖。如圖3中所描述的,LPC濾波器接收所有可能的代碼本和非量化的代碼本最佳增益並且產生已濾波的輸出信號。
減法器計算一個窗口的目標信號11與該輸出信號之間的差值,和均方誤差選擇器選擇候選代碼本21及量化的增益22以減小均方誤差。然後,在第一子幀內執行最佳化過程。
上述過程對K個代碼本的每個代碼本確定K個最佳侯選代碼本和K個最佳侯選代碼本增益。
對於已選擇的K對侯選代碼本和侯選代碼本增益,計算對應於每個第二子幀的目標信號。
圖4是表示第二子幀計算方法的方框圖。如圖所示,對在步驟220中選擇的第一子幀的每個侯選代碼本,在對應於第二子幀的時間軸位置Lc,Lc+1,…,2Lc-1上都以0填充,而輸出信號是通過使上述結果通過音調濾波器和LPC濾波器後產生的。此時,將音調濾波器和LPC濾波器的所有初始值均設置為「0」並且進行濾波。
乘法器以第一子幀的最佳侯選代碼本增益22乘以該輸出信號32。減法器從目標信號11中減去上述結果並且產生第二子幀的目標信號。
圖5是表示第二子幀的最佳代碼檢索方法的方框圖。LPC濾波器接收所有可能的代碼本和最佳代碼本增益並且產生輸出信號。
減法器計算第二子幀的輸出信號和目標信號之間的差值,最小均方誤差選擇器選擇侯選代碼本及量化侯選增益以減小均方誤差。
然後,在每個侯選代碼本41上對應於第一子幀將從0至Lc-1的時間軸變為「0」。
最後,通過利用第二子幀的侯選代碼本41、量化的侯選代碼本增益42和其它信息執行兩個子幀的最佳代碼本51、52和量化的增益53、54的檢索。
圖6是表示根據本發明優選實施例最佳代碼本和量化增益檢索方法的方框圖。第二子幀的侯選代碼本41通過音調濾波器和LPC濾波器濾波,和乘法器以所有量化的代碼本增益Gq2b與已濾波的輸出信號55相乘並產生輸出信號56。
乘法器用所有可能量化的增益Gq1a乘以在步驟230中的輸出信號32。該結果被加到信號56以產生輸出信號57。
最後,減法器計算一個窗口的目標信號11與該輸出信號57之間的差值,和均方誤差選擇器選擇代碼本51、53和增益52、54以減少均方誤差。
然後,根據式2確定k、j、a和b以減小a值。
式2n=02Lc-1[x(n)-Gq1aUk(n)-Gq2bZj(n)]2.]]>
式中n表示從0運行至2Lc-1的一時間軸;x(n)表示一個窗口的目標信號;Uk(n)表示第一子幀的第K個最佳侯選代碼本;Zj(n)表示第二子幀的第j個最佳侯選代碼本;Gq1a表示第一子幀的第a個量化的侯選代碼本增益;和Gq2b表示第二子幀的第b個量化的侯選代碼本增益。
在優選實施例中,本發明同時量化由兩個子幀構成的每個窗口的兩個增益,而現有技術中的量化是以每個子幀進行的。因此,在使式2最小化的過程中,不檢索所有可能的量化增益,即,不分別檢索k和j的所有a和b,而只檢索具有與每個代碼本22和42的最佳侯選增益相同的正或負符號的量化增益。例如,當第一子幀的代碼本的最佳增益是正的時,則只對所有Gq2a值中正的增益進行檢索。
這個方法與現有技術中檢索所有最佳增益的方法相比把檢索時間減小為1/4。
根據本發明優選實施例的方法首先分別確定在一個窗口內第一子幀和第二子幀的K個和L個代碼本,並稍後從K×L組合中選擇一個最佳組合。由於檢索時間取決於K和L,所以本發明通過變化K和L調整每幀的檢索時間。
本發明的CELP話音信號編碼器與先前的標準編碼器兼容並且改善了話音質量而無算法延遲。
雖然本發明可以允許各種修改和替代形式,但在附圖和詳細的說明出中已利用例子表示了其具體的實施例。應該理解,本發明不限於所公開的特定形式,相反,本發明包括落入所附權利要求書限定的本發明的精神和範圍內的所有修改,等效物及替代物。
權利要求
1.一種改善話音編碼器性能的方法,其特徵是,該方法包括步驟計算一個窗口的目標信號;從一個窗口的目標信號、所有代碼本索引和所有代碼本最佳增益中確定第一子幀的K個最佳侯選代碼本和最佳候選代碼本增益;從一個窗口的所述目標信號和第一子幀的所述最佳侯選代碼本及最佳侯選代碼本增益中計算第二子幀的K個目標信號;從第二子幀的所述目標信號以及第一子幀的所述最佳侯選代碼本和最佳侯選代碼本增益中確定第二子幀的L個最佳侯選代碼本和最佳侯選代碼本增益;和從一個窗口的所述目標信號,所述第一子幀的所述最佳侯選增益和所有可能量化的增益,以及所述第二子幀的所述最佳代碼本和最佳侯選代碼本增益中分別選擇所述兩個子幀的最佳代碼本和最佳代碼本增益。
2.根據權利要求1的方法,其特徵是,所述K和L是變量。
3.根據權利要求1的方法,其特徵是,所述確定第一子幀的K個最佳侯選代碼本和最佳侯選代碼本增益的步驟包括以下步驟傳輸所有可能的代碼本和非量化的代碼本最佳增益通過線性預測係數(LPC)濾波器產生一個輸出信號;計算通過LPC濾波器的所述已濾波的輸出信號與一個窗口的所述目標信號之間的差值並且選擇K對侯選代碼本與量化的侯選增益,以使均方誤差最小。
4.根據權利要求3的方法,其特徵是,在所述選擇K對的侯選代碼本與量化的侯選增益的步驟中,在所述第一子幀內執行所述第一子幀的最佳化。
5.根據權利要求1的方法,其特徵是,所述計算第二子幀的K個目標信號的步驟中,還包括以下步驟相關於在確定所述最佳侯選代碼本和侯選代碼本增益的步驟中選擇的第一子幀的每個侯選代碼本以零進行零填充對應於第二子幀的時間軸位置Lc,Lc+1…,2Lc-1;由傳輸所述零填充的信號通過音調濾波器和LPC濾波器產生一個輸出信號;從所述目標信號中減去與第一子幀的所述最佳侯選增益相乘的所述輸出信號來確定第二子幀的目標信號。
6.根據權利要求5的方法,其特徵是,在所述選擇K對的所述侯選代碼本和量化的侯選增益步驟中,所述音調濾波器和所述LPC濾波器二者的初始值都等於「0」。
7.根據權利要求1的方法,其特徵是,所述確定第二子幀的L個最佳侯選代碼本及最佳侯選代碼本增益的步驟包括以下步驟傳輸所有可能的代碼本及代碼本最佳增益通過LPC濾波器產生一個輸出信號;計算通過LPC濾波器濾波的所述輸出信號與第二子幀的所述目標信號之間的差值並且選擇L對侯選代碼本與量化的侯選增益,使均方誤差最小。
8.根據權利要求7的方法,其特徵是,對應於在確定所述侯選代碼本與量化的侯選代碼本增益的所述步驟中選擇的第一子幀使從1至Lc-1運行的時間軸變為「0」。
9.根據權利要求1的方法,其特徵是,所述選擇最佳代碼本與代碼本增益的步驟包括以下步驟將所有可能的代碼本增益Gq2b乘以通過音調濾波器和LPC濾波器的所述第二子幀的侯選代碼本;將所有可能量化的增益Gq1a乘以在計算所述第二子幀的K個目標信號步驟中的所述輸出信號並且將所述相乘步驟的該輸出信號加到其結果上;和計算一個窗口的所述目標信號與所述相加步驟中的輸出信號之間的差值並且選擇最佳代碼本和最佳增益使均方誤差最小。
10.根據權利要求9的方法,其特徵是,在選擇代碼本和代碼本增益以使所述誤差最小的步驟中,n表示從0至2Lc-1運行的一時間軸;x(n)表示一個窗口的目標信號;Uk(n)表示第一子幀的第K個最佳侯選代碼本;Zj(n)表示第二子幀的第j個最佳侯選代碼本;Gq1a表示第一子幀的第a個量化的侯選代碼本增益;和Gq2b表示第二子幀的第b個量化的侯選代碼本增益,然後確定j,k,a和b使下式最小n=02Lc-1[x(n)-Gq1aUk(n)-Gq2bZj(n)]2.]]>
11.根據權利要求10的方法,其特徵是,不檢索每個K與j的所有Gq1a和Gq2b,而只檢索具有每個子幀的最佳侯選增益的相同索引的量化的增益。
全文摘要
一種改善話音信號編碼器性能的方法,包括步驟:計算一窗口的目標信號;從該目標信號,全代碼本索引和最佳代碼本增益中檢索最佳候選的代碼本和代碼本增益;還包括步驟:從窗口目標信號和第一子幀的最佳候選的代碼本和代碼本增益計算第二子幀的目標信號;檢索第二子幀的最佳候選的代碼本與代碼本增益;從窗口目標信號、第一子幀的最佳候選增益和所有可能量化的增益以及第二子幀的最佳候選的代碼本與代碼本增益分別選擇兩子幀的最佳代碼本與最佳代碼本增益。
文檔編號G10L19/14GK1235335SQ9811921
公開日1999年11月17日 申請日期1998年9月9日 優先權日1997年9月10日
發明者樸浩棕 申請人:三星電子株式會社