在編碼寬帶信號中用於適應性帶寬音調搜尋的方法與設備的製作方法
2023-05-23 08:47:06 1
專利名稱:在編碼寬帶信號中用於適應性帶寬音調搜尋的方法與設備的製作方法
1本發明的背景本發明涉及一個有效的、用於對一個寬帶信號進行數字編碼的技術,特別地,但是不排斥性地,涉及一個語音信號,這是就發送,或者保存,與合成這個寬帶聲音信號來說的。更特別地,本發明涉及一個改進的音調搜尋設備與方法。
2現有技術的簡單描述很多應用,例如音頻/視頻電話會議,多媒體,和無線應用,以及網際網路和分組網絡應用迫切要求高效的數字寬帶語音/音頻編碼技術,並且具有一個好的主觀質量/比特速率之間的折衷。直到最近,在語音編碼應用中主要是使用在範圍為200到3400赫茲內被濾波的電話帶寬。但是,為了增加語音信號的清晰度與自然性,迫切要求進行寬帶語音應用。在範圍為50-7000赫茲內的一個帶寬被發現對傳送一個面對面語音質量的信號來說是足夠的。對音頻信號來說,這個頻率範圍可以給出一個可接受的語音質量,但是這個語音的音頻質量仍然比CD質量要差,CD質量的頻率範圍在20到20000赫茲內。
一個語音編碼器將一個語音信號轉換為一個數字比特流,這個數字比特流經過一個通信信道被傳送(或者被保存在一個存儲媒質中)。這個語音信號被量化(被採樣,並且通常被使用每採樣16比特來進行量化),並且這個語音編碼器的作用是用一個數目較少的比特來表示這些數字採樣,而保持一個好的主觀語音質量。語音解碼器或者合成器對被發送的或者被保存的比特流進行操作,並且將它轉換為一個聲音信號。
能夠實現一個好的質量/比特速率折衷的最佳現有技術中的一個是所謂的碼激勵線性預測(CELP)技術。根據這個技術,被採樣的語音信號被以連續的L個採樣塊為單位進行處理,這L個採樣通常被稱作幀,其中L是某個預定的數目(與10-30毫秒語音相應)。在CELP中,每幀計算一個線性預測(LP)濾波器,並且發送這個線性預測濾波器。然後,這L個採樣的幀被劃分為更小的塊,稱作大小為N個採樣的子幀,其中L=kN,並且k是一個幀中子幀的數目(N通常與4-10毫秒語音相應)。在每一個子幀中確定一個激勵信號,它通常包括兩個部分一個是來自過去的激勵(也稱作音調的貢獻或者適應性碼本)和,另一個是來自一個新的碼本(也稱作固定的碼本)。這個激勵信號被發送,並且在解碼器被使用作為LP合成濾波器的輸入來獲得被合成的語音。
在CELP上下文中一個新的碼本是一個可以被索引的、N個採樣長的序列集合,也被稱作N維碼矢量。每一個碼本序列被一個整數k進行索引,k的範圍是1到M,其中M表示碼本的大小,通常被表示為一個比特數目b,其中M=2b。
為了根據這個CELP技術來合成語音,通過使用對語音信號的頻譜特徵進行建模的、隨時間變化的濾波器,從一個碼本中濾波出一個合適的碼矢量,就可以合成每一個N個採樣的塊。在編碼器的末端,對碼本中的所有碼矢量或者其一個子集計算被合成的輸出(碼本搜索)。保留的碼矢量是一個根據感覺權重畸變度量,能產生最靠近原始語音信號的合成輸出的碼矢量。使用一個所謂的感覺加權濾波器來執行這個感覺加權,感覺加權濾波器通常是從LP合成濾波器推導出來的。
在對電話頻帶聲音信號進行編碼中,CELP模型是非常成功的,並且幾個基於CELP的編碼標準已經被用於很多應用中,並且這個聲音信號是帶寬限制在200-3400赫茲內的帶限信號,並且以每秒8000個採樣的速率進行採樣。在寬帶語音/音頻應用中,聲音信號的帶寬限制在50-7000赫茲,並且以每秒16000個採樣的速率被採樣。
當將針對電話頻帶信號而進行優化的CELP模型應用到寬帶信號時,就產生了某些困難,並且需要在這個模型中增加附加的特徵來獲得高質量的寬帶信號。與電話頻帶的信號相比,寬帶信號的動態範圍寬得多,當要求用定點運算實現這個算法時(在無線應用中,這是一個基本要求),這就產生了精度的問題。另外,這個CELP模型通常在低頻部分(它通常具有較高比例的能量)消耗了大部分編碼比特,這通常導致產生一個低通的輸出信號。為了克服這個問題,需要對這個感覺加權濾波器進行修改,來適合這個寬帶信號,並且為了減少這個動態範圍,能夠增強高頻區域的預加重技術就變得重要了,這能夠實現一個較簡單的定點實現方式,並且能夠確保對這個信號的高頻部分進行一個更好的編碼。另外,寬帶信號中濁音段頻譜中的音調內容不需要擴展到整個頻譜範圍,並且與窄帶相比,濁音的數量有更多的變化。所以,在寬帶信號的情形下,已有的音調搜尋結構是不夠的。這樣,更重要的是能夠改進這個閉環音調分析,來更好地容納濁音電平的變化。
本發明的目的所以,本發明的一個目的是提供一個方法與設備,它能夠使用CELP類型的編碼技術,使用改進的音調分析來對寬帶(7000赫茲)的聲音信號進行有效的編碼,以獲得一個高質量的重構聲音信號。
本發明的概述更詳細地,根據本發明,提供了一個方法,用於選擇與至少兩個信號路徑中的、具有最低計算音調預測錯誤的一個信號路徑相關的一個最佳音調碼本參數集合。對來自一個音調碼本搜索設備的一個音調碼矢量作出響應,計算這個音調預測錯誤。在這兩個信號路徑中的至少一個中,在提供這個音調碼矢量來計算所述一個路徑上的所述音調預測錯誤以前,對音調預測錯誤進行濾波。最後,在所述至少兩個信號路徑中被計算的音調預測錯誤被進行比較,並且選擇具有最低計算音調預測錯誤的信號路徑,並且選擇與被選擇信號路徑相關的音調碼本參數集合。
本發明的、用於產生一個最佳音調碼本參數集合的音調分析設備包括a)至少兩個與相應的音調碼本參數相關的信號路徑,其中i)每一個信號路徑包括用於從一個音調碼本搜尋設備計算一個音調碼矢量預測錯誤的一個音調預測錯誤計算設備;和ii)兩個信號路徑中至少一個信號路徑包括一個濾波器,在將這個音調碼矢量提供到這個路徑的音調預測錯誤計算設備以前,這個濾波器用於對這個音調碼矢量進行濾波;和b)一個選擇器,用於比較在這個信號路徑中所計算的音調預測錯誤,並且用於選擇具有最低計算音調預測錯誤的信號路徑,並且用於選擇與這個被選擇信號路徑相關的音調碼本參數集合。
能夠對這個語音頻譜的諧振結構進行有效地建模的新方法與設備使用了應用到過去激勵的低通濾波器的幾個形式,並且選擇具有較高預測增益的一個低通濾波器。當使用了子採樣音調解析度時,這些低通濾波器可以被集成在用於獲得較高音調解析度的內插濾波器中。
在本發明的一個優選實施方式中,上面所描述的音調分析設備中的每一個音調預測錯誤計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
在本發明的另一個實施方式中,這個音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
本發明進一步涉及一個編碼器,這個編碼器具有上面所描述的音調分析設備,用於對一個寬帶輸入信號進行編碼,並且包括a)一個線性預測合成濾波器計算器,對這個寬帶信號作出響應,用於產生線性預測合成濾波器係數;b)一個感覺加權濾波器,用於對這個寬帶信號與線性預測合成濾波器係數作出響應,以產生一個感覺加權信號;c)一個脈衝響應產生器,用於對這個線性預測合成濾波器係數作出響應,以產生一個合成濾波器脈衝響應信號;d)一個音調搜尋單元,用於產生音調碼本參數,包括i)一個音調碼本搜尋設備,對這個感覺加權信號和這個線性預測合成濾波器係數作出響應,用於產生這個音調碼矢量和一個新的搜尋目標矢量;和ii)這個音調分析設備,對這個音調碼矢量作出響應,用於從這個音調碼本參數集合中選擇出與具有最低計算音調預測錯誤的這個路徑相關的音調碼本參數集合;d)一個新的碼本搜尋設備,對這個加權合成濾波器脈衝響應信號和這個新的搜尋目標矢量作出響應,用於產生新的碼本參數;和e)一個信號形成設備,用於產生包括與具有最低計算音調預測錯誤的這個路徑相關的音調碼本參數集合的一個編碼寬帶信號,並且這個新的寬帶編碼信號包括這個新的碼本參數,和線性預測合成濾波器係數。
本發明進一步與一個蜂窩通信系統相關,與一個蜂窩移動發送器/接收器單元,一個蜂窩網絡部件,和包括上面所描述解碼器的一個雙向無線通信子系統相關。
通過示例並且參考附圖,並且在閱讀下面關於其一個優選實施方式的非限制性描述的基礎上,就可以更清楚本發明的目的,優點,和其它特徵。
圖的簡單描述在附圖中
圖1是寬帶編碼設備的一個優選實施方式的一個示意圖框圖;圖2是寬帶解碼設備的一個優選實施方式的一個示意圖框圖;圖3是音調分析設備的一個優選實施方式的一個示意圖框圖;和圖4是一個蜂窩通信系統的一個簡化的、示意圖框圖,其中圖1的寬帶編碼設備與圖2的寬帶解碼設備可以被使用。
如該領域內普通技術人員眾所周知的,一個蜂窩通信系統,例如401(見圖4)通過將一個範圍很大的地理區域劃分為數目C的、面積較小的小區,而在這個範圍很大的地理區域上提供了一個電信服務。這C個面積較小的小區分別被相應的蜂窩基站4021,4022,…,402C來提供服務,這些基站向每一個小區提供無線信令,音頻和數據信道。
無線信令信道被用於向在這個蜂窩基站402的覆蓋區域(小區)的限度內的移動無線電話(移動發送器/接收器單元),例如403發送尋呼消息,並且發起到位於這個基站的小區內或者外面的其它無線電話403的電話呼叫,或者發起到另一個網絡,例如公眾交換電話網絡(PSTN)404的電話呼叫。
一旦一個無線電話403已經成功地發起了一個電話呼叫,或者成功地接收到一個呼叫,就在這個無線電話403和與這個無線電話403所處小區相應的蜂窩基站402之間建立一個音頻或者數據信道,並且經過這個音頻或者數據信道,在這個基站402與無線電話403之間進行通信。這個無線電話403也可能在正在進行一個呼叫的同時經過一個信令信道接收控制或者定時信息。
如果當一個呼叫正在進行時,一個無線電話403已經離開一個小區,並且進入另一個相鄰的小區,這個無線電話403將這個呼叫越區切換到新小區基站402的一個可用音頻或者數據信道。如果沒有呼叫正在進行時,一個無線電話403離開一個小區並且進入另一個相鄰的小區,這個無線電話403經過這個信令信道發送一個控制消息來登錄到這個新小區的基站402。使用這個方法,可用在一個範圍很寬的地理範圍內提供移動通信服務。
這個蜂窩通信系統401進一步包括一個控制終端405,這個控制終端用於控制在蜂窩基站402與PSTN 404,例如在一個無線電話403和PSTN 404之間進行一個通信的期間,之間的通信,或者用於控制在位於一第一小區內無線電話403與位於一第二小區內無線電話403之間的通信。
當然,為了在一個小區的基站402與位於這個小區內的一個無線電話403之間建立一個音頻或者數據信道,就需要一個雙向無線通信子系統。如圖4的很簡單形式所顯示的,這樣一個雙向無線通信子系統典型地在無線電話403中包括-一個發送器406,包括-一個編碼器407,用於對語音信號進行編碼;和-一個發送電路408,用於通過一個天線,例如409來發送來自編碼器407的這個被編碼語音信號;和-一個接收器410,包括-一個接收器電路411,用於通常通過相同的天線409接收一個被發送的編碼語音信號;和-一個解碼器412,用於對來自接收電路411的所接收被編碼語音信號進行解碼。
這個無線電話進一步包括編碼器407和解碼器412均連接到其上、並且用於處理其上的信號的其它傳統無線電話電路413,該領域內的普通技術人員對這個電路413是很熟悉的,並且相應地,將不在本發明的說明中進行進一步的描述。
另外,典型地,這樣一個雙向無線射頻通信子系統在基站402中包括-一個發送器414,包括-一個編碼器415,用於對這個語音信號進行編碼;和-一個發送電路416,用於通過一個天線,例如417發送來自編碼器415的這個被編碼語音信號;和
-一個接收器418,包括-一個接收電路419,用於通過相同的天線417或者通過另一個天線(沒有顯示)來接收一個被發送的編碼語音信號;和-一個解碼器420,用於對來自這個接收電路419的這個被接收編碼語音信號進行解碼。
典型地,這個基站402進一步包括一個基站控制器421及其相關資料庫422,用於控制在控制終端405與發送器414和接收器418之間的通信。
如該領域內的技術人員眾所周知的,為了減少通過雙向無線射頻通信子系統,即在一個無線電話403與一個基站402之間,發送聲音信號,例如語音,所需要的帶寬,就需要語音編碼。
典型地,工作在13k比特/秒並且低於碼激勵線性預測(CELP)的LP語音編碼器(例如415,和407)通常使用一個LP合成濾波器來建立關於這個語音信號的短期頻譜包絡的模型。典型地,這個LP信息被以每10或者20毫秒的間隔發送到這個解碼器(例如420和412),並且在解碼器的末端被提取出來。
本發明說明中所公開的新技術可以被用於不同的基於LP的編碼系統中。但是,一個CELP類型的編碼系統被用於本發明的優選實施方式中,以提供這些技術的一個非限制性描述。以相同的方式,這樣的技術可以被用於除聲音和語音信號以外的其它聲響信號以及其它類型的寬帶信號。
圖1顯示了被修改成能夠更好地容納寬帶信號的一個CELP類型的語音編碼設備100的一個一般框圖。
被採樣的輸入語音信號114被劃分成連續的L個採樣模塊,稱作「幀」。在每一個幀中,表示這個幀中語音信號的不同參數被計算,被編碼,並且被發送。表示LP合成濾波器的LP參數通常在每一個幀被計算一次。這個幀被進一步分成更小的、N個採樣的塊(塊的長度為N),其中激勵參數(音調和不同(pitch and innovation))被定義。在這個CELP結構中,這些長度為N的塊被稱作子幀,並且子幀中的N個採樣信號被稱作一個N維的矢量。在這個優選實施方式中,這個長度N與5毫秒相應,而長度L與20毫秒相應,這意味著一個幀包括4個子幀(採樣率為16kHz時N=80,下採樣到12.8kHz時,N=64)。在這個編碼過程中,可以出現各種N維的矢量。在圖1和2中可能將出現的矢量列表和被發送參數的一個列表被給出,如下主N維矢量的列表s寬帶信號輸入語音矢量(在下採樣,預處理,和預加重後);sw被加權的語音矢量;s0加權合成濾波器的零輸入響應;sp被下採樣的預處理信號;被過採樣的合成語音信號;s′在去加重前的合成信號;sd被去加重的合成信號;sh在去加重和後處理後的合成信號;x音調搜尋的目標矢量;x′新搜尋的目標矢量;h加權合成濾波器脈衝響應;vT延遲T後的適應(音調)碼本矢量;yT被濾波的音調碼本矢量(vT與h進行卷積);ck在索引k(新碼本中的第k個表目)處的新碼矢量;cf被增強的、被伸縮的(scaled)新碼矢量;u激勵信號(被伸縮的新和音調碼矢量);u′增強的激勵;z帶通噪聲序列;w′白噪聲序列;和w被伸縮的噪聲序列。
被發送參數的列表STP短期預測參數(定義了A(z));T音調延遲(或者音調碼本索引);b音調增益(或者音調碼本增益);j音調碼矢量上所使用低通濾波器的階數;k碼矢量索引(新碼本表目);和g新碼本增益。
在這個優選實施方式中,STP參數被每幀傳送一次,餘下的參數在每幀被發送4次(每子幀被發送一次)。
編碼器側被採樣的語音信號被圖1的這個編碼設備100一塊接一塊地進行編碼,其中編碼設備100被分成11個模塊,其編號從101到111。
輸入的語音被處理成上面所描述的L個採樣塊,稱作幀。
參考圖1,被採樣的輸入語音信號114在一個下採樣模塊101中被進行下採樣。例如,這個信號被16kHz下採樣到12.8kHz,所使用的技術是該領域內技術人員眾所周知的。當然,也可以設想,將其下採樣到另一個頻率。下採樣增加了編碼效率,因為僅需要編碼一個更小帶寬的頻帶。這也降低了算法的複雜程度,因為一個幀中的採樣數目減少了。當比特速率下降到16kbit/s時,下採樣的使用就變得非常重要了,儘管在16kbit/s以上時,下採樣不是必不可少的。
在進行下採樣後,20毫秒的320個採樣被減少到256個採樣的幀(下採樣的比例為4/5)。
然後,輸入幀被提供到可選的預處理塊102。預處理塊102可能包括其截止頻率為50赫茲的一個高通濾波器。高通濾波器102去除在50赫茲以下的、不希望有的聲音部分。
下採樣的預處理信號被表示為sp(n),n=0,1,2,…,L-1,其中L是幀的長度(在採樣速率為12.8kHz時,為256)。在預加重濾波器103的一個優選實施方式中,這個信號sp(n)被使用具有下述轉移函數的一個濾波器進行預加重P(z)=1-μz-1其中μ是值為在0和1之間的一個預加重因子(典型的值為0.7)。也可以使用一個高階的濾波器。應指出的是,高通濾波器102和預加重濾波器103可以被進行交換來獲得更有效的定點實施方式。
預加重濾波器103的功能是增強輸入信號的高頻分量。它也減少了輸入語音信號的動態範圍,這使它更能夠適合於進行定點運算實現方式。如果沒有進行預加重,使用單精度算法的定點LP分析是難以實現的。
預加重也在實現一個量化錯誤的合適整體感覺加權上起到了重要的作用,這能夠改善聲音質量。下面,將更詳細地解釋這一點。
預加重濾波器103的輸出被表示為s(n)。這個信號被用於在計算器模塊104中執行LP分析。LP分析是該領域內一個普通技術人員眾所周知的一個技術。在這個優選實施方式中,使用了自相關的方法。在這個自相關的方法中,這個信號s(n)首先被使用一個漢明窗(通常,長度為30-40毫秒的量級)進行加窗處理。自相關是從加窗的信號計算出來的,並且Levinson-Durbin遞歸方法被使用來計算LP濾波器係數,ai,其中i=1,…,p,並且p是LP的階數,在寬帶編碼中其典型的值是16。參數ai是LP濾波器的轉移函數的係數,它由下述關係給出A(z)=1+i=1Paiz-1]]>LP分析是在計算器模塊104中被執行的,計算器模塊104也執行LP濾波器係數的量化與內插。LP濾波器係數首先被變換為另一個等價的域,以更適合於進行量化和進行內插處理。這個線譜對(LSP)和導抗頻譜對(ISP)域是兩個可以在其中進行有效的量化和內插處理的域。16個LP濾波器係數,ai,可以被使用分隔或者多級量化,或者它們的組合來量化為30-50個比特的量級。內插的目的是能夠在每一個子幀更新LP濾波器的係數,而在每一個幀才發送一次,這改善了編碼器的性能而沒有增加比特速率。LP濾波器係數的量化與內插也應是該領域內普通技術人員眾所周知的,所以,在本發明的說明中不詳細描述它。
下面的段落將描述在一個子幀上執行的編碼操作的餘下部分。在下面的描述中,濾波器A(z)表示子幀沒有被量化與內插的LP濾波器,而濾波器 表示子幀的被量化與內插LP濾波器。
感覺加權在一個基於綜合分析的編碼器中,通過在一個感覺加權域中對輸入語音和被合成的語音之間的均分誤差最小,來搜尋最佳的音調與新參數。這等價於將在被加權的輸入語音與被加權的合成語音之間的誤差最小化。
在一個感覺加權濾波器105中,計算被加權的信號sw(n)。傳統地,通過如下轉移函數的加權濾波器來計算這個被加權的信號sw(n)W(z)=A(z/γ1)/A(z/γ2),其中O<γ2<γ1≤1如該領域內普通技術人員眾所周知的,在現有技術的綜合分析(AbS)編碼器中,分析顯示量化誤差被一個轉移函數w-1(z)所加權,這個轉移函數是感覺加權濾波器105的轉移函數的逆。這個結果被B.S.Atal和M.R.Schroeder在1979年6月,在IEEE TransactionASSP,Vol.27,no.3的第247-254頁上進行了很好的描述。轉移函數W-1(z)顯示了輸入語音信號的某些共振峰結構。這樣,通過對量化誤差進行整形,以使它在共振峰區域中具有更有的能量,就利用了人耳的屏蔽特性利用,在共振峰區域中,它將被這些區域中的強信號能量所屏蔽(masked)。加權的數量是用因子γ1和γ2所控制的。
上面的傳統感覺加權濾波器105在電話頻帶信號上工作得很好。但是,發現這個傳統的感覺加權濾波器105不適合於對寬帶信號進行有效的加權。同時,也發現,傳統的感覺加權濾波器105在對共振峰結構和同時需要的頻譜傾斜進行建模時存在內在的缺陷。因為低頻與高頻之間的寬動態範圍,這個頻譜傾斜在寬帶信號中是更顯著的。現有技術已經建議在W(z)中增加一個傾斜濾波器,來分別控制寬帶輸入信號的傾斜與共振峰加權。
對這個問題的一個新的解決方法是,根據本發明,在輸入引入預加重濾波器103,根據預加重的語音s(n)來計算這個LP濾波器A(z),並且通過固定其分母使用一個被修改的濾波器W(z)。
在模塊104中,對被預加重的信號s(n)進行LP分析,來獲得LP濾波器A(z)。另外,一個新的、具有固定分母的感覺加權濾波器105被使用。這個感覺加權濾波器104的轉移函數的一個示例的關係如下W(z)=A(z/γ1)/(1-γ2z-1),其中0<γ2<γ1≤1一個更高的階可以用於分母。這個結構基本上消除了共振峰加權與傾斜之間的相互影響。
注意,因為A(z)是根據這個預加重語音信號s(n)而計算出來的,所以與當根據這個原始語音計算A(z)時的情形相比,濾波器1/A(z/γ1)的傾斜就不太明顯了。因為使用具有下面的轉移函數的一個濾波器來在解碼器末端進行去加重的P-1(z)=1/(1-μz-1)量化誤差頻譜被其轉移函數為W-1(z)P-1(z)的一個濾波器進行整形。當γ2被設置成與μ相等時,典型地就是這樣的情形,量化誤差的頻譜被其轉移函數為1/A(z/γ1)的一個濾波器進行整形,並且A(z)是根據預加重的語音信號而計算出來的。主觀的聽顯示,除了能夠容易用定點算法實現方式來實現的優點外,用於通過預加重和修改的加權濾波的組合來獲得對誤差的整形的這個結構在對寬帶信號進行編碼時是非常有效的。
音調分析為了簡化這個音調分析,首先使用加權語音信號sw(n)在開環音調搜尋模塊106中估計一個開環音調延遲TOL。然後,對每一個子幀,在閉環音調搜尋模塊107中執行這個閉環音調分析,並且這個閉環音調分析被限制在開環音調延遲TOL的附近,這大大減少了LTP參數T和b(音調延遲和音調增益)的搜尋複雜程度。通常,開環音調分析是每10毫秒(兩個子幀)在模塊106中被執行一次,所使用的技術是該領域內普通技術人員眾所周知的。
首先計算LTP(長期預測)分析的目標矢量x。這通常是從被加權語音信號sw(n)中減去加權合成濾波器W(z) (z)的零輸入響應s0來完成的。這個零輸入響應s0是通過一個零輸入響應計算器模塊108來計算的。更詳細地,使用下面的關係來計算這個目標矢量xx=sw-s0其中x是N維目標矢量,sw是子幀中被加權的語音矢量,s0是濾波器W(z)/(z)的零輸入響應,因為其初始狀態,s0是組合濾波器W(z) (z)的輸出。零輸入響應計算器108對來自LP分析的量化內插LP濾波器 (z)作出響應,對量化與內插計算器104和被保存在存儲器模塊111中的加權合成濾波器W(z) (z)的初始狀態作出響應,來計算濾波器W(z) (z)的零輸入響應s0(通過將輸入設置為零而確定的初始狀態所產生的這部分響應)。這個操作對該領域內的普通技術人員來說是眾所周知的,所以,將不進行進一步的描述。
當然,可以使用替代的但是在數學上等價的方法來計算目標矢量x。
加權合成濾波器W(z) (z)的一個N維脈衝響應矢量h被使用來自模塊104的LP濾波器係數A(z)和 (z)在脈衝響應產生器109中進行計算。另外,這個操作對該領域內的普通技術人員來說是眾所周知的,所以,在本發明的說明中將不進行進一步的描述。
閉環音調(或者音調碼本)參數b,T和j是在閉環音調搜尋模塊107中被計算的,它使用了目標矢量x,脈衝響應矢量h和開環音調延遲TOL作為輸入。傳統地,這個音調預測已經被具有下面的轉移函數的一個音調濾波器所表示1/(1-bz-T)
其中,b是音調的增益,而T是音調的延遲或者延遲。在這個情形下,音調對激勵信號u(n)的音調貢獻被表示為bu(n-T),其中總的激勵為u(n)=bu(n-T)+gck(n)其中g是新的碼本增益,ck(n)是在索引k處的新的碼矢量。
如果這個音調延遲T比子幀程度N小,那麼這個表達式就具有局限性。在另一個表達式中,這個音調的貢獻可以被看作包括過去激勵信號的一個音調碼本。一般來說,在這個音調碼本中的每一個矢量是前一個矢量的一個移位1的版本(丟棄了一個採樣並且增加了一個採樣)。對音調延遲T>N來說,這個音調碼本與濾波器結構(1/1-bz-T)等價,並且音調延遲為T的一個音調碼本矢量vT(n)如下vT(n)=u(n-T),n=0,…,N-1對音調延遲T比N小的情形,一個矢量vT(n)通過從過去激勵起直到這個矢量被完成這段期間重複可用採樣而建立(這並不與濾波器的結構等價)。
在最近的編碼器結構中,一個高階的音調解析度被使用,它能夠大大改善濁音聲響段(voiced sound segment)的質量。這個是通過多相內插濾波器對過去的激勵信號進行過採樣而實現的。在這個情形下,矢量vT(n)通常與過去激勵的一個內插版本相應,其音調延遲T為一個非整數延遲(例如,50.25)。
這個音調搜尋包括尋找最近的音調延遲T和增益b,來使在目標矢量x與被縮放的被濾波過去建立之間的均方加權誤差E最小。誤差E可以表示為E=‖x-byT‖2其中yT是音調延遲為T的被濾波音調碼本矢量yT(n)=vT(n)*h(n)=i=0nvT(i)h(n-i),n=0,...,N-1]]>可以證明,通過使搜尋準則最大,就可以使誤差E最小C=xtyTytTyT]]>其中t表示矢量轉置。
在本發明的這個優選實施方式中,使用了一個1/3的子採樣音調解析度,並且這個音調(音調碼本)搜尋包括3個階段。
在第一個階段,對被加權語音信號sw(n)作出響應,一個開環音調延遲TOL被在開環音調搜尋模塊106中進行估計。如在前面描述中所指出的,這個開環音調分析通常是每10毫秒(兩個子幀)執行一次,並且使用了為該領域內普通技術人員眾所周知的技術。
在第二個階段,對在被估計的開環音調延遲TOL附近的整數音調延遲(通常是±5),在閉環音調搜尋模塊107中搜尋這個搜尋準則C,這大大簡化了這個搜尋過程。一個簡單的過程被用於來更新被濾波的碼矢量yT,而不需要對每一個音調延遲均計算卷積。
一旦在第二階段找到一個最佳的整數音調延遲,這個搜尋的一第三階段(模塊107)就測試在這個最佳整數音調延遲附近的小數。
當這個音調預測器用一個形式為(1/1-bz-T)的一個濾波器進行表示時,這對音調延遲T>N是一個合理的假設,音調濾波器的頻譜在整個頻譜範圍內顯示出一個共振峰結構,其一個諧振頻率與1/T相關。在寬帶信號的情形下,這個結構並不是非常有效的,因為寬帶信號中的諧振結構不覆蓋整個被延伸的頻譜。這個諧振結構僅在到一特定頻率的範圍內存在,這個特定頻率取決於濁音段。這樣,為了實現對寬帶語音的濁音段內的語音貢獻進行有效的表示,這個音調預測濾波器需要具有能夠在這個寬帶頻譜內改變周期性數量的靈活性。
一個新的、實現對寬帶信號的語音頻譜諧振結構進行有效地建模的方法已經在本發明說明中被公開,由此,幾個形式的低通濾波器被應用到過去的激勵,並且選擇了具有較高預測增益的那個低通濾波器。
當使用了子採樣音調解析度時,這些低通濾波器可以被集成在用於獲得更高音調解析度的內插濾波器中。在這個情形下,音調搜尋的第三階段,即在被選擇整數音調延遲附近的小數被測試的階段,對具有不同低通濾波器特性的幾個內插濾波器進行重複,並且選擇使搜尋準則C最大的小數和濾波器階數。
一個更簡單的方法是在上面所描述的3個階段中完成這個搜尋,來使用具有一特定頻率響應的一個內插濾波器確定這個最佳的小數音調延遲,並且通過將不同的預定低通濾波器施加到被選擇的音調碼本矢量來在末端選擇最佳的低通濾波器形狀,並且選擇使這個音調預測誤差最小的低通濾波器。這個方法在下面將被詳細地討論。
圖3顯示了所提出這個方法的一個優選實施方式的一個示意圖框圖。
在存儲器模塊303中,過去的激勵信號u(n),n<0被保存。這個音調碼本搜尋模塊301對這個目標矢量x作出響應,對開環音調延遲TOL作出響應,對存儲器模塊303中的過去的激勵信號u(n),n<0作出響應,來進行一個音調碼本(音調碼本)搜尋來使上面所定義的準則C最小。從模塊301中所進行的這個搜尋的結果,模塊302產生最佳的音調碼本矢量vT。注意,因為使用了一個子採樣音調解析度(小數音調),過去的激勵信號u(n),n<0被進行內插,並且這個音調碼本矢量vT與被進行內插的過去激勵信號相應。在這個優選實施方式中,這個內插濾波器(在模塊301中,但是沒有顯示)具有一個能夠去除在7000赫茲以上頻率分量的低通濾波器特性。
在一個優選實施方式中,K濾波器特性被使用;這些濾波器特性可以是低通的,或者帶通濾波器特性。一旦這個最佳碼矢量vT被這個音調碼矢量產生器302所確定和提供,並且分別使用K個不同頻率形狀的濾波器,例如305(j),其中j=1,2,…,K,來計算K個被濾波的vT矢量版本。這些被濾波的版本分別表示為vf(j),其中j=1,2,…,K。不同的矢量vf(j)在相應的模塊304(j)中,其中j=1,2,…,K,被與脈衝響應h進行卷積,來獲得矢量y(j),其中j=1,2,…,K。為了對每一個矢量y(j)計算均方音調預測誤差,值y(j)通過一個相應的放大器307(j)被乘以增益b,並且通過一個相應的減法器308(j)從目標矢量x中減去值by(j)。選擇器309選擇能夠使均方音調預測誤差最小的頻率形狀的濾波器305(j)。
e(j)=‖x-b(j)y(j)‖2,j=1,2,…,K為了對每一個值y(j)計算均方音調預測誤差e(j),值y(j)通過一個相應的放大器307(j)被乘以增益b,並且通過一個相應的減法器308(j)從目標矢量x中減去值b(j)y(j)。使用下面的關係,在與索引為j的頻率形狀濾波器相關的一個相應增益計算器306(j)中計算每一個增益b(j)b(j)=xty(j)/‖y(j)‖2在選擇器309中,參數b,T,和j被根據使均方音調預測誤差e最小的vT或者vf(j)來進行選擇。
現在參考圖1,這個音調碼本索引T被進行編碼,並且被發送到復用器112。這個音調增益b被進行量化,並且被發送到復用器112。使用這個新的方法,就需要額外的信息來在復用器112中對具有被選擇頻率形狀濾波器的索引j進行編碼。例如,如果使用了3個濾波器(j=0,1,2,3),就需要兩個比特來表示這個信息。這個濾波器索引信息j也可以被與音調增益b一起進行編碼。
新的碼本搜尋一旦這個音調,或者LTP(長期預測)參數b,T,和j被確定了,下一個步驟就是通過圖1的搜尋模塊110來搜尋最佳的新激勵。首先,通過減去這個LTP的貢獻來更新這個目標矢量xx′=x-byT其中b是音調增益,yT是被濾波的音調碼本矢量(被延遲T的過去激勵被使用選擇的低通濾波器進行濾波,並且被與上面參考圖3所描述的脈衝響應h進行卷積)。
通過發現使在這個目標矢量與被縮放的被濾波碼矢量之間的均方誤差最小的最佳激勵碼矢量ck和增益g,來執行CELP中的這個搜尋過程E=‖x′-gHck‖2其中H是從這個脈衝響應矢量h推導出來的一個下三角卷積矩陣。
在本發明的優選實施方式中,通過如美國專利中所描述的一個代數碼本,在模塊110中執行這個新的碼本搜尋,這些美國專利包括1995年8月22日授權的5,444,816(Adoul等人);在1997年12月17日被授權給Adoul等人的美國專利號5,699,482;在1998年5月19日被授權給Adoul等人的5,754,976;和在1997年12月23日授權的5,701,392(Adoul等人)。
一旦這個模塊110選擇了最佳激勵碼矢量ck和其增益g,這個碼本索引k和增益g就被進行編碼並且被發送給復用器112。
現在參考圖1,在通過一個通信信道被發送以前,參數b,T,j, ,k和g通過復用器112被復用。
存儲器更新在存儲器模塊111(圖1)中,通過使用加權合成濾波器對這個激勵信號u=gck+bvT進行濾波,來更新被加權合成濾波器W(z)/ 的狀態。在這個濾波後,這個濾波器的狀態被記住,並且在下一個子幀時作為初始狀態使用來在計算器模塊108中計算零輸入響應。
與在目標矢量x的情形相同,可以使用其它替代的、但是在數學上與對該領域內普通技術人員眾所周知的方法等價的方法來更新這個濾波器的狀態。
解碼器側圖2的語音解碼設備200顯示了在數字輸入222(到解復用器217的輸入流)和輸出採樣語音223(加法器221的輸出)之間執行的各種步驟。
解復用器217從在一個數字輸入信道上接收的二進位信息中提取這些合成模型參數。從每一個接收的二進位幀中,被提取的參數是-短期預測參數(STP) (每幀一次);-長期預測參數(LTP)T,b,和j(對每一個子幀);和
-新的碼本索引k和增益g(對每一個子幀)。
目前的語音信號是基於這些參數而被合成的,這在下面將更詳細地描述。
新碼本218對這個索引k作出響應,來產生通過一個放大器224被放大了解碼增益因子g倍的新碼矢量ck。在這個優選實施方式中,如在上面所提到的美國專利號5,444,816;5,699,482;5,754,976;和5,701,392中所描述的一個新的碼本218被用於表示這個新的碼矢量ck。
在放大器224的輸出所產生的被縮放的碼矢量ck通過一個新的濾波器205被進行處理。
周期性的增強在放大器224的輸出所產生的被縮放的碼矢量通過一個與頻率相關的音調增強器205進行處理。
增強這個激勵信號u的周期性改善了濁音段的質量。在過去,這是通過使用形式為1/(1-εbz-T)的一個濾波器對來自新碼本(固定碼本)218的新矢量進行濾波而實現的,其中ε是在0.5以下的一個因子,它控制了所引入周期性的數目。在寬帶信號的情形下,這個方法不是很有效,因為它在整個頻譜範圍內引入了周期性。一個新的替代方法被公開了,它是本發明的一部分,由此通過使用一個新的濾波器205(F(z))來對來自新碼本(固定碼本)的新碼矢量ck進行濾波,而實現其周期性的增強,這個新濾波器205的頻率響應對高頻分量的加重比低頻分量高。F(z)的係數與激勵信號u的周期性的數目相關。
可以使用對該領域內普通接收人員眾所周知的很多方法來獲得有效的周期性係數。例如,增益b的值提供了一個周期性的指示。即,如果增益b的值接近1,激勵信號u的周期性就高,並且如果增益b的值比0.5小,然後周期性就低。
在一個優選實施方式中所使用的、用於推導濾波器F(z)係數的另一個有效的方法是將它們與音調對總激勵信號u的貢獻進行相關。這導致了與子幀周期性相關的一個頻率響應,其中對更高的音調增益來說,高頻分量被極大的加強(整體斜率更強)。當這個激勵信號u的周期性更強時,新濾波器205具有降低新碼矢量ck在低頻分量上的能量的效果,與高頻分量相比,這增強了激勵信號u在低頻部分的周期性。所建議的新濾波器205的形式是(1)F(z)=1-σz-1或者(2)F(z)=-αz+1-αz-1其中σ或者α是從激勵信號u的周期性程度推導出來的周期性因子。
第二個3項形式的F(z)被用於一個優選實施方式。在濁音因子產生器204中計算這個周期性因子α。可以使用幾個方法來根據激勵信號u的周期性推導出周期性因子α。下面顯示了兩個方法。
方法1首先,在濁音因子(voicing factor)產生器204中通過下面的關係計算音調對總激勵信號u的貢獻的比值Rp=b2vTtvTutu=b2n=0N-1vT2(n)n=0N-1u2(n)]]>其中vT是音調碼本矢量,b是音調增益,和u是在加法器219由下面的關系所給出的激勵信號uu=gck+bvT注意項bvT在音調碼本(音調碼本)201中的源與音調延遲T和被保存在存儲器203中的u的過去值相應。然後,使用一個低通濾波器202來處理來自這個音調碼本201的音調碼矢量vT,這個低通濾波器202的截止頻率可以通過來自解復用器217的索引j進行調節。然後,所產生的碼矢量vT被一個放大器226乘以來自解復用器217的增益b,以獲得信號bvT。
在濁音因子產生器204中使用下面的關係產生因子αα=qRp其約束條件是α<q其中q是控制增強數量的一個因子(在這個優選實施方式中,q被設置為0.25)。
方法2在本發明的一個優選實施方式中所使用的、用於計算周期性因子α的另一個方法在下面將被討論。
首先,使用下面的關係來在濁音因子產生器204中產生一個濁音因子rvrv=(Ev-Ec)/(Ev+Ec)其中Ev是被縮放的音調碼矢量bvT的能量,而Ec是被縮放的新碼矢量gck的能量。即Ev=b2vTtvT=b2n=0N-1vT2(n)]]>和Ec=g2cktck=g2n=0N-1ck2(n)]]>注意,rv的值在-1和1之間(1相應於純濁音信號(purely voicedsignal),-1相應於純清音(purely unvoiced)信號)。
在這個優選實施方式中,然後使用下面的關係來在濁音因子產生器204中產生一個濁音因子αα=0.125(1+rv)對純清音信號來說,這相應於一個值0,對純濁音信號來說,這相應於值0.25。
首先,在上面所描述的方法1和2中的,F(z)的兩個項形式,周期性因子σ可以被使用σ=2α來進行近似。在這樣一個情形下,在上面所描述的方法1中,如下面來計算周期性因子σσ=2q Rp其約束條件是σ<2q。
在方法2中,如下面的來計算周期性因子σσ=0.25(1+rv)所以,通過使用新濾波器205(F(z))來對被縮放的新碼矢量gck進行濾波,來計算這個被增強的信號cf。
加法器220這樣來計算被增強的激勵信號u′
u′=cf+bvT注意,在編碼器100中不執行這個過程。這樣,就需要使用沒有增強的這個激勵信號u來更新音調碼本201的內容,來在編碼器100與解碼器200之間保持同步。所以,這個激勵信號u被用於更新音調碼本201的存儲器203,並且被增強的激勵信號u′被用於LP合成濾波器206的輸入。
合成與去加重通過其形式為 的LP合成濾波器206來對被增強的激勵信號u′進行濾波,來計算被合成的信號s′,其中 是當前子幀中的內插LP濾波器。如從圖2中可以看出的,來自解復用器217的、在線225上的被量化LP係數 被提供到LP合成濾波器206,來相應地調節這個LP合成濾波器206的參數。去加重濾波器207是圖1中預加重濾波器103的逆。去加重濾波器207的轉移函數如下D(z)=1/(1-μz-1)其中μ是一個預加重因子,其值為0到1之間(一個典型的值是μ=0.7)。一個高階的濾波器也可以被使用。
矢量s′被通過去加重濾波器D(z)(模塊207)進行濾波,來獲得這個矢量sα,這個矢量通過高通濾波器208,來去除在50赫茲以下的、不希望有的頻率分量,並且進一步獲得sh。
過採樣與高頻再生過採樣模塊209執行圖1下採樣模塊101的逆過程。在這個優選實施方式中,過採樣將12.8kHz的採樣速率轉換為初始的16kHz的採樣速率,所使用的技術是該領域內普通技術人員眾所周知的。過採樣的合成信號被表示為。信號也可以被稱作被合成的寬帶中間信號。
過採樣合成信號不包括在編碼器100中進行下採樣過程中(圖1的模塊101)時所丟失的高頻分量。這給出了一個合成語音信號的低通感知。為了恢復原始信號的全頻帶,公開了一個高頻產生過程。這個過程是在模塊210到216,和加法器221中被執行的,並且需要來自濁音因子產生器204的輸入(圖2)。
在這個新方法中,通過使用在一個激勵域中被合適放大的一個白噪聲填充在頻譜的上部分,來產生高頻分量,然後高頻分量被轉換到語音域,優選使用用於合成下採樣信號的相同LP合成濾波器來對這個信號進行整形。
下面,描述根據本發明的這個高頻產生過程。
這個隨機噪聲產生器213產生其頻譜在整個頻譜帶寬內是平坦的一個白噪聲序列w′,所使用的技術是該領域內普通技術人員眾所周知的。所產生的序列的長度是N′,這是初始域中子幀的長度。注意,N是下採樣域內子幀的長度。在這個優選實施方式中,N=64和N′=80,這相應於5毫秒。
在增益調節模塊214中,白噪聲序列被正確地放大。增益調節包括下面的步驟。首先,所產生的噪聲序列w′的能量被設置成與一個能量計算模塊210計算的增強激勵信號u′的能量相等,並且所產生的放大噪聲序列如下w(n)=w(n)n=0N-1u2(n)n=0N-1w2(n),n=0,...,N-1]]>在增益伸縮中的第二步驟需要考慮在濁音因子產生器204的輸出上的被合成信號的高頻分量,以減少在濁音段的情形下(與清音段(unvoiced segment)相比,其中較少的能量出現在高頻分量上)所產生的噪聲能量。在這個優選實施方式中,通過使用一個頻譜傾斜計算器212來測量合成信號的傾斜,並且相應地減少其能量來實現對高頻分量的測量。其它步驟,例如零交叉步驟可以被平均地使用。當這個傾斜很強時,這與濁音段相應,就可以進一步減少噪聲能量。在模塊212中,傾斜因子被計算並且被作為合成信號sh的第一相關係數,表示為如下
條件是傾斜≥0和傾斜≥rv其中濁音因子rv如下rv=(Ev-Ec)/(Ev+Ec)其中Ev是被放大的音調碼矢量bvT的能量,並且Ec是被放大的新碼矢量gck的能量,如前面所描述的。濁音因子rv通常是比傾斜小的,但是這個條件被引入作為一個預防高頻音調的措施,其中這個傾斜值是負的並且rv的值比較大。所以,這個條件減少了這種音調信號的噪聲能量。
在平坦頻譜的情形下,傾斜值是0,在強濁音信號的情形下,傾斜的值是1,並且在大多數能量在高頻分量上的清音信號的情形下時,傾斜值是負的。
可以使用不同的方法來從高頻分量的數量推導伸縮因子gt。在本發明中,根據上面所描述的信號的傾斜,給出了兩個方法。
方法1伸縮因子gt是使用下面的關係從這個傾斜推導出的gt=1-傾斜 約束條件是0.2≤gt≤1.0對這個傾斜接近1的強濁音信號,gt是0.2,對強清音信號,gt是1.0。
方法2首先,這個傾斜gt被限制到大於0或者等於0,然後使用下面的關係從這個傾斜推導出這個伸縮因子gt=10-0.6傾斜所以,在增益調節模塊214中被產生的被縮放噪聲序列wg如下wg=gtw當這個傾斜接近0時,伸縮因子gt接近0,這不產生能量壓縮。當傾斜值是1時,伸縮因子gt能夠導致所產生的噪聲能量減少2dB。
一旦這個噪聲被正確的放大(Wg),它被使用頻譜整形器215而轉換到語音域中。在這個優選實施方式中,這是通過使用在下採樣域(1/A^(z/0.8))]]>中所使用的相同LP合成濾波器的一個帶寬被擴展的版本對噪聲wg進行濾波而實現的。在頻譜整形器215中計算相應的帶寬擴展LP濾波器係數。
然後,被濾波的、被縮放的噪聲序列wf被進行帶通濾波到所需要的頻率範圍,以使用帶通濾波器216被恢復。在這個優選實施方式中,帶通濾波器216將噪聲序列的頻率範圍限制到5.6-7.2kHz。所產生的帶通濾波噪聲序列z被在加法器221中相加到過採樣合成語音信號上,以在輸出223上獲得最後的重構聲音信號sout。
儘管,這裡已經通過本發明的一個優選實施方式,在上面對本發明進行了描述,但是可以在後附權利要求書的範圍內對本發明的這個實施方式進行修改,而不會偏離本發明的精神與本質。儘管這個優選實施方式討論了寬帶語音信號的使用,但是該領域內的技術人員很清楚,本發明也可以一般地用於使用寬帶信號的其它實施方式,並且這不需要局限於語音應用。
權利要求
1.一個音調分析設備,用於產生一個最佳音調碼本參數集合,包括a)至少兩個與相應的音調碼本參數相關的信號路徑,其中i)每一個信號路徑包括用於從一個音調碼本搜尋設備計算一個音調碼矢量預測錯誤的一個音調預測錯誤計算設備;和ii)兩個信號路徑中至少一個信號路徑包括一個濾波器,在將這個音調碼矢量提供到這個路徑的音調預測錯誤計算設備以前,這個濾波器用於對這個音調碼矢量進行濾波;和b)一個選擇器,用於比較在所述至少兩個信號路徑中所計算的音調預測錯誤,並且用於選擇具有最低計算音調預測錯誤的信號路徑,並且用於選擇與這個被選擇信號路徑相關的音調碼本參數集合。
2.如權利要求1的音調分析設備,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
3.如權利要求1的音調分析設備,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
4.如權利要求3的音調分析設備,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
5.如權利要求1的音調分析設備,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。6.如權利要求5的音調分析設備,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
7.如權利要求1的音調分析設備,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
8.如權利要求5的音調分析設備,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
9.如權利要求1的音調分析設備,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
10.一個音調分析方法,用於產生一個最佳的音調碼本參數集合,包括a)在與相應的音調碼本參數集合相關的至少兩個信號路徑中,對每一個信號路徑,計算一個音調碼本搜尋設備中一個音調碼矢量的一個音調預測誤差;b)在所述兩個信號路徑中的至少一個中,在提供所述音調碼矢量以計算所述一個路徑的所述音調預測誤差以前,對這個音調碼矢量進行濾波;和c)比較在所述至少兩個信號路徑中所計算的音調預測誤差,選擇具有最低計算音調預測誤差的信號路徑,並且選擇與被選擇信號路徑相關的音調碼本參數集合。
11.如權利要求10的音調分析方法,其中在所述至少兩個信號路徑的一個中,在將所述音調碼矢量提供到這個音調預測誤差計算設備以前,不對這個音調碼矢量進行濾波。
12.如權利要求10的音調分析方法,其中所述信號路徑包括多個信號路徑,其中在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前,在所述多個信號路徑的每一個中對這個音調碼矢量進行濾波。
13.如權利要求12的音調分析方法,進一步包括從包括低通濾波器與帶通濾波器的組中選擇出來所述多個路徑的濾波器,並且其中所述濾波器具有不同的頻率響應。
14.如權利要求10的音調分析方法,其中在每一個信號路徑中計算一個音調預測誤差包括a)將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
15.如權利要求14的音調分析方法,其中所述音調增益計算包括使用下面這個關係來計算所述音調增益b(j)b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
16.如權利要求14的音調分析方法,其中在每一個信號路徑中計算所述音調預測誤差包括計算相應音調預測誤差的一個能量,並且其中比較這個音調預測誤差包括對不同信號路徑的所述音調預測誤差的能量進行比較並且將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
17.如權利要求14的音調分析方法,其中a)多個信號路徑的所述濾波器中的每一個所述濾波器用一個濾波器索引來標識;b)用一個音調碼本索引來標識所述音調碼矢量;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
18.如權利要求10的音調分析方法,其中所述對這個音調碼矢量進行濾波的被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
19.一個編碼器,具有如權利要求1的一個音調分析設備,用於對一個寬帶輸入信號進行編碼,所述編碼器包括a)一個線性預測合成濾波器計算器,對這個寬帶信號作出響應,用於產生線性預測合成濾波器係數;b)一個感覺加權濾波器,用於對這個寬帶信號與線性預測合成濾波器係數作出響應,以產生一個感覺加權信號;c)一個脈衝響應產生器,用於對所述線性預測合成濾波器係數作出響應,以產生一個加權合成濾波器脈衝響應信號;d)一個音調搜尋單元,用於產生音調碼本參數,所述音調搜尋單元包括i)所述音調碼本搜尋設備,對這個感覺加權信號和這個線性預測合成濾波器係數作出響應,用於產生這個音調碼矢量和一個新的搜尋目標矢量;和ii)所述音調分析設備,對這個音調碼矢量作出響應,用於從所述音調碼本參數集合中選擇出與具有最低計算音調預測錯誤的這個路徑相關的音調碼本參數集合;d)一個新的碼本搜尋設備,對這個加權合成濾波器脈衝響應信號和這個新的搜尋目標矢量作出響應,用於產生新的碼本參數;和e)一個信號形成設備,用於產生包括與具有最低計算音調預測錯誤的這個路徑相關的音調碼本參數集合的一個編碼寬帶信號,並且這個新的寬帶編碼信號包括所述新的碼本參數,和所述線性預測合成濾波器係數。
20.如權利要求19的編碼器,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
21.如權利要求19的編碼器,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
22.如權利要求21的編碼器,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
23.如權利要求19的編碼器,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
24.如權利要求23的編碼器,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
25.如權利要求19的編碼器,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
26.如權利要求23的編碼器,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
27.如權利要求19的編碼器,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
28.用於向被劃分為多個小區的一個大的地理區域提供服務的一個蜂窩通信系統,包括a)移動發送器/接收器單元;b)蜂窩基站,相應地位於所述小區中;c)一個控制終端,用於控制在這些蜂窩基站之間的通信;d)在位於一個小區中的每一個移動單元與所述一個小區的這個蜂窩基站之間的一個雙向無線通信子系統,在這個移動單元與這個蜂窩基站中,所述雙向無線通信子系統包括i)一個發送器,包括如權利要求19的對一個寬帶信號進行編碼的一個編碼器和用於發送這個被編碼寬帶信號的一個發送電路;和ii)一個接收器,包括用於接收一個被發送的被編碼寬帶信號的一個接收器電路和用於對所接收的被編碼寬帶信號進行解碼的一個解碼器。
29.如權利要求28的蜂窩通信系統,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
30.如權利要求28的蜂窩通信系統,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
31.如權利要求30的蜂窩通信系統,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
32.如權利要求30的蜂窩通信系統,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
33.如權利要求32的蜂窩通信系統,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
34.如權利要求28的蜂窩通信系統,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
35.如權利要求32的蜂窩通信系統,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
36.如權利要求28的蜂窩通信系統,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
37.一個蜂窩移動發送器/接收器單元,包括a)一個發送器,包括如權利要求19的對一個寬帶信號進行編碼的一個編碼器和用於發送這個被編碼寬帶信號的一個發送電路;和b)一個接收器,包括用於接收一個被發送的被編碼寬帶信號的一個接收器電路和用於對所接收的被編碼寬帶信號進行解碼的一個解碼器。
38.如權利要求37的蜂窩移動發送器/接收器單元,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
39.如權利要求37的蜂窩移動發送器/接收器單元,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
40.如權利要求39的蜂窩移動發送器/接收器單元,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
41.如權利要求37的蜂窩移動發送器/接收器單元,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
42.如權利要求41的蜂窩移動發送器/接收器單元,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
43.如權利要求37的蜂窩移動發送器/接收器單元,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
44.如權利要求41的蜂窩移動發送器/接收器單元,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
45.如權利要求37的蜂窩移動發送器/接收器單元,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
46.一個蜂窩網絡部件,包括a)一個發送器,包括如權利要求19的對一個寬帶信號進行編碼的一個編碼器和用於發送這個被編碼寬帶信號的一個發送電路;和b)一個接收器,包括用於接收一個被發送的被編碼寬帶信號的一個接收器電路和用於對所接收的被編碼寬帶信號進行解碼的一個解碼器。
47.如權利要求46的蜂窩網絡部件,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
48.如權利要求46的蜂窩網絡部件,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
49.如權利要求48的蜂窩網絡部件,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
50.如權利要求46的蜂窩網絡部件,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
51.如權利要求50的蜂窩網絡部件,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
52.如權利要求46的蜂窩網絡部件,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
53.如權利要求50的蜂窩網絡部件,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
54.如權利要求46的蜂窩網絡部件,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
55.用於向被劃分為多個小區的一個大的地理區域提供服務的一個蜂窩通信系統,包括移動發送器/接收器單元;蜂窩基站,相應地位於所述小區中;一個控制終端,用於控制在這些蜂窩基站之間的通信在位於一個小區中的每一個移動單元與所述一個小區的這個蜂窩基站之間的一個雙向無線通信子系統,在這個移動單元與這個蜂窩基站中,所述雙向無線通信子系統包括a)一個發送器,包括如權利要求19的對一個寬帶信號進行編碼的一個編碼器和用於發送這個被編碼寬帶信號的一個發送電路;和b)一個接收器,包括用於接收一個被發送的被編碼寬帶信號的一個接收器電路和用於對所接收的被編碼寬帶信號進行解碼的一個解碼器。
56.如權利要求55的雙向無線通信子系統,其中所述至少兩個路徑中的一個沒有包括任何濾波器,來將所述音調碼矢量提供到這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
57.如權利要求55的雙向無線通信子系統,其中所述信號路徑包括多個信號路徑,其中每一個信號路徑被提供了一個濾波器,以用於在將所述音調碼矢量提供到相同路徑的這個音調預測誤差計算設備以前對這個音調碼矢量進行濾波。
58.如權利要求55的雙向無線通信子系統,其中所述多個路徑的濾波器被從包括低通濾波器與帶通濾波器的組中選擇出來,並且其中所述濾波器具有不同的頻率響應。
59.如權利要求55的雙向無線通信子系統,其中每一個音調預測誤差計算設備包括a)一個卷積單元,用於將這個音調碼矢量與一個加權的合成濾波器脈衝響應信號進行卷積,由此計算一個被卷積的音調碼矢量;b)一個音調增益計算器,用於對這個被卷積的音調碼矢量和一個音調搜尋目標矢量作出響應,計算一個音調增益;c)一個放大器,用於將這個被卷積的音調碼矢量與這個音調增益相乘,由此產生一個被放大的被卷積碼矢量;和d)一個組合器電路,用於將這個被放大的被卷積碼矢量與這個音調搜尋目的矢量組合在一起,由此產生這個音調預測錯誤。
60.如權利要求59的雙向無線通信子系統,其中所述音調增益計算器包括使用下面這個關係來計算所述音調增益b(j)的一個裝置b(j)=xty(j)/‖y(j)‖2其中j=0,1,2,…,K,並且K與信號路徑的數目相應,其中x是所述音調搜尋目標矢量,並且y(j)是所述被卷積的音調碼矢量。
61.如權利要求55的雙向無線通信子系統,其中每一個信號路徑的所述音調預測誤差計算設備包括用於計算相應音調預測誤差的一個能量的裝置,並且其中所述選擇器包括裝置,用於對不同信號路徑的所述音調預測誤差的能量進行比較並且用於將具有最低計算音調預測誤差能量的信號路徑選擇作為具有最低計算音調預測誤差的信號路徑。
62.如權利要求59的雙向無線通信子系統,其中a)多個信號路徑的所述濾波器中的每一個濾波器用一個濾波器索引來標識;b)所述音調碼矢量被一個音調碼本索引來標識;和c)所述音調碼本參數包括濾波器索引,這個音調碼本索引和這個音調增益。
63.如權利要求55的雙向無線通信子系統,其中所述濾波器被集成在所述音調碼本搜尋設備的一個內插濾波器中,所述內插濾波器被用於產生所述音調碼矢量的一個子採樣版本。
全文摘要
一個改善的、用於對一個寬帶信號,特別地但是不局限於一個語音信號,進行數字編碼,以發送或者保存,並且合成這個寬帶使用信號的音調搜尋方法與設備。能夠對這個語音頻譜的諧振結構有效地進行建立模型的這個新方法與設備使用了應用到一個音調碼矢量的、幾個形式的低通濾波器,並且選擇能夠實現較高預測增益的一個低通濾波器(即,最低音調預測誤差),並且轉發相關的碼本參數。
文檔編號H04Q7/22GK1328681SQ99813601
公開日2001年12月26日 申請日期1999年10月27日 優先權日1998年10月27日
發明者布魯諾·貝塞特, 雷德溫·薩拉米, 羅奇·勒福雷 申請人:沃斯艾格公司