在接收終端上提供分組的平滑自適應管理的方法和設備的製作方法

2023-05-03 11:43:31 3

專利名稱：在接收終端上提供分組的平滑自適應管理的方法和設備的製作方法
技術領域：
本發明主要涉及電信設備和終端，尤其涉及與分組交換網絡相連並能接收例如VoIP(藉助網際協議的語音傳遞)呼叫的含有語音的分組的終端。雖然在這裡主要是在接收與播出含有語音的分組的環境中進行描述的，但是本發明同樣適用於包含視頻信息的分組，並且一般來說，本發明適於傳遞按時間排序的內容的分組，其中所述內容預期會在一個實質連續和均勻的時間序列中(也就是以一種實質上不會中斷和不連續的方式)呈現給聽眾或觀眾。語音內容和視頻內容是按時間排序的內容中的兩種基本類型，但是所述內容並不局限於此。
背景技術：
在例如通用分組無線電系統(GPRS)的分組交換系統中，數據分組到達時間的變化所導致的不確定性有可能嚴重影響到系統性能。導致分組到達時間發生變化的原因包括網絡資源擁塞以及連續分組之間的路由改變。正如在VoIP系統中那樣，當分組包含語音數據以獲取連續語音輸出時，在數據分組接收機上，緩衝深度或緩衝延遲與分組到達時間的變化必須是成比例的。
常規的固定初始延遲數據緩衝器是可以在某種程度上消除這種改變的。然而，網絡狀態的變化有可能取決於網絡資源擁塞、接收終端位置以及網絡組件的具體實施方式
。對常規的(固定延遲)緩衝處理來說，該處理無法對不斷變化的網絡狀態作出反應。此外，在吞吐量始終很低的時候也無法防止接收機緩衝器下溢。
出於這些原因，如果希望在輸出語音的緩衝延遲以及最小中斷方面實現優化操作，那麼有必要引入某種自適應緩衝管理。這種緩衝管理應該能以一種儘可能平滑的方式來改變緩衝延遲。換句話說，與在很短的時間間隔中首先降低緩衝延遲，然後提升緩衝延遲，然後再次降低緩衝延遲……的情況相比，如果是在較長的時間間隔中以相同比率來改變緩衝延遲，那將是非常理想的。為了防止出現這些波動，有必要對現行的網絡狀態做出儘可能精密的估計。並且非常重要的是，為了完成這種估計，首先需要限定對其應該執行此類估計的重要網絡特性。
目前，在現有技術中至少有兩種緩衝管理技術是需要準確了解網絡的端到端延遲的Ramjee R.(1994)，「Adaptive Playout Mechanismsfor Packetized Audio Applications in Wide-Area Networks」，IEEE INFOCOM′94，The Conference on Computer CommunicationsProceedings，6月12～13日，Toronto，第2卷第680～688頁，Canada；以及Liang Y.J.(2001)，「Adaptive Playout SchedulingUsing Time-Scale Modification in Packet Voice Communications」，IEEE International Conference on Acoustics，Speech，and SignalProcessing Proceedings，5月7～11日，Salt Lake City，第3卷第1445-1448頁，USA。
由於當前無法準確了解網絡的端到端延遲，因此，目前提出了另一種不需要該信息的技術Telefonaktiebolaget LM Ericsson，「Adaptive Jitter Buffering」，WO00/42749。該方法嘗試在固定採樣間隔中估計網絡狀態。當中斷(延遲峰值)出現在相對較短的間隔中的時候，這種方法具有些許用途，然而，如果連續中斷之間的間隔大於採樣間隔，那麼有可能出現某個採樣間隔中沒有發生中斷的情況。這樣一來，與出現中斷時相反，控制機制將會減小緩衝延遲。現在，如果在下一個採樣間隔中出現中斷，那麼它會導致在語音中因為緩衝器下溢而出現不希望的中斷。在語音中斷之後，在後續採樣間隔中，緩衝延遲將會再次增大。可以預見的是，這種操作很容易致使控制機制不斷地降低/增大/降低緩衝延遲，而這將會導致播出速率發生不必要波動。此外，在執行緩衝延遲變更(採樣間隔)之前還必須累積固定數量的分組。而這將會導致分組達到某個降低速率時的反應時間減慢，並且由於緩衝延遲只在採樣間隔之後才會增大，因此上述情況還可能會增大中斷概率。在WO00/42749的方法中，緩衝器延遲的改變是通過丟棄或延遲分組來完成的，更具體地，這種改變是在靜默階段中通過添加或刪除包含靜默信息的語音幀來進行的。然而，僅僅添加或刪除靜默信息將會導致靜默階段與說話階段之間的時間關係改變，進而導致在句子乃至單詞之間不自然地出現很長或很短的靜默。靜默階段的持續時間有可能隨著句子或是隨著單詞的不同而改變，由此將會產生不自然的語音節奏。
通常，自適應緩衝管理應該是在需要時才應用的。在分組交換網絡中，這種狀態即為分組以突發形式到達並且在各個突發之間存在很長的(有可能是幾秒)延遲。如果長期到達間隔平均值與創建分組的速率相同，那麼上述狀態是不存在問題的。而這僅僅意味著接收機一端的物理緩衝器的大小應該足夠長，以便適應這種變化。儘管如此，在設計自適應管理的過程中還是必須對此加以考慮，這是因為語音的播出速率不應該在緩衝延遲波動的情況下出現令人感到煩惱的起伏。
由此可以了解，用於對包含語音或視頻信號的數據分組的到達時間的易變性進行處理的當前方法無法令人感到滿意，此外，當在VoIP以及基於數據分組的其他類型的網絡系統中提供自然發聲的語音時，當前方法無法徹底解決其中固有的問題。

發明內容
前述問題以及其他問題是根據本發明的當前優選實施例來克服的，其他優點也是根據本發明的當前優選實施例來實現的。
在這裡公開了一種用於與分組交換網絡相耦合，以便接收包含例如語音或視頻信息的按時間排序的內容的數據分組的方法和設備。根據一種用於對連接到分組網絡並能藉助IP來傳送語音的設備進行操作的方法，以及一種根據該方法來進行操作的設備，其中公開的是接收和緩衝那些包含了語音信息的數據分組；對語音信息進行解碼，以便獲取語音採樣；以及在產生語音播出信號之前緩衝所解碼的語音採樣，其中所解碼的語音採樣根據分組網絡的狀態而進行時間縮放，以便調整緩衝延遲以及改變語音播出速率，由此，無論所接收的數據分組的速率如何改變，都可以提供實質上連續的輸出語音信號。
在這裡還具有一個用於測量和估計數據分組到達延遲的實質上異步的組件，以及一個對所述異步組件的操作做出響應，從而控制緩衝延遲的實質上同步的組件，其中緩衝延遲是基於每一個語音幀間隔(例如在每一個20ms的間隔)中確定的縮放比率而以同步方式控制的。
接收機分組緩衝器的緩衝延遲是作為指定的分組播出時間與分組到達時間之間的差值確定的，並且該方法還包括修改關於緩衝延遲、分組中斷延遲以及分組到達間隔的估計，其中所述估計是根據測量得到的緩衝延遲以及到達間隔來更新的。
在本優選實施例中，該方法估計緩衝延遲等於虛擬播出點與分組創建間隔次數(輸入分組序列號，小於第一個分組的序列號)之和減去輸入分組的到達時間。在一個會話中，端到端延遲會因為語音或其他信號的時間縮放、緩衝溢出或是緩衝下溢而改變，而虛擬播出點也會發生變化。這其中的一個結果是導致在不穩定的間隔上播出分組。為了簡單起見，所有的端到端延遲變化都可以與一個被定義為是虛擬播出點的變量相關聯。實質上，如果在穩定的間隔上播出剩餘分組，但卻仍舊導致產生與實際非穩定播出分組時的情況相同的端到端延遲，那麼該虛擬播出點是一個本該用於會話中的第一個分組的播出點。
優選地，解碼處理包括檢測所接收的語音幀的類型是壞幀、非幀或好幀中的哪一種，並且只有在檢測出所接收到的語音幀是好幀的時候才會執行時間縮放。「壞幀」可以視為是不能使用的幀，這是因為它會因為滯後到達或是因為內容錯誤而被丟棄。「非幀」狀態表示緩衝器是空的，而「好幀」狀態則意味著從緩衝器中提取了一個有效的幀。
本發明的一個特徵在於分組到達間隔平均值以及中斷平均值這兩個與分組吞吐量相關聯的概念是單獨對待的。與常規方法相比，藉助於這種單獨處理，有可能減少縮放比率的波動。同時由於估計了到達間隔平均值，因此可以更精確地將縮放比率設定成某個值，使得在網絡鏈路具有始終很低或很高的分組吞吐量的時候緩衝延遲基本保持恆定。
在本發明中，通過使用關於網絡狀態參數的指數估計，可以避免使用如WO00/42749中提出的常規的採樣間隔。此外，在連續中斷之間的間隔相對較長的時候，會話中的中斷延遲估計能夠保持基本連續的語音。

通過結合附圖來閱讀下文中關於優選實施例的詳細描述，可以更清楚地了解這些教導的前述及其他方面，其中圖1是根據本發明的自適應分組緩衝管理系統的高級圖示；圖2表示了圖1所示的延遲測量塊所執行的延遲測量處理；圖3顯示了圖1中的延遲估計塊所執行的延遲估計處理；圖4表示了圖1中的緩衝延遲控制塊的結構；圖5表示了圖4中的確定縮放比率塊的整體結構和操作。
圖6表示了根據所需要的播出點變化的示範性縮放比率偏移；圖7表示了圖1中的時間縮放塊的整體結構和操作；圖8是用於實施圖1～7中所示發明的移動站和無線網絡的簡化框圖；圖9A和9B分別是繪製了延遲與分組編號的對比關係，尤其是繪製了絕對網絡延遲的示範值以及緩衝延遲的圖表；以及圖10是在說明虛擬播出點變化時所使用的圖示。
具體實施例方式
在詳細論述本發明之前，首先在這裡為本發明定義若干術語和短語。
縮放比率是所縮放的時間(time scaled)與原始信號長度之比。
時間縮放是這樣一種操作，其中根據一個希望的縮放比率而刪除或複製輸入採樣，以使輸入與輸出採樣數量之間的比率與預期的縮放比率相對應。在執行語音採樣的時候，其中將會顧及到語音的強周期性，以使頻譜信息不會發生根本上的變化。時間縮放可以在複製或刪除一個或多個周期的時候實現。此外，時間縮放也可以視為是在語音中的靜默間隔中添加或刪除靜默信息。
語音分組是一種數據結構，其中包含了與一個或多個語音幀相對應的經過編碼的參數。
解碼塊是一個功能單元，它從每一個語音幀的語音分組中提取經過編碼的參數，並且根據所提取的參數來執行解碼處理(例如AMR或GSM)。
中斷延遲是連續分組之間的延遲，該延遲足夠長，由此可以將其視為是分組到達中的一個中斷。
播出點是從分組緩衝器中提取出分組的第一幀的時刻。
虛擬播出點(參見圖10)在一個會話中發生變化，其中端到端延遲會因為語音的時間縮放、緩衝器溢出或是緩衝器下溢而改變。這樣一個結果是在不穩定的間隔中播出分組。為了簡單起見，所有端到端延遲變化可以嵌入或是關聯於一個被定義為虛擬播出點的變量。實質上，如果在穩定的間隔上播出剩餘分組，但卻仍舊導致與實際不穩定地播出分組時的情況相同的端到端延遲，那麼該虛擬播出點是一個本該用於會話中的第一個分組的播出點。
緩衝延遲是在播出分組中的第一個幀之前所述分組停留在分組緩衝器中的時間周期。換句話說，緩衝延遲是分組中的第一個幀的播出點與該分組的到達時間之間的時間。
正如上文中所指出的那樣，雖然下文中的描述是在對包含了語音信息的數據分組進行接收的環境中進行的，但是應該了解，非常有利的是，本發明也可以與包括視頻信息在內的其他類型的數據分組內容結合使用。在視頻信息的情況下，下文中描述的時間縮放操作可以通過插入或刪除視頻幀或採樣來執行。如果視頻和音頻部分是被獨立控制的，那麼可以通過使每一個部分的虛擬播出點保持相等來實現聲像吻合。
作為引言，在本發明的當前優選實施例中，其中使用了時間縮放方法來執行分組緩衝延遲中的改變，該方法提供了改變語音播出速率的可能性，而沒有在語音的頻譜或頻率內容中引入顯著的變化。
根據本發明，在第一個分組到達之後即可開始播出語音幀。因此，初始緩衝延遲為零，並且該延遲會在需要的時候增大，以便適應分組到達過程中的變化。作為選擇，所述播出的開始時間也可以延遲，直至初始緩衝延遲足夠大為止。在播出語音的過程中，通過對分組吞吐量中的變化做出反應，可以將緩衝延遲保持在預期的等級。優選地，對緩衝延遲的控制是以網絡特性估計為基礎的，並且所述反應是通過修改播出語音的速率而產生的。優選地，這種修改是通過使用一種時間縮放方法來完成的。此外，如下文中詳細描述的那樣，整個自適應緩衝管理包含了兩個主要的組件，其中一個是異步的，另一個則是同步的。
簡要的說，只有在分組到達的時候才會執行異步組件，因此，該組件是以一種與系統操作異步的方式執行的(假設分組到達時間與系統操作是異步的)。在分組到達的時候，該分組將會保存在分組緩衝器中，並且這時將會為這個分組測量緩衝延遲，其中所述緩衝延遲是分組的播出時間點與分組的到達時間之間的差值。在進行了這個測量之後，關於延遲(緩衝延遲、中斷延遲、到達間隔)的估計將會更新。同步組件是在長度為一個語音幀的同步間隔上執行的，其中舉例來說，對於AMR或GSM語音幀的是大小為20s的間隔。所使用的估計則用於控制緩衝延遲，以使緩衝延遲保持在一個足夠大的等級上，從而與分組到達變化相適應。這種情況下的控制機制提供了與時間縮放相關聯的信息，以便確定縮放信號的比率。此外，在每一個間隔中，執行語音解碼操作的次數取決於所請求的播出速率。
圖1是根據本發明的自適應分組緩衝管理系統10的高級圖示。圖1中的圖示可以視為是對硬體(HW)框圖、軟體(WS)流程圖進行描述，或者最好將其視為是對HW與SW的組合進行描述。應該指出的是，由於分組到達時間是可以優先獲得的信息，因此，SW實體自身需要基於HW或SW的時鐘11。時鐘11可以作為一個在20ms的間隔(也就是以創建用於編碼的語音幀的速率)上遞增的計數器來加以實現，然而如果希望得到的是更精確的定時，那麼時鐘11也可以作為一個更精確的SW計數器或是HW時鐘來實現。此外，較為優選的是，語音分組是在發送方按順序編號的。
在這裡設想自適應分組緩衝管理系統10包含了一個異步部分或組件10A，以及一個同步部分或組件10B。優選地，語音幀的播出是在第一個語音分組到達之後立即開始的。因此，初始緩衝延遲為零，並且它會在一個語音會話中增大，以便覆蓋分組到達時間的變化。此外，通過對分組吞吐量的變化做出反應，可以將緩衝延遲保持在希望的等級。這個處理則是通過使用語音信號的時間縮放來完成的，其中所述時間縮放能夠改變播出語音的速率。
如上所述，只有在分組到達的時候才會使用異步組件10A。在分組到達的時候，該分組將會在分組到達或會話中斷塊13的控制下置入分組緩衝器12，並且緩衝延遲是在塊14中測量的。在執行了這個測量之後，塊16將會更新這些估計(緩衝延遲、中斷延遲、到達間隔)。而等式(1)則可用於為輸入分組計算緩衝延遲緩衝延遲＝虛擬播出點+分組創建間隔×(輸入分組序列號-第一個分組的序列號)-輸入分組的到達時間(等式1)在對信號進行時間縮放的時候，虛擬播出點也會產生相應的變化。
如上所述，對同步組件10B來說，其中在塊18的緩衝延遲控制中使用了這些估計，以便將緩衝延遲保持在一個足夠大的值，從而適應於分組到達過程中的變化。控制塊18向解碼塊20提供一個用於指示解碼數量的輸出18A，並且向時間縮放塊22提供一個縮放比率輸出18B(經過縮放的信號長度與原始信號長度之間的比率)。舉例來說，如果所允許的比率介於0.5與2.0之間，那麼在一個單獨的20ms的間隔中，解碼次數可以是0、1或2次。一旦對採樣進行了時間縮放，那麼它們將被置入一個縮放緩衝器24。該縮放緩衝器24的充滿度是根據所使用的縮放比率而改變的，由此，控制塊18將會使用縮放緩衝器24的當前大小(與當前條目的數量相對應)(由箭頭24A指示)，以便確保每20ms都會向音頻緩衝器26提供至少160個採樣，此外還確保縮放緩衝器24不會溢出。在這種情況下，當在8,000Hz的頻率上採樣語音信號的時候，160個採樣與20ms的幀持續時間是對應的(也就是說，8,000Hz×0.02s＝160)。在每一個20ms的間隔中，會向音頻緩衝器26傳送語音信號的106個採樣，以便進行進一步的處理。由此，整個自適應處理對於其後進行的任何音頻處理而言都是透明的。
應該指出的是，在這裡對於20ms的間隔以及160個採樣的引用都是示範性的，這是因為這些數值分別代表了關於常規語音幀的創建時間以及語音幀中的採樣數量的示例。
如來自時間縮放塊22的輸出信號22A所示，在對信號進行時間縮放或者是緩衝器下溢或溢出的時候，虛擬播出點將會產生相應的變化。如果在分組緩衝器12中沒有分組並且下一個分組尚未到達，那麼將會出現緩衝器下溢的情況。由此，緩衝器12的下溢將會延遲下一個分組的播出點，並且可以將其視為是通過時間縮放(插入語音幀)延長了語音信號。當在緩衝器12上沒有剩下可用空間並且最近到達的一個或多個分組將要重寫最早的一個或多個分組的時候，這時將會出現緩衝器溢出。在這種情況下，通常較為優選的是跳過至少一個分組的播出，由此可以保持與輸入分組相同步。跳過分組序列號的處理可以視為是通過時間縮放(刪除語音幀)來縮短語音信號。
在解碼塊20上檢測的所接收的語音幀的類型可以是壞幀、非幀(也就是緩衝器下溢或非幀)或好(有效)幀中的某一種。在確定是否應該對某個幀進行時間縮放的時候，時間縮放塊22將會使用這個信息，並且該信息是由解碼塊20的輸出20A提供的。只有在將幀類型指示成好幀的時候才會執行時間縮放。優選地，對一個被指示為壞幀的幀來說，由於所述幀代表的是語音信號中的不連續性，因此不會對其進行時間縮放。此外，由於在緩衝器12下溢的時候使用塊22的時間縮放算法是沒有意義的，因此不應該對非幀執行時間縮放。
圖2表示的是圖1中的延遲測量塊14所執行的整個延遲測量處理。在這裡為每一個到達的分組測量了分組緩衝器12的延遲(緩衝延遲)(14B)。如果在語音會話中存在中斷，那麼在對該中斷做出響應(參見圖5中關於響應的描述)之前將會更新緩衝延遲。這樣一來，緩衝延遲將會與當前的分組到達情形相對應。此外，在這裡還會測量分組的到達間隔(14C)。而虛擬播出點則是通過向當前虛擬播出點值中添加虛擬播出點變化(如時間縮放決22的輸出22A所示)來更新的(14A)。如上所述，虛擬播出點是本來應該播出第一個分組的時間，因此可以用上文中給出的等式(1)來為輸入分組計算緩衝延遲。
如果通過計算緩衝器12中的分組數量而測量了緩衝延遲，那麼在分組丟失的情況下以及分組以序列號順序之外的其它順序到達的情況下，該結果將會是不準確的。由此優選使用一種不同的方法，該方法在此類環境中是非常準確的。
此外，就此而論，圖9A和9B分別顯示了關於絕對網絡延遲以及緩衝延遲的實例。可以看出的是，緩衝延遲與網絡延遲是成反比的，並且這兩個測量由此都會包含與延遲變化相關的信息。在為後續分組計算播出點的時候，其中將會使用第一個分組的播出點(參見圖10)。對第i個分組來說，其播出點是Tpi，n＝Tc*(Ni-Nl)+Tpl，n，其中i是接收分組的編號，n是播出點變化的編號，Tc是分組的創建間隔，以及Ni是第i個接收分組的序列號。那麼，對第i個分組而言，其緩衝延遲是di＝Tpi，n-Tai，其中Tai是第i個分組的到達時間。
在本發明的當前優選實施例中，為使塊14能夠測量緩衝延遲，其中使用了輸入分組的到達時間、序列號以及創建間隔。
在上文中，緩衝延遲是相對於等式(1)來顯示的，而到達間隔則可以使用以下的等式(2)來進行測量(2)到達間隔＝輸入分組的到達時間-先前到達的分組的到達時間圖3顯示的是圖1中的延遲估計塊16所執行的整個延遲估計處理。通常，在更新延遲估計的時候要考慮兩種獨立的主要情況。第一種情況是在沒有分組到達並且自先前分組到達(塊16A和塊16B)之後經過了一定的時間的時候調用延遲估計(塊16)功能，其中所述時間是分組創建間隔的兩倍(例如2×20ms＝40ms)。在檢測到中斷的時候，這時將會測量緩衝延遲，而這相當於有一個分組到達並且該分組的序列號與先前到達的分組的序列號(加1)相同。在這種方式中，緩衝延遲為如同下一個分組將會在該特殊時間到達一樣的延遲。優選地，緩衝延遲平均值將會復位到最後測得的緩衝延遲的值，並且這樣一來，緩衝延遲平均值將會等於當前的緩衝延遲，而平均偏差則不會得到更新。通過對這種情況加以考慮，可以確保在檢測到會話中斷的時候將緩衝延遲平均值復位到緩衝延遲的當前值。當在確定中斷的過程中使用縮放比率的時候，就需要用到經過更新的緩衝延遲值。
第二種情況是在新分組到達的時候調用延遲估計(塊16)功能。在塊16C，其中將會確定在連續分組之間是否存在足夠大的延遲，這樣一來，如果到達間隔大於分組創建間隔的兩倍，那麼該延遲可以視為是一個中斷。
如果在分組到達過程中存在中斷，那麼在塊16D中將會通過使用指數平均來更新中斷延遲估計，並且在塊16F上會將緩衝延遲平均值復位成緩衝延遲的當前值，由此所述平均值將會立即開始進行新的測量。而平均偏差則不會更新，此外到達間隔平均值也不會更新。
返回到塊16E，如果沒有出現中斷，那麼將會通過使用指數平均來更新到達間隔平均值。在塊16G，其中將會判定估計模式是峰值(spike)模式還是正常模式。如果到達間隔平均值小於創建間隔，則將該模式視為峰值模式。如果將模式視為是峰值模式，那麼緩衝延遲將會復位到最後測得的值(塊16F)，並且平均偏差是不會更新的。優選地，如果到達間隔平均值小於創建間隔，則不會更新平均偏差，因為這樣做將會不必要地增大所需要的緩衝延遲(參見下文中的等式(11))。如果分組到達模式不是峰值模式，即該模式是正常模式，那麼在塊16H上將會通過使用指數平均來更新緩衝延遲平均值以及平均偏差。
非常重要的是，到達間隔平均值並不與實際到達間隔平均值相對應，這是因為其中並未對中斷加以考慮。因此，它可以被視為是關於中斷之間的到達間隔平均值的記錄或記憶。藉助這種方式，可以將兩個影響緩衝延遲狀態的重大問題分離開來。也就是說，鏈路接通時的分組到達間隔與鏈路(臨時)斷開時由中斷引入的延遲是相互分離的。而這種方法恰恰與分組交換網絡的特性相對應，在所述網絡中往往存在這樣一種情況，即分組到達時隔平均值與分組到達過程中出現中斷之前的值是基本相等的。
現在將對塊16H的功能(更新緩衝延遲估計)進行更詳細的描述。當第一個分組到達的時候，緩衝延遲估計將被設置為零。此後，緩衝延遲平均值以及平均偏差(MD)將會通過使用下列等式(3)、(4)和(5)而被更新。應該指出的是，這些等式中顯示的值僅僅是建議，等式(6)、(8)和(9)中的值同樣也是如此，所使用的實際值則是收斂率與精確度之間的一種折衷。此外還應該指出，在計算平均偏差的時候將會用到緩衝延遲平均值。
(3)緩衝延遲平均值＝0.25×緩衝延遲+0.75×緩衝延遲平均值；(4)緩衝延遲MD＝0.125×|緩衝延遲-緩衝延遲平均值|+0.875×緩衝延遲MD。
如果復位緩衝延遲平均值，那麼可以通過使用等式(5)而將緩衝延遲平均值設置成緩衝延遲的當前值。平均偏差則不會發生變化。
(5)緩衝延遲平均值＝緩衝延遲現在將對塊16E的功能(更新到達間隔平均值)進行更詳細的描述。到達間隔平均值僅僅在沒有出現中斷的時候才會更新。這其中首先將會進行檢查，以便確定是否應該初始化所述到達間隔平均值。如果應該的話，那麼作為選擇，在這裡可以對其進行設置，使之與第一個到達分組的創建時間相對應，或者也可以根據第一和第二個到達的分組之間的到達間隔來對其進行設置。優選地，該平均值是通過如等式(6)中那樣使用指數平均來更新的(6)到達間隔平均值＝0.125×到達間隔+0.875×到達間隔平均值。
現在將對塊16D的功能(更新中斷延遲估計)進行更詳細的描述。如等式(7)所示，所述中斷延遲是最後測得的到達間隔與分組創建間隔之間的差值(7)中斷延遲＝到達間隔-分組創建間隔。
在這裡將會測試是否應該對中斷延遲估計進行初始化。如果中斷延遲平均值為零，則對該估計進行初始化。如果進行初始化，那麼中斷延遲平均值將被設置成最後測得的中斷延遲，並且平均偏差將被設置為零。如果不進行初始化，則根據等式(8)和(9)並且通過使用指數平均來更新這些估計(8)中斷延遲平均值＝0.25×中斷延遲+0.75×中斷延遲平均值；(9)中斷延遲MD＝0.125×|中斷延遲-中斷延遲平均值|+0.875×中斷延遲MD。
通常情況下，網絡環境在連續的語音會話之間是保持相對穩定的，由此在後續的語音會話中可以使用這些中斷延遲估計(至少是在最開始的時候)。然而，如果在語音會話過程中沒有出現中斷，那麼最好將該平均值減半，使之最終收斂為零。優選地，如果在會話過程中沒有出現中斷，則立即將平均偏差設置為零。這樣可以確保在狀態改善的時候使中斷延遲估計與改善的狀態相對應。優選地，所述會話足夠長，以便能夠將所述估計減半，由此，如果會話的持續時間很短，以至於沒有發生中斷，那麼不會無意義地將所述平均值減半。其中舉例來說，有效會話的長度可以是至少5秒左右，其中將所述估計減半的處理可以在所述有效會話之後進行。
現在將結合圖4來對圖1中的塊18的功能(緩衝延遲控制)進行更詳細的描述，其中圖4顯示的是用於緩衝延遲的控制結構。在塊18C中，解碼次數是在每個20ms的間隔上確定的。塊18C與確定縮放比例塊18D進行協作，在下文中將會參考圖5來詳細描述所述塊18D。縮放緩衝器的大小(來自縮放緩衝塊24的輸出24A)被用於確保在進行時間縮放之後始終至少存在某個預定數量的採樣(例如160個採樣)，但是不會超過縮放緩衝器24可以保持的採樣數量。如果縮放緩衝器24的當前大小(也就是存儲容量)是至少160個採樣，那麼在塊20中沒有必要執行解碼操作。如果只有不到160個採樣，並且如果縮放比率至少為1，那麼可以確定的是，對每一次解碼處理而言，在進行了時間縮放22之後始終存在至少160個採樣，由此，塊20將會執行一次解碼操作。如果只有不到160個採樣，並且如果縮放比率小於1，那麼每一次時間縮放將會產生不到160個採樣，並且由此將會執行兩次解碼處理。這樣則表明，應為縮放緩衝器24保留的最大大小是480個採樣(也就是60ms)。
現在將結合圖5來描述圖4中的確定縮放比率塊18D的操作，其中圖5顯示的是確定縮放比率塊18D的整體結構和操作。正如在塊19A所確定的那樣，確定縮放比率的方式取決於會話是否曾經中斷過。首先，在這裡將要描述的是如何在會話當前並未中斷的情況下確定該比率(塊19B、19C、19D以及19E)。
如上所述，縮放比率是經過縮放的信號長度與原始信號長度之間的比率，並且在塊19B中首先會相對於到達間隔平均值並以等式(10)的方式來對其進行設置，從而確定該比率(10)縮放比率＝到達間隔平均值/分組創建間隔由於語音是以一個與其到達速率相同的速率來播出的，因此，通過使用藉助等式(10)獲取的縮放比率，可以使緩衝延遲保持恆定(對這種情況而言，假設在分組到達過程中沒有發生中斷)。
為了促使緩衝延遲收斂到某個希望的值，在縮放比率中添加了一個偏移，該偏移值是所需要的播出點變化量的函數。首先，所需要的緩衝延遲是根據等式(11)獲取的(11)所需要的緩衝延遲＝中斷延遲平均值+B×中斷延遲MD+C×緩衝延遲MD。
在等式(11)中，關於常量B和C的值的設置是保護延遲與端到端延遲之間的一個折衷。例如，對於B和C來說，它們的一個適當的值可以是3。然而，所需要的緩衝延遲的最大值不應該大於緩衝器的物理大小所允許的最大值。
然後，由塊19C根據等式(12)來確定所需要的播出點變化(12)所需要的播出點變化＝所需要的緩衝延遲-緩衝延遲平均值。
由於緩衝延遲平均值比當前緩衝延遲更為穩定，並且預期目標是促使縮放比率儘可能穩定(無波動)，因此較為優選的是使用所述緩衝延遲平均值。
通過使用所需要的播出點變化，塊19D可以對縮放比率進行調整，以使偏移量與所需要的數量相關。圖6表示所需要的播出點變化如何影響縮放比率調整。舉例來說，如果所需要的播出點變化是0.08s，那麼從到達間隔平均值中計算的縮放比率將會遞增一個大小為0.25的偏移。界限+0.25之間的區域表示的是一個遲滯區域。遲滯區域越寬，縮放比率的波動就越小，然而獲取所需要的緩衝延遲的精度也會越低。因此，圖6所示的具體的值有可能需要一種依賴於本發明的實施細節的調整。
對於上文所述的縮放比率偏移確定過程來說，其中存在一種異常。
如果到達間隔平均值小於0.75，那麼即使所需要的播出點變化大於零，縮放比率也會小於1.00。然而在這種情況下，由於網絡側的緩衝器下溢，因此很有可能出現中斷，由此，當所需要的播出點變化大於零的時候，語音播出速率不應小於1.00。為了防止出現這種情況，如果所需要的播出點變化大於零，那麼較為優選的是將縮放比率的下限設置成1.00(塊19E使縮放比率的限度與某個合理的值相適應)。
再次參考圖5，尤其是塊19A，現在將要描述的是如何在會話中斷的情況下確定縮放比率。如果已經得知用於當前語音會話的最後一個分組已經到達(塊19F)，那麼縮放比率最大應該為1.00，並且在塊19G中將其設置成1.00、如果希望將端到端延遲減至最小，那麼同樣應該在當前語音會話的末端將縮放比率設置成小於1.00。
假設會話中的最後一個分組尚未到達，在塊19H中，其中將會確定中斷延遲估計是否為零，如果為零的話，那麼在塊19I，縮放比率將被設定成某個最大可允許值(例如2.00)。這樣一來，如果沒有關於分組到達中斷的在先估計，那麼分組緩衝器12下溢的可能性將會降低。在塊19H，如果中斷估計不等於零，那麼在塊19J，縮放比率是根據等式(13)來設定的(13)縮放比率＝(所需要的緩衝延遲-分組創建間隔)/緩衝延遲平均值。
這樣做將會設定縮放比率，使之覆蓋中斷的平均值。
這時可以假設當前語音會話已經中斷了一段時間，這段時間與分組創建間隔是對應的。實際上，分組在兩倍於分組創建間隔的時間中均未到達，但是正如正常情況中一樣，在這裡並未將第一個間隔計算進來。此外，正如以上在圖3的描述中論述的那樣，此時的緩衝延遲平均值與當前的緩衝延遲是對應的。
只有在所需要的緩衝延遲與分組創建間隔之間的差值大於緩衝延遲平均值的時候，才有必要使用等式(13)，否則縮放比率將被設定成1.00。優選地，只有在中斷的開端才會設置縮放比率，並且所述縮放比率會在中斷的持續過程中得到保持。這樣一來，在頻繁出現中斷的情況下可以確保語音信號的播出速率保持相對恆定。
優選地，在塊19E上將縮放比率限定到適當的值，例如0.5與2.00之間的值，由此不會發現令聽眾感到不快的語音播出速率。然而，縮放比率的確切值最好通過經驗來確定，並且有可能是取決於聽眾的。
如先前所述，到達間隔平均值與所需要的播出點變化的組合將會防止縮放比率出現不必要的波動。這種處理可通過使用若干個實例來加以說明。首先，假設在中斷之後跟隨了一個快速鏈路，其次，假設中斷之後跟隨了一個慢速鏈路，第三，假設中斷之後跟隨了一個正常鏈路。
在第一種情況中，分組到達間隔被認為是很快的，相應地，縮放比率要小於1。由於緩衝延遲會在中斷過程中減小，因此所需要的播出點變化將會大於零，這樣一來，縮放比率的最小值等於1。由此，非常明顯的是，由於分組到達速率要高於播出這些分組的速率，因此，緩衝延遲會朝著適應平均中斷所需要的某個值增加。在出現中斷的時候，如果當前的緩衝延遲足以覆蓋平均中斷的持續時間，那麼語音信號將是以1.00的比率播出的。
在第二種情況(慢速鏈路)中，到達間隔平均值將會導致縮放比率大於1，並且大於0.06s的必要播出點變化將會強化這種情況，由此緩衝延遲會開始朝著希望值移動。這樣一來，可以推斷的是，在中斷過程中以及中斷之間，縮放比率將會保持大於或等於1。
在第三種情況(正常鏈路)中，到達間隔平均值與創建間隔是相等的，因此，相應地，縮放比率也是一致的。然而，如果所需要的播出點變化大於0.06秒，那麼最終的縮放比率是1.25。同樣，緩衝延遲將會開始朝著某個希望值增加。
圖7更詳細地表示了圖1中的時間縮放塊22。適合的時間縮放算法包含了以下文獻所公開的算法，但是並不局限於此Wayman J.L.(1988)，「Some Improvements on the Synchronized-overlap-addMethod of Time Scale Modification for Use in Real-time SpeechCompression and Noise Filtering」，IEEE Transactions onAcoustics，Speech and Signal Processing，1月，第36卷第139～140頁；Verhelst W.(1993)，「An Overlap-add technique Basedon Waveform Similarity(WSOLA)for High Quality Time-scaleModification of Speech」，IEEE International Conference onAcoustics，Speech，and Signal Processing，4月27～30日，Minneapolis，第2卷第554～557頁，USA；以及Stenger A.(1996)，「A New Error Concealment Technique for Audio Transmission withPacket Loss」，European Signal Processing Conference，Trieste，9月10～13日，第1965～1968頁，Italy。
以上描述的時間縮放算法的各種具體優化方式都是可以使用的，但是常規算法同樣是可以使用的。
選定的時間縮放算法是根據縮放比率來修改信號的(參見圖5)。在輸入信號中，其中刪除或再生(複製)了一定數量的採樣，以使輸入與輸出信號長度之間的比率與所需要的縮放比率相對應(塊22B)。在塊22C中，通過根據刪除或複製的採樣數量來修改虛擬播出點變化(圖1中的輸出22A)，可以使定時保持一致。如果圖1顯示的輸入20A所指示的解碼幀的類型是非幀或壞幀，則使之經過比率為1.00的時間縮放算法。縮放緩衝器24的下溢將會導致無幀狀態，並且它會將下一個分組的播出點向前移動20ms，由此將這種處理視為是對語音信號執行了大小為160次採樣的時間縮放，並且在塊22C中將會以等價方式來修改虛擬播出點變化。
在每一次調用塊22中的時間縮放算法之後，輸出採樣將被輸入到縮放緩衝器24。在最後一次為當前的20ms間隔調用了時間縮放算法之後，所述縮放緩衝器中的最早的160個採樣將會移動到音頻緩衝器26中，以便進行進一步處理。
圖8顯示的是適合實施本發明的無線通信系統50的非限定性實施例的簡化框圖。無線通信系統50包括至少一個移動站(MS)100。此外，圖8還顯示了一個示例性的網絡運營商60，其中舉例來說，該運營商具有一個用於與例如公共分組數據網絡或是PDN之類的電信網絡相連的節點30，至少一個基站控制器(BSC)40或等價設備，以及多個基站收發信臺(BTS)50，這些基站收發信臺也稱為基站(BS)，它們將會根據預定的空中接口標準而在連至移動站100的前向或下行鏈路方向上向移動站100傳送物理和邏輯信道。從移動站100到網絡運營商的反向或上行鏈路通信路徑同樣是存在的，該路徑傳送的是移動站發出的接入請求或業務量。小區3與每一個BTS50相關聯，其中在任何指定時間都會將某一個小區視為是服務小區，而將一個或多個鄰接的小區視為是相鄰小區。此外，更小的小區(例如微微小區)也是可以使用的。
空中接口標準可以遵照任何一種適當的標準或協議，並且允許提供語音和數據業務量，例如接入具有數據業務量能力的網際網路70以及Web頁下載。在本發明的當前優選實施例中，空中接口標準是一個能使MS100實現VoIP功能的標準，由此，假設來自網際網路70的IP分組包含了用於在MS100上回放的語音信號採樣(也就是VoIP分組55)。然而，如先前所述，到來的IP分組有可能包含其他信息，例如視頻信息。
通常，移動站100包含了控制單元或是控制邏輯，例如輸出與顯示器140的輸入相耦合併且輸入與鍵盤或數字鍵盤160的輸出相耦合的微控制單元(MCU)120。移動站100可以是手持的無線電電話，例如蜂窩電話或個人通信器。移動站100還可以包含在某個卡或是模塊內部，並且在使用過程中，所述卡或模塊是與另一個設備相連的。例如，移動站10可以包含在PCMCIA或相似類型的卡或模塊內部，而在使用過程中，所述PCMCIA或是相似類型的卡或模塊將會安裝在膝上型計算機或筆記本計算機之類的可攜式數據處理器內部，甚至安裝在用戶可穿戴的計算機上。
假設MCU120包含或是耦合到某種類型的存儲器130，其中該存儲器包括用於存儲操作程序以及其他信息的非易失存儲器，以及用於臨時存儲必要數據、中間結果存儲、所接收的分組數據、所要傳送的分組數據等等的易失存儲器。對本發明來說，其中通過採用操作程序以使MCU120能夠執行軟體例程、分層以及協議，其中所述軟體例程、分層以及協議是實施根據本發明的自適應語音播出和緩衝方法所必需的，此外，該操作程序還能藉助顯示器140以及小鍵盤160來為用戶提供合適的用戶界面(UI)。雖然並未顯示，但是在這裡通常提供了麥克風和揚聲器，以使用戶能夠以常規方式來執行語音呼叫，此外還能根據本發明而向MS100的用戶播出那些來自圖1中的音頻緩衝器26的語音信號。
移動站100還包括一個無線部分，該部分包含了數位訊號處理器(DSP)180或是等價的高速處理器或邏輯電路，以及一個無線收發信機，其中所述無線收發信機包含了一個發射機200和一個接收機220，所述發射機和接收機都與天線240相耦合，以便與網絡運營商進行通信。此外，在這裡還提供了至少一個邏輯振蕩器，例如頻率合成器(SYNTH)260，以便對收發信機進行調諧。而那些諸如數位化語音和分組數據之類的數據是經由天線240而被發射和接收的。
參考圖1～7所描述的各種塊可以在硬體、軟體或是軟硬體組合中以各種方式來加以實現。在一種典型的情況中，各種語音緩衝器是在MCU120的控制和管理之下通過使用存儲器130中的位置來實現的，並且例如解碼塊20和時間縮放塊22之類的各種功能塊都是由MCU120在執行那些從存儲器130中讀取的程序指令的時候實現的。然而，應該指出的是，在某些實施例中，全部的自適應管理功能(包括語音信號修改)最好使用DSP180來實現。
根據上文中的描述可以了解，與傳統的緩衝技術相比，使用本發明的優點在於顯著減少了語音信號中出現中斷的概率。對傳統的緩衝處理來說，在某些情況中，所引入的緩衝延遲有可能過大，另一方面又有可能過小。因此，對傳統的緩衝處理而言，所察覺的語音質量將會成為所引入的緩衝延遲與輸出語音中實際遭遇的中斷之間的折衷。通過使用本發明的自適應緩衝管理技術，可以避免這種折衷。通過根據本發明的自適應緩衝管理，由於緩衝深度與包含語音的分組的到達過程中的最近中斷是關聯的，因此所引入的僅僅是必要數量的緩衝延遲。
在本發明的優選實施例中，由於緩衝延遲可以在語音周期中連續改變，因此，語音周期與靜默周期之間的時間關係不會受到影響，不連續性也可以得到避免。
只有在需要的時候，使用本發明所實現的自適應語音緩衝和播出管理才會影響到語音信號。通常，這個概念很好地與糾錯方法相關聯，而所述糾錯方法通常只在出現差錯的時候才會運作。當到達分組的平均吞吐量不很理想的時候，語音播出有可能要慢於或快於原始語音，但是對聽眾來說，這種情況要比輸出語音中的持續中斷更令人好受一些。
假設以穩定的播出速率來使用音頻源，如果在終端上是以始終慢於創建分組速率的速率來接收語音分組的，那麼通過使用本發明，輸出語音的速度應該慢於原始語音速度。假設替代使用一個產生了隨機輸出中斷的音頻源，並且在終端上以一個高於創建語音分組速率的速率來接收中斷之間的語音分組，以使到達間隔的長期平均值近似於分組創建時間周期，那麼使用本發明只在輸出語音的速度方面產生基本上無法察覺的波動。
本發明適用於任何VoIP終端，並且一般來說，本發明適應於網際網路或是其他任何分組交換網絡，由此，本發明並不僅限於與上文中參考圖8所描述的移動站100以及網絡50的實施例相結合使用。
當語音吞吐量發生顯著變化的時候，通過使用本發明，有可能在終端上實現連續的輸出語音。由此，在與分組交換網絡相連的設備中，通過使用本發明，可以改善觀察到的輸出語音質量，其中包含分組的語音信號是經由該網絡而被接收的。
上文中的描述藉助示例性的非限制實例而為發明人目前設想的用於執行本發明的最佳方法和設備提供全面和內容豐富的描述。然而，在結合附圖以及附加權利要求而對上文中的描述進行閱讀的時候，根據上文的描述，各種修改和改裝對相關領域的技術人員而言都是顯而易見的。舉例來說，本領域技術人員可以嘗試使用其他那些相似或等價的持續時間、採樣數量、緩衝器大小、比率等等。另外，在本發明的無線實施例中，鏈路也可以包含光學鏈路，而不必包含RF鏈路。此外，終端可以具有連至網絡的有線連接。儘管如此，關於本發明的教導的所有此類及相似修改仍舊落入本發明的範圍以內。
此外，雖然以上主要是在蜂窩電話終端或移動站100之類的行動電話的環境中進行描述的，本發明同樣可以應用於任何一個能與分組交換網絡相連並且能夠接收和播出分組中的語音的終端。由此，舉例來說，這些教導同樣適用於袖珍式PC、膝上型PC以及臺式PC，而且還適用於個人組織器以及個人數字助理(PDA)，其中所述個人組織器以及個人數字助理(PDA)具有語音能力，並且更概括的是音頻能力。
此外，如上所述，本發明適用於那些具有至少一個分組接收終端或設備的系統，其中所接收的分組傳送的是預定在一個基本連續和基本相同的時間序列中(也就是以一種基本上沒有中斷和不連續性的方式)呈現給聽眾或觀眾的按時間排序的內容。語音內容和視頻內容是按時間排序的內容中的兩個非限制性的實例。
此外，非常有利的是，本發明的某些特徵可以在沒有相應使用其他特徵的情況下得到應用。同樣，上文中的描述只被視為是對本發明的原理進行描述，而不是對其進行限制。
權利要求
1.一種用於對耦合到分組網絡並且能夠藉助IP來進行語音傳送的設備進行操作的方法，包括接收並緩衝那些包含了語音信息的數據分組；對語音信息進行解碼，以便獲取語音採樣；以及在產生語音播出信號之前，緩衝那些經過解碼的語音採樣，其中當接收數據分組的速率不同於創建數據分組的速率的時候，將會對經過解碼的語音採樣實施作為分組網絡狀態函數的時間縮放處理，以便調整緩衝延遲，從而能夠改變語音播出速率，由此提供基本連續的輸出語音信號。
2.根據權利要求1所述的方法，包括用於確定數據分組到達延遲的實質上異步的組件，以及對異步組件的操作做出響應從而根據解碼語音採樣的時間縮放來控制緩衝延遲的實質上同步的組件。
3.根據權利要求1所述的方法，其中分組緩衝器的緩衝延遲是在播出分組中的第一個幀之前，分組停留在分組緩衝器中的時段。
4.根據權利要求3所述的方法，還包括修正至少關於分組中斷延遲平均值以及平均偏差、分組到達間隔平均值、緩衝延遲平均值以及平均偏差的估計。
5.根據權利要求3所述的方法，還包括測量緩衝延遲，該緩衝延遲等於虛擬播出點與分組創建間隔次數(輸入分組序列號減去第一個分組的序列號)之和減去輸入分組的到達時間。
6.根據權利要求3所述的方法，還包括測定緩衝延遲，該緩衝延遲是虛擬播出點的函數，其中如果剩餘分組以穩定的速率播出，但卻仍舊導致與實際不穩定播出分組的情況相同的端到端延遲，那麼該虛擬播出點即為本該用於語音會話中的第一個分組的播出點。
7.根據權利要求6所述的方法，其中在對解碼語音採樣進行時間縮放或者接收分組緩衝器下溢或溢出的時候，相應地改變虛擬播出點。
8.根據權利要求1所述的方法，其中解碼包括檢測出所接收的語音幀的類型是壞幀、非幀還是好幀，並且其中只有在檢測到所接收的語音幀是好幀的情況下才執行時間縮放。
9.一種能夠藉助IP來傳遞語音的設備，該設備與分組網絡相耦合，其中包括接收機，用於接收和緩衝那些包含語音信息的數據分組；解碼器，用於解碼語音信息，以便獲取語音採樣；緩衝器，用於在產生語音播出信號之前緩衝解碼的語音採樣；還包括插入在所述解碼器與所述緩衝器之間的時間縮放功能，用於在接收數據分組的速率不同於創建數據分組的速率的時候對解碼的語音採樣實施作為分組網絡狀態函數的時間縮放處理，以便調整緩衝延遲，從而能夠改變語音播出速率，由此提供基本連續的輸出語音信號。
10.根據權利要求9所述的設備，包括用於確定數據分組到達延遲的實質上異步的組件，以及對異步組件的操作做出響應從而根據解碼語音採樣的時間縮放來控制緩衝延遲的實質上同步的組件。
11.根據權利要求9所述的設備，其中接收的分組緩衝器的緩衝延遲是在播出分組中的第一個幀之前，分組停留在分組緩衝器中的時段。
12.根據權利要求11所述的設備，還包括修正至少關於分組中斷延遲平均值以及平均偏差、分組到達時間間隔平均值、緩衝延遲平均值以及平均偏差的估計的裝置。
13.根據權利要求11所述的設備，還包括用於估計緩衝延遲的裝置，該緩衝延遲等於虛擬播出點與分組創建間隔次數(輸入分組序列號減去第一個分組的序列號)之和減去輸入分組的到達時間。
14.根據如權利要求11所述的設備，還包括用於估計緩衝延遲的裝置，該緩衝延遲是虛擬播出點的函數，其中如果剩餘分組以穩定的速率播出，但卻仍舊導致與實際不穩定播出分組的情況相同的端到端延遲，那麼該虛擬播出點即為本該用於語音會話中的第一個分組的播出點。
15.根據權利要求14所述的設備，其中在對解碼語音採樣進行時間縮放或者分組緩衝器下溢或溢出的時候，相應地改變虛擬播出點。
16.根據權利要求9所述的設備，其中所述解碼器包括用於檢測出所接收的語音幀的類型是壞幀、非幀還是好幀的裝置，並且所述功能只有在檢測到所接收的語音幀是好幀的情況下才會運作。
17.一種包含在計算機可讀介質中的電腦程式，該程序指示數據處理器對耦合到分組交換網絡的設備進行操作，其中包括用於接收和緩衝那些包含了按時間排序的內容的數據分組的程序代碼，其中所述數據分組預期在一個基本連續和基本相同的時間序列中呈現給用戶；用於對內容進行解碼以便獲取那些用於在採樣播出周期中為用戶進行演示的採樣的程序代碼；以及用於在以不同於創建數據分組的速率接收數據分組的時候，對分組網絡狀態做出響應，以便對採樣進行時間縮放，從而能夠改變播出速率，由此提供基本連續和相同的演示的程序代碼。
18.根據權利要求17所述的電腦程式，還包括用於確定數據分組到達延遲的實質上異步的組件，以及對異步組件的操作做出響應，從而根據所述時間縮放來控制緩衝延遲的實質上同步的組件。
19.根據權利要求17所述的電腦程式，其中所述按時間排序的內容包括語音信號，並且其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是複製採樣中的一個操作來對所述採樣進行時間縮放。
20.根據權利要求17所述的電腦程式，其中所述按時間排序的內容包括視頻信號，其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是插入視頻幀或採樣中的一個操作來對所述採樣進行時間縮放。
21.根據權利要求20所述的電腦程式，其中視頻和音頻是獨立控制的，並且通過使每一個的虛擬播出點保持時間同步而使視頻與音頻同步。
22.根據權利要求17所述的電腦程式，還包括用於為每一個到達分組測量延遲的程序代碼，如果在一個或多個分組的到達過程中出現中斷，那麼所述程序代碼至少將會更新緩衝延遲值、虛擬播出點值以及中斷延遲值。
23.根據權利要求17所述的電腦程式，其中在第一個分組到達的時候，緩衝延遲值將被設置為零，此外還包括用於更新緩衝延遲平均值的程序代碼，以及使用經過更新的緩衝延遲平均值、緩衝延遲平均偏差值。
24.根據權利要求17所述的電腦程式，還包括用於為每一個到達分組測量延遲的程序代碼，如果在分組到達過程中檢測到中斷，那麼所述程序代碼會通過使用指數平均來至少更新中斷延遲平均值，如果沒有在分組到達過程中檢測到中斷，那麼所述程序代碼會通過使用指數平均來至少更新到達間隔平均值。
25.根據權利要求17所述的電腦程式，其中所述設備包括通過無線鏈路耦合到分組交換網絡的接收機。
26.根據權利要求17所述的電腦程式，其中所述設備包括通過有線鏈路耦合到分組交換網絡的接收機。
27.根據權利要求17所述的電腦程式，其中所述設備包括具有RF接收機的蜂窩電話，用於以無線方式耦合到分組交換網絡。
28.一種用於對耦合到分組網絡的設備進行操作的方法，包括接收並緩衝數據分組，其中所述數據分組包含了代表按時間排序的內容的信息，所述按時間排序的內容預期是在一個基本連續和基本相同的時間序列中呈現給個人的；對信息進行解碼，以便獲取採樣；以及在產生播出信號之前，緩衝這些採樣，其中當接收數據分組的速率不同於創建數據分組的速率的時候，對所述採樣實施作為分組網絡狀態函數的時間縮放處理，以便調整緩衝延遲，從而能夠改變語音播出速率，由此提供基本連續的輸出信號。
29.根據權利要求28所述的方法，還包括用於確定數據分組到達延遲的實質上異步的組件，以及對異步組件的操作做出響應，從而根據所述解碼採樣的時間縮放來控制緩衝延遲的實質上同步的組件。
30.根據權利要求28所述的方法，其中所述按時間排序的內容包括語音信號，並且其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是複製採樣中的一個操作來對所述採樣進行時間縮放。
31.根據權利要求28所述的方法，其中所述按時間排序的內容包括視頻信號，其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是插入視頻幀或採樣中的一個操作來對所述採樣進行時間縮放。
32.一種設備，該設備包含了用於耦合到分組網絡的接口，其中包括接收機，用於接收數據分組，其中所述數據分組包含了代表按時間排序的內容的信息，所述按時間排序的內容預期是在一個基本連續和基本相同的時間序列中呈現給個人的；解碼器，用於對信息進行解碼，以便獲取採樣；以及緩衝器，用於在產生播出信號之前存儲這些採樣；以及縮放器，用於在接收數據分組的速率不同於創建數據分組的速率的時候，對採樣實施作為分組網絡狀態函數的時間縮放處理，以便調整緩衝延遲，從而能夠改變語音播出速率，由此提供基本連續的輸出信號。
33.根據權利要求32所述的設備，其中所述設備還包括用於確定數據分組到達延遲的實質上異步的組件，以及對異步組件的操作做出響應，從而根據解碼採樣的時間縮放來控制緩衝延遲的實質上同步的組件。
34.根據權利要求32所述的設備，其中所述按時間排序的內容包括語音信號，並且其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是複製採樣中的一個操作來對所述採樣進行時間縮放。
35.根據權利要求32的設備，其中所述按時間排序的內容包括視頻信號，其中分別根據數據分組是以快於還是慢於創建數據分組的速率到達的情況，通過刪除或是插入視頻幀或採樣中的一個操作來對所述採樣進行時間縮放。
全文摘要
在這裡公開的是一種用於與分組交換網絡相耦合，以便接收包含了語音或視頻信息之類的按時間排序的內容的數據分組的設備和方法。根據一種用於對耦合到分組網絡並能藉助IP來傳送語音的設備進行操作的方法，以及一種根據該方法來進行操作的設備，其中公開的是接收和緩衝那些包含了語音信息的數據分組；對語音信息進行解碼，以便獲取語音採樣；以及在產生語音播出信號之前緩衝那些經過解碼的語音採樣，其中對經過解碼的語音採樣進行作為分組網絡狀態函數的時間縮放處理，以便調整緩衝延遲以及改變語音播出速率，由此，無論接收數據分組的速率如何改變，都可以提供基本連續的輸出語音信號。
文檔編號H04J3/06GK1902864SQ200480033809
公開日2007年1月24日申請日期2004年10月21日優先權日2003年10月29日
發明者雅尼·馬利拉申請人:諾基亞公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

在接收終端上提供分組的平滑自適應管理的方法和設備的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法