一種音量控制方法和系統的製作方法
2023-06-02 12:23:11
專利名稱:一種音量控制方法和系統的製作方法
技術領域:
本發明涉及語音通信技術,尤其涉及一種語音通信中的音量自動增益控制方法和系統。
背景技術:
目前,用於解決聲道音量控制所普遍採用的自動增益控制(AGC)方法的核心思想是將語音流分成固定大小的處理塊(block),每個處理塊包含若干個樣本點量化振幅值數據。通過當前音量的高低,以某種算法,為每個處理塊計算出一個放大倍數(Gain),然後將這個放大倍數乘於每個樣本點的音量振幅值,作為輸出。
音量的自動增益控制(AGC)目前用於數字式擴音電話。此類數字式擴音電話一般包括一個擴音器,從遠處及當地用戶那裡分別接收輸入及輸出信號,並相應產生和比較輸入和輸出包絡信號及底噪聲信號電平並抑制輸入或輸出信號中的一個,實現輸出信號的自動增益控制(AGC)以允許其平滑轉接並抑制由送話器傳輸的背景噪聲。相關技術參見中國專利85108662。
在數位訊號處理中,目前也使用數位訊號處理器中的自動增益控制(AGC)方法。該方法首先建立一個預定的門檻值,一個預定的自動增益控制值及一個預定的計數門檻值,並存入與信號處理器相聯的數據存貯器中。將每個輸入信號的樣值乘以自動增益控制(AGC)值,並將乘積存入該數據存貯器。取該乘積的絕對值,並將其與該預定的門檻值相加。如運算結果使信號處理器溢出,則AGC值減小,並存回該數據存貯器。相關技術參見中國專利86106498。
現有技術的缺點是,首先,現有的AGC方法中缺少一種在靜音期間有效的增益處理。當發送端不說話時,在接收端收到的樣本點的音量振幅值很低,稱之為靜音期間,這時根據現有AGC方法所計算出的自動增益值將很大,即需要放大很大的倍數,最終導致發送端的背景噪聲被大幅度放大,而且在接收端還會出現嘈雜聲和嘯叫聲。
其次現有的方法在計算自動增益值時都是普遍存在只增不減的現象。即對小音量樣本的放大效果顯著,但對大音量樣本的限制效果不明顯。
發明內容
本發明目的在於提供一種語音通信中的區分音量狀態的音量自動增益控制方法和系統,以解決現有技術中在靜音期間背景噪聲被大幅度放大,出現嘈雜和嘯叫聲的問題,並解決現有技術的自動增益音量控制中對高音量狀態的語音流音量只增不減,導致音量過大的問題。
為實現上述目的,本發明提供了以下技術方案一種自動增益音量控制方法,其特徵在於包括以下步驟a)定義語音流音量狀態;b)採集語音流,並將其處理成相同大小的若干個處理塊;c)判斷語音流的音量狀態;d)根據步驟c)中判斷結果、對語音流進行相應的音量自動增益調整;e)輸出經過音量調整的語音流。
較佳地,所述的音量控制方法中所述步驟a)中的音量狀態包括靜音狀態高、音量狀態和正常音量狀態。
較佳地,所述的音量控制方法中所述步驟b)中的每個處理塊包含若干個音量樣本點。
較佳地,所述的音量控制方法,其特徵在於測量當前處理塊的最大音量值和平均音量值。
較佳地,所述的音量控制方法,其特徵在於,所述的當前處理塊最大音量值為該處理塊中音量最大的樣本點的音量,所述的當前處理塊平均音量值為當前處理塊中所有樣本點的音量的平均值。
較佳地,所述的音量控制方法,其特徵在於所述步驟c)包括c1)設置一個靜音門檻值,一個靜音持續長度值和一個高音量門檻值;
c2)在連續的靜音持續長度值所代表的時間內比較所述的靜音門檻值和所述的當前處理塊最大音量值;c3)當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內大於當前處理塊最大音量值時,判定語音流處於靜音狀態;c4)當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內小於當前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小於所述的平均音量值,則判定語音流處於高音量狀態;如果所述的高音量門檻值大於所述的平均音量值,則判定語音流處於正常音量狀態。
較佳地,所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於正常音量狀態時,對語音流進行自動增益調整,作為語音流的輸出音量。
較佳地,所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於靜音狀態時,具體調整方法包括以下步驟d1)獲取靜音前的最後一個處理塊的自動增益值Gain;d2)比較靜音前處理塊自動增益值Gain與1,當Gain大於1時,逐漸縮小自動增益值,使其趨近1;當Gain小於1時,逐漸增大自動增益值,使其趨近1;當Gain等於1時,則保持自動增益值Gain不變。
較佳地,所述的音量控制方法,其特徵在於逐漸縮小自動增益值的每次縮小幅度相同和逐漸增大自動增益值的每次增大幅度相同。
較佳地,所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於高音量狀態時,下調自動增益值,以減小音量。
較佳地,所述的音量控制方法,其特徵在於下調自動增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
本發明還提供了一種音量控制系統,包括通過網絡互相連接的語音流發送端,語音流接收端和語音伺服器,其特徵在於還包括用於在接收端播放語音流前調整音量的音量控制器。
較佳地,所述的音量控制系統,其特徵在於所述的音量控制器包括用於從所述語音流發送端採集並保存語音流的語音流輸入模快,用於對所保存語音流進行預處理的語音流處理模塊,用於判斷語音流的音量狀態的音量狀態判斷模塊,用於調整語音流音量的音量調整模塊和用於輸出經過音量調整的語音流給語音流接收端的語音流輸出模塊。
較佳地,所述的音量控制系統,其特徵在於所述的音量控制器可在發送端或接收端,也可在語音伺服器端。
較佳地,所述的音量控制系統,其特徵在於所述的語音流發送端和語音流接收端是運行視頻會議程序語音通訊程序、或其他包含語音通訊模塊的客戶端程序的計算機。
較佳地,所述的音量控制系統,其特徵在於所述的語音流發送端和語音流接收端可以是數字電話,行動電話和PDA等語音通訊設備。
較佳地,所述的音量控制系統,其特徵在於系統通過對多個所述的語音流發送端的音量都進行控制,使所述的多個語音流發送端在所述的語音流接收端的輸出音量一致,達到多聲道平衡。
本發明還提供了一種音量自動增益控制中的靜音控制方法,其特徵在於包括以下步驟設定一個靜音門檻值和一個靜音持續長度值;採集語音流,並將其保存成相同大小的若干個處理塊,並測量每個處理塊的最高音量值;在連續的靜音持續長度值所代表的時間裡連續比較語音流中連續的處理塊的最高音量值和靜音門檻值;當在連續的靜音持續長度值所代表的時間裡,語音流中連續的處理塊的最高音量值都小於靜音門檻值,對語音流進行靜音控制;
較佳地,所述的音量自動增益控制中的靜音控制方法,其特徵在於所述處理塊最大音量值為該處理塊中音量最大的樣本點的音量值。
較佳地,所述的音量自動增益控制中的靜音控制方法,其特徵在於所述靜音控制包括以下步驟獲取靜音前的最後一個處理塊的自動增益值Gain;比較靜音前處理塊自動增益值Gain與1,當Gain大於1時,逐漸縮小自動增益值,使其趨近1;當Gain小於1時,逐漸增大自動增益值,使其趨近1;當Gain等於1時,則保持自動增益值Gain不變。
較佳地,所述的音量自動增益控制中的靜音控制方法,其特徵在於逐漸縮小自動增益值的每次縮小幅度相同和逐漸增大自動增益值的每次增大幅度相同。
本發明還提供了一種音量自動增益控制中的高音量控制方法,其特徵在於包括以下步驟設定一個高音量音門檻值;採集語音流,並將其保存成相同大小的若干個處理塊,並計算每個處理塊的平均音量值;比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小於所述的平均音量值,則下調自動增益值以減小音量;較佳地,所述的音量自動增益控制中的高音量控制方法,其特徵在於所述的平均音量值為每個處理塊中所有樣本點的音量的平均值。
較佳地,所述的音量自動增益控制中的高音量控制方法,其特徵在於下調自動增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
本發明通過預先定義語音流音量狀態,判斷當前語音流的音量狀態,然後根據判斷結果對語音流進行相應調整。由於區分語音流的音量狀態,從而可以針對不同音量狀態的語音流進行相應的調整,在判斷語音流處於靜音狀態時,以每次相同的幅度逐漸縮小或逐漸增大自動增益值,使之平滑過渡到1,消除發送端背景噪聲被過度放大帶來的嘈雜聲和嘯叫聲;在判斷語音流處於高音量狀態時,下調自動增益值以減小音量,實現對高音量語音流的音量限制,從而達到語音流的平滑流暢。由於本發明的方案對多個語音流發送端的語音分別流進行相應調整,使得多個語音流發送端的音量在接收端達到一致大小,從而實現語音通訊中的多聲道平衡。
圖1為本發明的音量控制方法的流程圖;圖2為本發明的音量控制系統結構圖;圖3為本發明在即時通訊客戶端應用的示意圖;圖4為本發明的多個語音流發送端在語音流接收端的音量輸出的多聲道平衡示意圖;具體實施方式
下面結合附圖以具體實施例對本發明進行詳細描述。
本發明為一種音量控制方法和系統,在目前普遍採用的音量自動增益控制的基礎上,預先定義語音流音量狀態,判斷當前語音流的音量狀態,並根據判斷結果對語音流進行相應的音量調整,最後輸出經過音量調整的語音流。
圖1所示為應用本發明的流程示意圖。
步驟101,定義語音流音量狀態。
本方案預先將語音流區分定義為幾種音量狀態,在本方案的一個實施例中,語音流被預先定義為三種音量狀態,如圖1所示,分別是正常音量狀態,靜音狀態和高音量狀態,並設定相應的判斷語音流音量狀態的門檻值,分別為靜音門檻值,靜音持續長度值和高音量門檻值。靜音門檻值,靜音持續長度值和高音量門檻值經過實際測量獲得。
步驟102,採集並保存語音流。
和現有自動增益音量控制方法相同地,語音流被採集保存成若干個相同大小的處理快,每個處理塊包含若干個樣本點量化振幅值數據。本方案的音量控制方法是對當前語音流的每個處理塊判斷音量狀態,並計算該處理塊相應的放大倍數,即自動增益值,然後再給該處理塊裡的每個樣本點乘以計算出的放大倍數,作為輸出。在計算放大倍數時,同時考慮自動增益值必須小於當前處理塊的最大放大倍數,即控制放大後的振幅值不能超過最大的量化等級,例如噹噹前處理的語音流的採樣率為8000Hz,量化等級為16位,帶符號時,要保證放大後的樣本點振幅值不能超過215-1(32767)。
步驟103,判斷語音流音量狀態。
對已保存的語音流根據預先設定的門檻值進行音量狀態的判斷。語音流音量狀態的判斷還需要測量計算兩個參數,當前處理塊最大音量值和當前處理塊平均音量值。優選的,當前處理塊最大音量值為該處理塊中音量最大的樣本點的音量,當前處理塊平均音量值為當前處理塊中所有樣本點的音量的平均值。首先在連續的靜音持續長度值所代表的時間內比較所述的靜音門檻值和所述的當前處理塊最大音量值,當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內大於當前處理塊最大音量值時,判定語音流處於靜音狀態;當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內小於當前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小於所述的平均音量值,則判定語音流處於高音量狀態;如果所述的高音量門檻值大於所述的平均音量值,則判定語音流處於正常音量狀態。
步驟1041,當語音流處於正常音量狀態時,進行自動增益音量調整,以普通自動增益調整的任何一種算法為語音流中的每個處理塊計算一個放大倍數,然後給處理塊中每個樣本點的音量振幅值乘以計算出的放大倍數,作為語音流的輸出音量。
步驟1042,靜音狀態時,比較靜音前增益值Gain和1。在靜音狀態時,為了不放大背景噪聲,自動增益值應為1。通常情況下,靜音前自動增益值一般不為1,為保持語音流音量的連貫平滑,採取逐漸微調的策略,每次調整幅度相同,使自動增益值趨近1。
步驟1043,高音量狀態時,下調增益值以減小音量。通過實際測試,優選的,下調的幅度為步驟1051,靜音前增益值Gain大於1時,逐漸縮小Gain使之趨近1。
步驟1052,靜音前增益值Gain小於1時,逐漸增大Gain使之趨近1。
步驟1052,靜音前增益值Gain等於1時,保持Gain值不變。
步驟106,輸出音量調整後的語音流。
本發明的一個實施例中,靜音期間的自動增益控制方案分為兩部分:
一是如何有效地判斷出當前是否處於靜音期間;二是當判斷出當前處於靜音期間時,如何調節當前的自動增益值。
如何判斷當前是否處於靜音期間,首先必須選定一個判斷是否靜音的振幅門限值SILENCE_THRESHOLD。通過實際測試,選擇SILENCE_THRESHOLD=700,當振幅值小於SILENCE_THRESHOLD時語音流被定義為靜音狀態,反之我為非靜音狀態。接下來,計算每個處理塊的最大振幅值(取絕對值),並和SILENCE_THRESHOLD進行比較。同時,再設置一個靜音持續長度值SILENCE_DURATION。通過實際測試,選定SILENCE_DURATION=2秒。當連續的SILENCE_DURATION時間內都出現處理塊的最大振幅值小於SILENCE_THRESHOLD時,判定,當前處於靜音期間,執行靜音期間的自動增益調整。
靜音期間的自動增益調整追求的目標是在靜音期間應該不能對語音流做任何處理,即自動增益值為1,不放大也不縮小,保持背景噪聲原樣。但是,在靜音期間之前,自動增益值Gain可能不為1,如果一判斷出靜音就立刻將自動增益值設置為1,會造成靜音前和靜音一開始的音量突變,同樣會造成語音的不連貫性。因此,在此設計方案中,當判斷為靜音期間時,進行如下操作if(Gain>1.0)Gain=Gain*0.95;else if(Gain<0.95)Gain=Gain*1.05這樣的處理就使得在靜音期間,自動增益值緩緩地平滑過渡到1,達到音量平滑過度的效果。
對於高音量的自動增益控制方案,同樣存在兩個方面的問題一是如何有效地判斷出當前是否處於高音量期間;二是當判斷出當前處於高音量期間時,應如何有效地下調自動增益值。
僅僅通過統計出的處理塊的最大振幅值,不能進行高音量的判斷。因此,引入另一個統計值Block_average,當前處理塊的平均振幅值(絕對值)。通過Block_average值來進行判斷。同時,定義一個確定高音量的振幅門限值HIGH_THRESHOLD,並通過實際測試選定為15000。
if(Block_average>HIGH_THRESHOLD)Gain=HIGH_THRESHOLD/Block_average;當平均振幅值大於HIGH_THRESHOLD,則將Gain值進行下調處理,下調幅度為HIGH_THRESHOLD/Block_average。
通過這樣的處理,可以有效限制高音量的樣本點的音量。
圖2所示為應用本發明的音量控制系統結構圖。圖2中所示的音量控制系統包括語音流發送端201,語音流接收端202,語音伺服器203,和音量控制器204組成的。音量控制器204的語音流輸入模塊205直接從語音流發送端201採集語音流。語音流處理模塊206將所採集的語音流保存成若干個相同大小的處理塊,每個處理塊包含若干個樣本點,並測量計算每個處理塊的最高音量值和平均音量值。音量狀態判斷模塊207根據預先設定的門檻值判斷語音流的音量狀態。音量調整模塊208根據音量狀態判斷模塊207的判斷結果,分別對不同狀態的語音流進行相應的音量調整。語音流輸出模塊209輸出經過音量調整以後的語音流給語音流接收端202。語音流輸入模塊205也可從語音伺服器203處採集語音流,這時,語音流發送端201和語音流接收端202之間的通訊是通過語音伺服器203中轉完成的。
圖3所示為多個語音流發送端在同一接收端的多聲道平衡效果。音量控制器204從發送端301和發送端306分別採集語音流,分別保存並判斷語音流的音量狀態,並分別根據判斷結果調整語音流音量,最後分別輸出經音量調整的語音流給接收端302。由於對發送端301和306的語音流都分別做了相應的音量調整,所以無論301和306的音量設置如何,它們發送的語音流在接收端302的音量達到一致。在伺服器中轉通訊情況下,發送端301和306分別將語音流發送到語音伺服器304,音量控制器204從語音伺服器採集保存語音流,經過相應的音量調整,輸出到接收端302。圖中發送端306為行動電話,306的語音信息通過移動通訊網關303發送給語音伺服器304,再轉發給音量控制器204。如圖4所示,接收端305為移動通訊工具PDA,音量控制器204發送經過音量調整後的語音流給語音伺服器304,再由語音伺服器304轉發給移動通訊網關303,最後由移動通訊網關303發送給接收端305。
圖4所示為本發明在即時通訊系統裡的應用。圖4所示的即時通訊系統包括互為對端的即時通訊客戶端401和402,即時通訊伺服器403,語音伺服器404。即時通訊客戶端401和402都包括即時通訊模塊405,語音通訊模塊406和音量控制器204。當啟動集成在即時通訊客戶端401的語音通訊工具,如語音聊天工具、視頻會議工具等時,即時通訊模塊405調用語音通訊模塊406,通過即時通訊伺服器402發送語音通訊請求給即時通訊客戶端402,即時通訊客戶端402響應該語音通訊請求,在對端401和402之間建立語音通訊通道,此時即時通訊客戶端401為發送端,402為接收端。接收端402的音量控制器204從語音通訊模塊406採集接收到的語音流,進行音量調整後輸出。在伺服器中轉通訊情況下,即時通訊客戶端401發送語音流給語音伺服器404,語音伺服器404轉發給即時通訊客戶端402,即時通訊客戶端402的音量控制器204對接收到的語音流進行音量調整後輸出。同樣地,發送端405的音量控制器204也可從405的語音通訊模塊406採集語音流,經過音量調整後再發送。在伺服器中轉通訊情況下,音量控制器也可不設在即時通訊客戶端401和402,而是設置在語音伺服器404,語音伺服器404接收到語音流後,先進行音量調整,再轉發給接收端。
以上所述僅為本發明的較佳實施例而已,並不用以限制本發明,凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護範圍之內。
權利要求
1.一種自動增益音量控制方法,其特徵在於包括以下步驟a)定義語音流音量狀態;b)採集語音流,並將其處理成相同大小的若干個處理塊;c)判斷語音流的音量狀態;d)根據步驟c)中判斷結果、對語音流進行相應的音量自動增益調整;e)輸出經過音量調整的語音流。
2.如權利要求1所述的音量控制方法,其特徵在於所述步驟a)中的音量狀態包括靜音狀態高、音量狀態和正常音量狀態。
3.如權利要求1所述的音量控制方法,其特徵在於所述步驟b)中的每個處理塊包含若干個音量樣本點。
4.如權利要求3所述的音量控制方法,其特徵在於測量當前處理塊的最大音量值和平均音量值。
5.如權利要求4所述的音量控制方法,其特徵在於,所述的當前處理塊最大音量值為該處理塊中音量最大的樣本點的音量,所述的當前處理塊平均音量值為當前處理塊中所有樣本點的音量的平均值。
6.如權利要求1所述的音量控制方法,其特徵在於所述步驟c)包括c1)設置一個靜音門檻值,一個靜音持續長度值和一個高音量門檻值;c2)在連續的靜音持續長度值所代表的時間內比較所述的靜音門檻值和所述的當前處理塊最大音量值;c3)當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內大於當前處理塊最大音量值時,判定語音流處於靜音狀態;c4)當所述的靜音門檻值在連續的靜音持續長度值所代表的時間內小於當前處理塊最大音量值,則比較所述的高音量門檻值和所述的平均音量值如果所述的高音量門檻值小於所述的平均音量值,則判定語音流處於高音量狀態;如果所述的高音量門檻值大於所述的平均音量值,則判定語音流處於正常音量狀態。
7.如權利要求6所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於正常音量狀態時,對語音流進行自動增益調整,作為語音流的輸出音量。
8.如權利要求6所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於靜音狀態時,具體調整方法包括以下步驟d1)獲取靜音前的最後一個處理塊的自動增益值Gain;d2)比較靜音前處理塊自動增益值Gain與1,當Gain大於1時,逐漸縮小自動增益值,使其趨近1;當Gain小於1時,逐漸增大自動增益值,使其趨近1;當Gain等於1時,則保持自動增益值Gain不變。
9.如權利要求8所述的音量控制方法,其特徵在於逐漸縮小自動增益值的每次縮小幅度相同和逐漸增大自動增益值的每次增大幅度相同。
10.如權利要求6所述的音量控制方法,其特徵在於步驟d)中所述的根據步驟c)中判斷結果對語音流進行相應的音量自動增益調整包括當語音流處於高音量狀態時,下調自動增益值,以減小音量。
11.如權利要求10所述的音量控制方法,其特徵在於下調自動增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
12.一種音量控制系統,包括通過網絡互相連接的語音流發送端,語音流接收端和語音伺服器,其特徵在於還包括用於在接收端播放語音流前調整音量的音量控制器。
13.如權利要求12所述的音量控制系統,其特徵在於所述的音量控制器包括用於從所述語音流發送端採集並保存語音流的語音流輸入模快,用於對所保存語音流進行預處理的語音流處理模塊,用於判斷語音流的音量狀態的音量狀態判斷模塊,用於調整語音流音量的音量調整模塊和用於輸出經過音量調整的語音流給語音流接收端的語音流輸出模塊。
14.如權利要求12所述的音量控制系統,其特徵在於所述的音量控制器可在發送端或接收端,也可在語音伺服器端。
15.如權利要求12所述的音量控制系統,其特徵在於所述的語音流發送端和語音流接收端是運行視頻會議程序語音通訊程序、或其他包含語音通訊模塊的客戶端程序的計算機。
16.如權利要求12所述的音量控制系統,其特徵在於所述的語音流發送端和語音流接收端可以是數字電話,行動電話和PDA等語音通訊設備。
17.如權利要求12所述的音量控制系統,其特徵在於系統通過對多個所述的語音流發送端的音量都進行控制,使所述的多個語音流發送端在所述的語音流接收端的輸出音量一致,達到多聲道平衡。
18.一種音量自動增益控制中的靜音控制方法,其特徵在於包括以下步驟設定一個靜音門檻值和一個靜音持續長度值;採集語音流,並將其保存成相同大小的若干個處理塊,並測量每個處理塊的最高音量值;在連續的靜音持續長度值所代表的時間裡連續比較語音流中連續的處理塊的最高音量值和靜音門檻值;當在連續的靜音持續長度值所代表的時間裡,語音流中連續的處理塊的最高音量值都小於靜音門檻值,對語音流進行靜音控制;
19.如權利要求18所述的音量自動增益控制中的靜音控制方法,其特徵在於所述處理塊最大音量值為該處理塊中音量最大的樣本點的音量值。
20.如權利要求18所述的音量自動增益控制中的靜音控制方法,其特徵在於所述靜音控制包括以下步驟獲取靜音前的最後一個處理塊的自動增益值Gain;比較靜音前處理塊自動增益值Gain與1,當Gain大於1時,逐漸縮小自動增益值,使其趨近1;當Gain小於1時,逐漸增大自動增益值,使其趨近1;當Gain等於1時,則保持自動增益值Gain不變。
21.如權利要求20所述的音量自動增益控制中的靜音控制方法,其特徵在於逐漸縮小自動增益值的每次縮小幅度相同和逐漸增大自動增益值的每次增大幅度相同。
22.一種音量自動增益控制中的高音量控制方法,其特徵在於包括以下步驟設定一個高音量音門檻值;採集語音流,並將其保存成相同大小的若干個處理塊,並計算每個處理塊的平均音量值;比較所述的高音量門檻值和所述的平均音量值;如果所述的高音量門檻值小於所述的平均音量值,則下調自動增益值以減小音量;
23.如權利要求22所述的音量自動增益控制中的高音量控制方法,其特徵在於所述的平均音量值為每個處理塊中所有樣本點的音量的平均值。
24.如權利要求22所述的音量自動增益控制中的高音量控制方法,其特徵在於下調自動增益值的幅度為所述高音量門檻值與所述平均音量值的比值。
全文摘要
本發明公開了一種語音通信時的自動增益音量控制方法和系統。通過預先定義語音流的音量狀態並在傳輸中判斷,根據判斷結果進行相應自動增益控制(AGC)控制,實現語音流的音量從高音到靜音的平滑過度,解決語音傳輸中的音量突變和語音的不連貫等問題。該方法是通過採集語音流並根據預先設定的門檻值判斷所採集語音流的音量狀態,再根據判斷結果進行相應的自動增益控制,從而達到語音流的平滑連貫。在一個實施例中,該方法在視頻會議中的應用通過對各個聲道語音流的特殊音量自動增益(AGC)控制,達到各個聲道的音量的一致,即多聲道平衡。
文檔編號H04N7/15GK1885711SQ20051003557
公開日2006年12月27日 申請日期2005年6月24日 優先權日2005年6月24日
發明者王麒 申請人:騰訊科技(深圳)有限公司