新四季網

音頻系統中語音嘯叫的處理方法及系統與流程

2023-04-28 07:36:47 1


本發明涉及音頻系統處理技術,尤其涉及音頻系統中語音嘯叫的處理技術。



背景技術:

隨著數字網絡的發展,出現了眾多的手機語音對講系統:通過手機軟體可以非常方便的實現傳統的對講機。發送端手機通過麥克獲取語音信號並通過數據網絡傳遞到接聽端,接聽端通過揚聲器播放接收到的聲音信號,這樣一個基本的語音對講系統就形成了。但是在實際應用過程中,如果在室內或近距離通話,由於接聽端的揚聲器不斷的發出聲音,同時也被發送端的麥克接收到,不斷循環產生了聲音的自激,出現刺耳的嘯叫音。這種嘯叫音對於系統的體驗效果破壞非常嚴重,因此需要一種能有效過濾掉嘯叫聲音的技術。

在現有的技術中,處理語音嘯叫的方法有很多,如使用自適應濾波器減少增益或陷波器;如判斷信號中心頻率是否在嘯叫發生的頻率範圍,如果發現在嘯叫發生頻率,則激活濾波器過濾特定的頻率;或者直接使用陷波器濾掉特定的嘯叫頻率。

傳統的音頻系統嘯叫處理技術多是在信號增益上做處理,當檢測到可能有嘯叫後,對音頻信號減小增益,避免語音系統迴路出現正反饋自激形成嘯叫。減小增益的方法會同時影響正常語音,使接收端語音信號變小,而且由於嘯叫沒有被完全過濾,仍可能會繼續自激產生更嚴重的嘯叫,處理效果並不理想。

直接使用陷波器過濾掉特定頻率的方法可以有效的去除某種嘯叫,但是隨著音頻系統迴路的不斷反饋,嘯叫聲音會不斷變化,即頻率中心不斷轉移。而使用自適應的陷波器處理,則可能會過濾掉正常的聲音信息,效果仍不理想。



技術實現要素:

針對現有音頻系統嘯叫處理技術所存在的問題,需要新的音頻系統嘯叫處理技術,以提高處理效果。

由此,本發明所要解決的技術問題是提供一種音頻系統中語音嘯叫的處理方法及系統,以提高嘯叫處理效果。

為了解決上述技術問題,本發明提供的音頻系統中語音嘯叫的處理方法,其通過檢測人聲音及嘯叫音在頻域的特徵,確定是否發生嘯叫音,並在嘯叫音發生時移除其所有頻域分量。

優選的,所述處理方法通過檢測語音信號在人聲頻域內分布是否均勻,均勻則為含有人聲音的正常語音信號,否則為背景噪音或嘯叫音。

優選的,所述處理方法具體包括:對語音信號在頻域進行實時處理,分析檢查語音信號是否含有人聲音的正常語音信號;當沒有檢測到人聲信號時,確定為背景噪音或嘯叫信號,在頻域清除該信號後轉換回時域傳輸。

優選的,所述處理方法通過檢查分析語音信號在人聲頻域內的強度特徵,確定信號在人聲頻域內分布是否均勻。

優選的,所述處理方法針對語音信號在人聲頻域內每段頻率分量,遍歷每一段頻率分量的能量強度,當能量強大於預先測量的強度時計數,當計數達到預先測量的有效人聲計數時,確定語音信號為正常語音信號,不做任何處理;當計數沒有達到預先測量的有效人聲計數時,說明語音信號的分布不均勻,確定為嘯叫信號,對頻域信號清零處理並轉化回時域來消除嘯叫信號。

優選的,所述處理方法中通過如下公式確定人聲頻域的位置:

low=(int)(size*1000f*2/rate),

其中,low為人聲音低頻的位置,rate為輸入音頻樣本採樣率,size為採樣大小。

為了解決上述技術問題,本發明提供的音頻系統中語音嘯叫的處理系統包括:

FFT模塊,所述FFT模塊用於將音頻樣本進行快速傅立葉變換轉到頻域;

聲音檢測模塊,所述聲音檢測模塊對變換到頻域的信號進行聲音檢測,確定信號在人聲頻域內分布是否均勻;

聲音處理模塊,所述聲音處理模塊根據聲音檢測模塊的檢測結果對信號進行消除嘯叫處理;

IFFT模塊,所述IFFT模塊對經聲音處理模塊處理的信號進行反傅立葉變換將信號轉換回到時域。

優選的,所述聲音檢測模塊通過檢查分析語音信號在人聲頻域內的強度特徵,確定信號在人聲頻域內分布是否均勻。

優選的,所述聲音檢測模塊檢查語音信號在人聲頻域內每段頻率分量,並將每段頻率分量的能量強度與預先測量的強度對比,在高於預先測量強度時計數;當計數達到預先測量的有效人聲計數時,確定信號在人聲頻域內分布均勻;當計數未達到預先測量的有效人聲計數時,確定信號在人聲頻域內分布集中。

優選的,所述聲音處理模塊對在人聲頻域內分布均勻的信號不做處理;對在人聲頻域內分布不均勻的信號,移除其所有頻域分量。

優選的,所述處理系統中還包括初始化模塊,所述初始化模塊以確定人聲頻域的位置。

相對與已有的處理方法,本發明提供的音頻系統嘯叫處理方案具有如下優點:

1)對不包含有效聲音的音頻完全過濾,避免了噪音和嘯叫在語音迴路中再次傳遞;

2)不會對正常的音頻信號做任何處理,可以保證正常語音信號增益不變且沒有任何頻率和能量損失;

3)實施簡單,容易操作,不需要任何硬體和軟體結構改變,可以快速的部署進現有的語音系統;

4)在真實的實踐應用中測試具有非常理想的嘯叫和噪音處理效果;

5)僅當有噪聲或嘯叫的語音時做處理,不會影響正常通話質量;

6)本方案在發送端錄音後、接收端播放前添加處理,不影響已有系統的硬體或軟體設計。

附圖說明

以下結合附圖和具體實施方式來進一步說明本發明。

圖1為本發明實例中嘯叫處理模型示意圖;

圖2為本發明實例中嘯叫處理算法流程圖;

圖3為本發明實例中增加嘯叫處理後的一個音頻系統模型;

圖4為一個沒有經過處理的對講語音系統嘯叫音頻樣本的頻譜特徵圖;

圖5為一個經過本發明嘯叫處理方案處理的對講語音系統無嘯叫音頻樣本的頻譜特徵圖。

具體實施方式

為了使本發明實現的技術手段、創作特徵、達成目的與功效易於明白了解,下面結合具體圖示,進一步闡述本發明。

基於大量的實驗和創造性勞動,申請人發現人的聲音在頻域有明顯的特徵:在小於1000hz的低頻部分表現為分布均勻的條帶(如圖5所示);而嘯叫信號在頻域內的明顯特徵:在某一段頻率內集中分布(如圖4所示);在此情況下,使用傳統的嘯叫處理方法雖然可以抑制特定頻率的嘯叫信號,但是在實時音頻系統中,嘯叫音可能會因抑制處理而發生變化,嘯叫中心頻率會不斷的轉移,這時傳統的處理方法就很難達到理想的效果。

為此,本發明通過檢測人聲音及嘯叫音在頻域的特徵,以確定是否發生嘯叫音,當嘯叫音發生時移除所有頻域分量,由此來消除嘯叫音。

對於其中,人聲音在頻域的特徵的檢測,可通過檢測語音在低頻分布是否均勻,均勻則為含有人聲音的正常語音信號,否則為背景噪音或嘯叫音。

據此方案對對音頻系統中語音嘯叫處理的過程如下:

對語音信號在頻域進行實時處理,通過聲音分析檢查語音信號是否含有人聲音的正常語音信號;

當沒有檢測到人聲信號時,說明背景可能包含較多的雜音或嘯叫,在頻域清除該信號後轉換回時域傳輸。

本方案中檢查分析語音信號中是否含有人聲音信號通過檢測語音在低頻分布是否均勻來進行的,其具體過程如下:

1)對待檢測的音頻樣本,進行快速傅立葉變換轉到頻域;

2)集中處理變換後音頻樣本信號在人聲頻率範圍50hz-1000hz頻域內每個頻率分量,檢查該音頻樣本信號在人聲頻域內分布是否均勻,這裡具體通過檢查分析語音信號在人聲頻域內的強度特徵,以此來確定信號在人聲頻域內分布是否均勻,過程如下:

檢測每個頻率分量的能量強度px,且將每個頻率分量的能量強度px與預先測量的強度p0對比,在高於預先測量強度p0時計數;

當計數達到預先測量的有效人聲計數c0時,則觸發聲音檢測,說明該音頻樣本信號在人聲頻域內分布均勻,為含有人聲音的正常語音信號,對信號不做任何處理;當計數未達到預先測量的有效人聲計數c0時,則說明該音頻樣本信號在人聲頻域內分布不均勻(即為集中分布),該信號為背景噪音或嘯叫音,對音頻樣本信號的所有頻域分量清零;

3)將處理後的信號轉換回時域,通過已有系統進行傳輸或播放。

由上可知,本嘯叫處理方案僅當有噪聲或嘯叫的語音時做處理,不會影響正常通話質量。

以下通過一具體應用實例來說明一下。

本實例中針對上述的音頻系統中語音嘯叫處理,設計出一種用於音頻系統的語音嘯叫處理系統。

參見圖1,其所示為本實例中語音嘯叫處理系統的組成示意圖。

由圖可知,本語音嘯叫處理系統100主要包括FFT模塊110、聲音檢測模塊120、聲音處理模塊130以及IFFT模塊140。

其中,FFT模塊110,用於將待處理的音頻樣本進行快速傅立葉變換轉到頻域。

聲音檢測模塊120,用於對變換到頻域的信號進行聲音檢測分析,以確定待處理的信號在人聲頻域內分布是否均勻。

該聲音檢測模塊120通過檢查分析待處理語音信號在人聲頻域內的強度特徵,確定信號在人聲頻域內分布是否均勻。

具體的,本聲音檢測模塊120通過對變換後的音頻樣本(data[])所有處於人聲頻域內的頻率分量進行遍歷,並比較每個頻率分量值(data[i])是否大於預置的閾值(power),滿足條件時計數器(count)加一;最後檢查計數器(count)是否大於預置的測量值(C);若大於,則判斷信號在人聲頻域內分布均勻;若小於,則判斷信號在人聲頻域內分布集中。

這裡的預置的閾值(power)為預先測量的強度;而預置的測量值(C)為預先測量的有效人聲計數。

聲音處理模塊130,用於根據聲音檢測模塊120的檢測結果對信號進行消除嘯叫處理。

該聲音處理模塊130若接收到聲音檢測模塊120檢測結果為分布均勻,則確定該音頻樣本(data[])為正常的語音信號,對其不做任何處理;該聲音處理模塊130若接收到聲音檢測模塊120檢測結果為分布集中,則確定該音頻樣本(data[])是背景噪音或嘯叫信號,對音頻樣本(data[])所有頻域分量進行清零操作。

IFFT模塊140,用於對經聲音處理模塊130處理(包括沒有處理或對所有頻域分量進行清零)的信號進行反傅立葉變換將信號轉換回到時域並輸出。

為了進一步提高本語音嘯叫處理系統100處理的效果,該系統中還進一步增設初始化模塊,用於實時確定人聲頻域的位置。該初始化模塊根據輸入音頻樣本採樣率和採樣大小,來確定聲音檢測頻率上限(1000hz)即人聲音低頻的位置(low),由此來實現實時確定人聲頻域的位置。

據此,該初始化模塊具體通過如下的公式模式來實現:

low=(int)(size*1000f*2/rate);

其中,rate為輸入音頻樣本採樣率,size為採樣大小。

參見圖2,其所示為本語音嘯叫處理系統100進行嘯叫處理的流程圖。

由圖可知,本語音嘯叫處理系統100進行嘯叫處理的流程包括系統初始化和嘯叫處理兩部分。

初始化:

輸入音頻樣本採樣率(rate)和採樣大小(size),初始化模塊通過公式low=(int)(size*1000f*2/rate)計算得到聲音檢測頻率上限(1000hz)即人聲音低頻的位置(low)。

嘯叫處理:

輸入音頻樣本(data[])到FFT模塊,FFT模塊對樣本進行快速傅立葉變換轉到頻域,並輸入到聲音檢測模塊;

聲音檢測模塊對變換後的音頻樣本(data[])的所有小於檢測頻率上限(low)的頻率分量進行遍歷,比較分量值(data[i])是否大於預置的閾值(power),滿足條件時計數器(count)加一;

檢查計數器(count)是否大於預置的測量值(C),滿足條件時說明是正常語音信號,不做任何處理,否則說明是背景噪音或嘯叫信號,對音頻樣本(data[])清零操作;

對音頻樣本(data[])做反傅立葉變換,回到時域並輸出音頻樣本(data[])。

參見圖3,其所示為基於上述語音嘯叫處理系統100構成的具有嘯叫處理功能的音頻系統。該整體音頻系統模型主要分為兩部分:發送端200和接收端300。

其中,發送端主體200包含麥克風和嘯叫處理單元(由語音嘯叫處理系統100構成),再通過壓縮編碼及物理鏈路傳輸到接收端;

接收端主體300包含揚聲器和嘯叫處理單元(由語音嘯叫處理系統100構成),通過物理鏈路接收到發送端發來的語音信號後,進行解壓及解碼處理並傳遞給嘯叫處理單元。

據此構成的整體音頻系統能夠對音頻系統中產生的嘯叫音進行處理,大大提高通話質量。

這裡的音頻系統為各種需要進行嘯叫音處理的音頻系統,作為舉例如手機通話對講系統等。以下以增加語音嘯叫處理的手機通話對講系統為例,說明一下其進行語音嘯叫處理的過程。

1、發送端:發送端從手機麥克獲取到語音PCM信號,對獲取到的信號做FFT變換轉化的頻域,檢查信號在人聲頻域50hz-1000hz的強度特徵;遍歷每一段頻率分量的能量強度,當信號強度大於預設的閾值時增加計數;當計數器沒有達到預設的閾值時,說明信號的分布不均勻,可以確定是嘯叫信號;對頻域信號清零處理並轉化回時域來消除嘯叫信號,處理後的信號即無嘯叫信號。

2、接收端:接聽端從網絡獲取到發送端發來的語音信號後,對信號解碼為PCM信號,並將信號做與發送端相同的處理;將處理後的無嘯叫信號寫入揚聲器設備播放,即可輸出無嘯叫聲音。

參見圖4,其所示為一個沒有經過處理的對講語音系統嘯叫音頻樣本的頻譜特徵;圖5為一個經過對講語音系統無嘯叫音頻樣本的頻譜特徵;通過對比可知,本實例提供的嘯叫音處理方案具有非常理想的嘯叫和噪音處理效果。

同時,該嘯叫音處理方案應用時,只在發送端錄音後、接收端播放前添加處理即可,完全不影響已有系統的硬體或軟體設計。

以上顯示和描述了本發明的基本原理、主要特徵和本發明的優點。本行業的技術人員應該了解,本發明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發明的原理,在不脫離本發明精神和範圍的前提下,本發明還會有各種變化和改進,這些變化和改進都落入要求保護的本發明範圍內。本發明要求保護範圍由所附的權利要求書及其等效物界定。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀