新四季網

噪聲門、聲音採集裝置及噪聲消除方法

2023-09-19 06:46:25

專利名稱:噪聲門、聲音採集裝置及噪聲消除方法
技術領域:
本發明涉及用於消除音頻信號中所含噪聲的噪聲門,還涉及聲音採集裝置及噪聲消除方法。
背景技術:
現有技術的聲音採集裝置中提供有噪聲門來作為用於消除噪聲的單元(例如,專利文件1)。例如,專利文件1公開了一種噪聲門裝置,其按照用於放大音頻信號的前置放大器的放大率來改變噪聲門的閾值,並且消除低於該閾值的音頻信號。現有技術文件專利文件專利文件1 JP-A-2006-50067

發明內容
本發明要解決的問題然而,專利文件1中描述的噪聲門裝置消除了低於閾值的音頻信號。因此,對於在該低於閾值的音頻信號中包含了講話者的發言語音的情況,會發生這樣的問題,即,信號電平低於閾值的發言語音被噪聲門消除了。考慮上述問題,本發明的目的是提供噪聲門、聲音採集裝置及噪聲消除方法,它們各自都能夠容易地消除恆定噪聲而不降低音頻信號質量。解決問題的方式根據本發明的噪聲門基於輸入音頻信號的頻譜來對該輸入音頻信號中所含恆定噪聲(以下稱為恆定噪聲)的噪聲譜進行評估。該噪聲門計算輸入音頻信號的頻譜與評估所得噪聲譜的信號電平比。噪聲門輸出其中一個頻帶中的信號電平被降低了的音頻信號的頻譜,該頻帶是所計算出的信號電平比低於預定閾值的頻帶。以此配置,噪聲門輸出了包括講話者發言語音的音頻信號的頻譜,並抑制了恆定噪聲所形成的音頻信號的頻譜中的信號電平,從而能夠輸出僅僅消除了其中的恆定噪聲的音頻信號而不會降低講話者發言語音的質量。另外,可根據與評估單元的評估誤差相對應的值將用來與信號電平比進行比較的閾值設置為大於1的值。由於噪聲門使用評估所得恆定噪聲來對將要與閾值進行比較的信號電平比進行計算,所以要考慮恆定噪聲的評估誤差。以此配置,即使在恆定噪聲的信號電平被評估為低於實際值的值時,噪聲門也能將該恆定噪聲消除掉。另外,根據本發明的聲音採集裝置具有上述噪聲門。聲音採集裝置把通過採集聲音而生成的音頻信號轉換成頻譜來作為頻域的信號並將該頻域的信號輸出到噪聲門。另外,聲音採集裝置還將從噪聲門輸出的音頻信號的頻譜逆變換成音頻信號來作為時域的信號。以此配置,聲音採集裝置能夠利用上述噪聲門來將恆定噪聲從採集到的音頻信號中消除。因此,聲音採集裝置能夠在不降低所採集到的講話者發言語音質量的情況下輸出聲音。根據本發明的噪聲消除方法包括以下處理輸出音頻信號的頻譜;根據輸入處理中所輸入的音頻信號的頻譜來評估噪聲譜;計算音頻信號的頻譜與在評估處理中評估所得的噪聲譜之間的信號電平比;以及輸出其中一個頻帶中的增益被降低了的音頻信號的頻譜,該頻帶是計算處理中計算出的信號電平比低於預定閾值的頻帶。另外,可根據與評估處理中用到的評估單元的評估誤差相對應的值將用來與信號電平比進行比較的閾值設置為大於1的值。發明的優點根據本發明的噪聲門能夠輸出消除了恆定噪聲的音頻信號而不會降低講話者發
言語音的質量。


圖1是示出聲音採集裝置的功能和結構的框圖。圖2是示出增益表的一個示例的示圖。圖3(A)、圖3(B)和圖3 (C)是分別示出恆定噪聲、音頻信號和消除噪聲後的音頻信號的示例的示圖。圖4是示出增益表的另一個示例的示圖。
具體實施例方式下面將參考圖1和圖2來描述根據本發明的聲音採集裝置1。圖1是示出聲音採集裝置1的功能和結構的框圖。圖2是示出增益表的一個示例的示圖。聲音採集裝置1具有噪聲門12(見圖1)。聲音採集裝置1將採集到的音頻信號NE' T轉換成頻譜NE' N。 聲音採集裝置1使用噪聲門12將音頻信號NE' N中所含的恆定噪聲N' N消除掉。此時, 由噪聲門12根據頻譜NE' N對恆定噪聲N' N進行評估。聲音採集裝置1輸出音頻信號 CO' T,該音頻信號CO' T是通過對消除了恆定噪聲N' N之後的頻譜CO' N關於時間軸進行逆變換的方式而生成的。同時在下面的描述中,時域中的結束符號用'T來指示,頻域中的結束符號用'N來指示。首先參考圖1和圖2來描述聲音採集裝置1的功能和結構。如圖1所示,聲音採集裝置1包括麥克風MIC、FFT處理單元11、噪聲門12以及IFFT處理單元13。麥克風MIC通過採集環境聲音來生成音頻信號。麥克風MIC將所生成的音頻信號 NE' T輸出到FFT處理單元11。FFT處理單元11是快速傅立葉變換電路,其將作為時域信號的音頻信號NE' T轉換成作為頻域信號的音頻信號NE' N,並將該音頻信號NE' N輸出到噪聲門12中的評估單元121和噪聲消除單元122。噪聲門12具有評估單元121和噪聲消除單元122。評估單元121對從FFT處理單元11輸入的音頻信號NE' N中所包含的恆定噪聲
4N' N進行評估處理。評估單元121隨後在恆定噪聲N' N的特定採樣時間處獲取頻譜(以下稱為音頻譜)S(NE' N)並臨時存儲這些頻譜。評估單元121根據上述獲取並存儲的多個時間的音頻譜S(NE' N)來對恆定噪聲N' N的特定採樣時間處的頻譜(以下稱為噪聲譜) S(N' N)進行評估。評估單元121將評估所得噪聲譜S(N' N)輸出到噪聲消除單元122。例如,特定採樣時間T處的噪聲譜用S(N' N(T))表示,相同採樣時間T處的音頻譜用S(NE' N(T))表示,並且前一採樣時間T-I處的噪聲譜用S(N' N(T-I))表示。「 α,, 和「 β 」作為遺忘常數例如被設置為α =0.9, β =0.1。噪聲譜S(N' N(T))由以下公式 1表不。S (N' N(T)) = α S (N' N(T-I)) +β S (NE' N(T)) 公式 1因此,通過基於音頻譜來對噪聲譜S (N' N(T))進行評估,能夠評估出諸如背景噪聲等之類的恆定噪聲。評估單元121隻有在麥克風MIC所採集到的音頻信號處在低電平狀態(安靜狀態)的情況下才對噪聲譜執行評估處理。噪聲消除單元122從FFT處理單元11所輸入的音頻信號NE' N中消除恆定噪聲 N' N,並將消除了噪聲後的音頻信號CO' N輸出到IFFT處理單元13。具體來說,噪聲消除單元122對音頻譜S(NE' N)與評估單元121所輸入的噪聲譜S(N' N)之間的信號電平比進行計算。在計算出的信號電平比低於閾值的情況下,噪聲消除單元122在信號電平比低於閾值的頻帶中減小音頻譜S(NE' N)的增益並輸出音頻信號。例如,噪聲消除單元122具有圖2所示的增益表TBL。增益表TBL描述了音頻譜 S(NE' N)按照計算出的信號電平比的增益。增益表TBL使得音頻譜S(NE' N)的增益在信號電平比等於或大於閾值的情況下為1,並使得音頻譜S(NE' N)的增益在信號電平比小於閾值的情況下為0。在此情況下,消除了噪聲後的音頻信號CO' N在特定採樣時間處的頻譜S(C0' N)可由以下公式2表示。S(CO' N) = (TBL(S(NE' N)/S(N' N)) 『 S(NE' N)公式 2結果,在信號電平比等於或大於閾值的頻帶中,噪聲消除單元122原樣輸出音頻譜S(NE' N)而不改變該音頻譜S(NE' N)的信號電平。除此之外,在信號電平比小於閾值的頻帶中,由於音頻譜S(NE' N)被假設為噪聲譜S(N' N),所以噪聲消除單元122輸出信號電平為零的音頻譜S (NE' N)。另外,考慮恆定噪聲N' N的評估誤差,噪聲消除單元122可將信號電平比的閾值設置為比信號電平比的閾值(1.0)稍大的值。由此,即使在恆定噪聲N' N的信號電平由於恆定噪聲N' N的評估誤差的原因而被評估為低於實際電平的情況下,噪聲消除單元122 也能夠消除該恆定噪聲N' N。IFFT處理單元13是快速逆傅立葉變換電路,其將作為頻域信號的音頻信號CO' N 轉換成作為時域信號的音頻信號CO' T。通過上述配置,由於聲音採集裝置1能夠保持音頻信號的原樣而不對具有講話者發言語音的頻帶內的音頻信號進行削弱,所以能夠輸出講話者的發言語音而不降低其質量。參考圖3(A)至圖3(C)來描述作為噪聲門12輸出值的消除了噪聲後的音頻信號 CO' N。圖3(A)至圖3(C)是分別示出恆定噪聲、音頻信號和消除恆定噪聲後的音頻信號的示例的示圖。圖3(A)指示了恆定噪聲的信號電平,圖3(B)指示了包括恆定噪聲的音頻信號的信號電平,以及圖3(C)指示了消除恆定噪聲後的音頻信號的信號電平。聲音採集裝置1對圖3 (A)所示的恆定噪聲N' N進行評估並生成如圖3 (B)所示的音頻信號NE' N。當聲音採集裝置1僅僅簡單地從音頻信號NE' N中減去噪聲N' N以此來從音頻信號NE' N中消除恆定噪聲N' N時,如圖3(C)中的虛線所示,即使在具有講話者發言語音的頻帶中,音頻信號NE 『 N的信號電平被削弱了,從而聲音採集裝置1會輸出降低了質量的聲音。聲音採集裝置1還會發生這樣的情況,即,由於恆定噪聲N' N的評估誤差而使恆定噪聲N' N仍存在於音頻信號NE' N中。在此情況下,由於在不具有講話者發言語音的頻帶中信號電平顯著變化,所以聲音採集裝置1會生成樂音噪聲。在該實施例中,如圖3(C)中的實線所示,由於聲音採集裝置1保留了具有講話者發言語音的頻帶並且減小了在不具有講話者發言語音的頻帶(只具有噪聲的頻帶)中音頻信號的信號電平(增益),所以聲音採集裝置1能夠在不降低講話者發言語音質量的前提下輸出聲音。另外,由於聲音採集裝置1根據音頻信號NE' N與恆定噪聲N' N之間的信號電平比確定了輸出值CO' N,所以在不具有講話者發言語音的頻帶中不易發生信號電平變化並且能夠防止樂音噪聲的發生。而且,由於聲音採集裝置1計算了音頻信號NE' N與恆定噪聲N' N之間的信號電平比,所以即使在講話者發言語音的水平很低時也能檢測出僅具有噪聲的頻帶。在以上實施例中,聲音採集裝置1對具有講話者發言語音的頻帶中的音頻信號的信號電平進行保持,並使不具有講話者發言語音的頻帶中的音頻信號的信號電平(增益) 設成0,隨後輸出音頻信號。然而,聲音採集裝置1能夠對具有講話者發言語音的頻帶中的音頻信號的信號電平進行保持,並能夠使不具有講話者發言語音的頻帶中的音頻信號的信號電平(增益)減小為大於0的值。圖4是示出增益表的另一示例的示圖。在此情況下, 例如如圖4所示,聲音採集裝置1確定了在不具有講話者發言語音的頻帶中的音頻信號的增益為0. 5,並通過用0. 5乘音頻信號的信號電平來輸出不具有講話者發言語音的頻帶中的音頻信號。以此配置,由於在具有講話者發言語音的頻帶中的恆定噪聲並不明顯,聲音採集裝置1能夠自然地輸出講話者的語音。儘管參考特定實施例詳細描述了本發明,但應當理解的是在不超出本發明精神和範圍的情況下,本領域技術人員可進行各種變型和改變。本發明基於2008年11月21日提交的日本專利申請(JP-2008498332),其內容通過弓|用結合於本文。工業實用性能夠提供一種噪聲門,該噪聲門輸出僅僅消除了其中的恆定噪聲而不會降低講話者發言語音的質量的音頻信號。參考數字及標號的描述1聲音採集裝置11 FFT處理單元12噪聲門121評估單元122噪聲消除單元13 IFFT處理單元MIC麥克風
權利要求
1.一種噪聲門,包括輸入單元,將音頻信號的頻譜輸入到該輸入單元;評估單元,其根據輸入到輸入單元中的音頻信號的頻譜來評估噪聲譜;以及輸出單元,其計算所述音頻信號的頻譜與評估單元評估所得噪聲譜之間的信號電平比並且輸出音頻信號的頻譜,其中信號電平比低於預定閾值的頻帶中的信號電平被降低。
2.根據權利要求1所述的噪聲門,其中通過與評估單元的評估誤差相對應的值將用來與所述信號電平比進行比較的所述閾值設置為大於1的值。
3.一種聲音採集裝置,包括 根據權利要求1或2所述的噪聲門;聲音採集單元,其採集環境聲音並生成音頻信號;變換單元,其將聲音採集單元所生成的音頻信號轉換成頻譜來作為頻域的信號;以及逆變換單元,其將變換單元變換所得的頻譜輸入到所述噪聲門的輸入單元,並將所述噪聲門的輸出單元所輸出的音頻信號的頻譜逆變換成音頻信號來作為時域中的信號。
4.一種噪聲消除方法,包括以下處理 輸入音頻信號的頻譜;根據輸入處理中所輸入的音頻信號的頻譜來評估噪聲譜; 計算音頻信號的頻譜與評估處理中評估所得噪聲譜之間的信號電平比;以及輸出音頻信號的頻譜,其中在所述計算處理中計算出的信號電平比低於預定閾值的頻帶中的信號電平被降低。
5.根據權利要求4所述的噪聲消除方法,其中通過與評估處理中所使用的評估單元的評估誤差相對應的值將用來與所述信號電平比進行比較的所述閾值設置為大於1的值。
全文摘要
本發明提供了一種噪聲門,能夠輸出僅僅消除了其中的恆定噪聲而不會降低講話者發言語音的質量的聲音信號。聲音採集裝置(1)包括FFT處理單元(11);噪聲門(12);以及IFFT處理單元(13)。聲音採集裝置(1)通過FFT處理單元(11)將採集到的聲音信號(NE′T)轉換成頻譜(NE′N)。噪聲門(12)根據聲音信號的頻譜(NE′N)對恆定噪聲的噪聲譜(N′N)進行評估。如果聲音信號的頻譜(NE′N)關於噪聲譜(N′N)的信號電平比小於閾值,則噪聲門(12)在輸出信號之前減小聲音信號的信號電平(增益)。聲音採集裝置(1)輸出音頻信號(CO′T),該音頻信號是在IFFT處理單元(13)中通過將從中消除了恆定噪聲(N′N)的頻譜(CO′N)進行反向變換而生成的。
文檔編號G10L21/02GK102216984SQ20098014629
公開日2011年10月12日 申請日期2009年11月18日 優先權日2008年11月21日
發明者慄山直人, 田中良 申請人:山葉株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀