新四季網

噪聲減小設備和噪聲減小方法

2023-09-19 07:11:15 2

專利名稱:噪聲減小設備和噪聲減小方法
技術領域:
本發明涉及一種能夠減小例如語音信號中包含的噪聲的噪聲減小設備和噪聲去 除(減小)方法。
背景技術:
在諸如攝像機、數位照相機、蜂窩式電話或IC記錄器的電子設備中具有麥克風。 在這種電子設備中,諸如內部盤驅動器等的頭尋道聲音或縮回聲音、透鏡機構的透鏡驅動 聲音或者用戶操作的點擊聲音或觸摸聲音的噪聲可能隨著時間間歇地不規則地發生。在這 種電子設備中,可能出現麥克風拾取了噪聲的問題。為了解決這個問題,日本未審專利申請公報No. 2008-52772、日本未審專利申請公 報No. 2008-71374和日本未審專利申請公報No. 2008-77707提出了這樣的結構,這些結構 被配置為從語音信號或振動傳感器的傳感器輸出檢測噪聲發生時間,並在與檢測到的噪聲 發生時間對應的時段內去除(減小)語音信號的噪聲。

發明內容
當隨著時間間歇地不規則地發生去除目標噪聲時,需要確切地識別噪聲發生狀態 並基於識別結果執行噪聲去除處理。這是因為這在資源的有效利用和聲音方面是有利的。希望比以前更確切地確定去除目標噪聲的發生狀態以去除噪聲。根據本發明的實施例,提供了一種具有下述結構的噪聲減小設備。該噪聲減小設備包括語音信號輸入裝置,用於輸入語音信號以獲取輸入語音信 號;噪聲發生時段檢測裝置,用於檢測輸入語音信號的噪聲發生時段;噪聲去除裝置,用於 從輸入語音信號中去除在噪聲發生時段內發生的噪聲;生成源信號獲取裝置,用於從用於 生成插值信號的使用語音信號中獲取生成源信號,該生成源信號的持續時間被確定為對應 於與噪聲發生時段對應的持續時間;間距計算裝置,用於計算由語音信號輸入裝置輸入的 輸入語音信號中的在噪聲發生時段附近的輸入語音信號區間的間距;區間信號設置裝置, 用於從所述生成源信號設置在基於由間距計算裝置計算的間距而設置的各單位周期區間 中分割的區間信號;插值信號生成裝置,用於基於通過連接相同單位周期區間的區間信號 而形成的單位插值信號部分在時間軸上的排列,生成具有與噪聲發生時段對應的持續時間 的插值信號,並且用於至少在所述單位插值信號部分中交替地排列沿順時間方向的區間信 號和沿逆時間方向的區間信號;以及合成裝置,用於合成所述插值信號和由噪聲去除裝置 去除了噪聲的輸入語音信號並輸出。採用這種結構,從噪聲發生時段內的輸入語音信號中去除噪聲,然後如下生成插 值信號以對由於去除噪聲而損失的語音進行插值。也就是說,通過在與輸入語音信號的間距對應的各預定單位周期區間中連接生成 源信號的時間方向被反轉的區間信號,形成單位插值信號部分,然後通過按時間順序排列 所述單位插值信號部分來生成插值信號。
以這種方式生成的插值信號被視為與輸入語音信號的間距對應的頻率特性的插 值信號。由于振幅波形能夠在區間信號的邊界處彼此連接,所以能夠抑制諧波。
根據本發明的實施例,能夠獲得高質量插值信號。此外,當通過插值信號對噪聲去 除之後的語音信號執行插值處理時,能夠針對進行了插值的語音信號獲得高質量語音。


圖1是示出在根據本發明實施例的噪聲減小設備中執行的順序流程的流程圖。圖2是示出根據實施例的噪聲識別處理器(第一示例)的示例性結構的框圖。圖3A至圖3C是示意性地示出由根據實施例的FFT單元執行的FFT處理的示例的 圖。圖4是示意性地示出在根據實施例的FFT單元中執行的以幀為單位的FFT處理的 示例的圖。圖5是示出根據實施例的三維對應構圖單元的示例性結構的圖。圖6是示出作為由根據實施例的FFT單元處理的結果的三維波形的圖。圖7是示意性地示出由根據實施例的峰值檢測部分執行的峰值檢測處理的圖。圖8A至8B是示出按採樣點的時間順序表示的分割頻率信號的示例的圖。圖9A至9C是示出沿時間軸方向和振幅軸方向對檢測到峰值的分割頻率信號的四 次多項式進行正規化的示例的圖。圖10A至10C是示出沿時間軸方向和振幅軸方向對檢測到峰值的分割頻率信號的 二次多項式進行正規化的示例的圖。圖11是示意性地示出根據實施例的匹配表中的係數圖案的匹配範圍的圖。圖12是示出根據實施例的匹配表的詳細示例的圖。圖13是示出根據實施例的噪聲識別處理器(第二示例)的示例性結構的框圖。圖14是示出根據實施例的噪聲減小設備(第一示例)的示例性結構的框圖。圖15是示出根據實施例的噪聲減小設備(第二示例)的示例性結構的框圖。圖16是示出插值信號源生成器的示例性結構的框圖。圖17是示意性地示出用作第二示例的噪聲減小設備中的插值信號生成處理的示 例的圖。圖18A和18B是示意性地示出進行了噪聲去除插值的語音信號和輸入語音信號之 間的切換時間的示例的圖。圖19是示意性地示出計算噪聲發生時段的處理的示例的圖。圖20是示出根據實施例的噪聲減小設備(第三示例)的示例性結構的框圖。圖21是示出根據實施例的噪聲減小設備(第四示例)的示例性結構的框圖。圖22是示意性地示出適用於第三示例和第四示例的噪聲減小設備的間距對應插 值信號生成處理(第一示例和第二示例)的間距計算和源插值信號的生成的流程的圖。圖23A和23B是示意性地示出第一示例的間距對應插值信號生成處理的圖。圖24A和24B是示意性地示出第二示例的間距對應插值信號生成處理的圖。圖25是示意性地示出適用於第三示例和第四示例的噪聲減小設備的間距對應插 值信號生成處理(第三示例)的間距計算和源插值信號的生成的流程的圖。
6
圖26A至26C是示意性地示出第三示例的間距對應插值信號生成處理的圖。
具體實施例方式在下文中,將按照下面的順序描述本發明的優選實施例(以下,稱為實施例)。1、噪聲去除處理的總體流程2、噪聲識別處理器的示例性結構(第一示例)2-1、總體結構2_2、FFT 處理2-3、峰值檢測2-4、多項式計算/正規化處理2-5、確定是否存在噪聲的處理3、噪聲識別處理器的示例性結構(第二示例)4、噪聲減小設備的示例性結構(第一示例)4-1、總體結構4-2、確定噪聲發生時段的處理5、噪聲減小設備的示例性結構(第二示例)6、噪聲減小設備的示例性結構(第三示例)6-1、示例性總體結構6-2、基於間距(pitch)的插值信號生成處理(第一示例)6-3、基於間距的插值信號生成處理(第二示例)6-4、基於間距的插值信號生成處理(第三示例)7、噪聲減小設備的示例性結構(第四示例)以下,將使用短語「目標噪聲的去除」和短語「目標噪聲的減小」。然而,在說明書 中,短語「目標噪聲的去除」和短語「目標噪聲的減小」以相同的含義使用。短語「目標噪聲 的去除」用於去除語音信號中交疊的噪聲的處理。噪聲去除的含義包括如下情況噪聲未 被完全去除,噪聲的一些成分在一定程度上仍然殘留。短語「噪聲減小」是用於這種方式的 噪聲去除處理的結果的短語。1、噪聲去除處理的總體流程圖1是示出在根據一個實施例的噪聲減小設備中執行的噪聲減小處理的總體順 序的流程圖。根據這個實施例的噪聲減小設備減小語音中交疊的並且隨著時間間歇地不規則 地發生的噪聲。可能從發生源出現隨著時間間歇地不規則地發生的噪聲,例如當電子設備 是內置有盤驅動器的記錄再現設備時,所述噪聲例如為內部盤驅動器的頭尋道聲音或縮回 聲音。當電子設備包括諸如攝像機或數位照相機的成像單元時,透鏡機構的透鏡驅動聲音 和用戶操作的點擊聲音或觸摸聲音變為噪聲的發生源。在圖1的步驟S101中,可能與去除目標噪聲合成的語音信號被首先輸入。步驟 S101中輸入的語音信號的源是由麥克風生成的聲音等,如下所述。在步驟S102中,從在步驟S101中輸入的語音信號提取與噪聲對應的語音的特徵 量(噪聲特徵量)。此時,基於在步驟S103中給出的噪聲的定義,從語音信號提取語音的特
7定特徵量。在步驟S104中,將關於在步驟S102中提取的噪聲特徵量的信息與關於在步驟103 中輸入的噪聲的定義的信息進行比較。關於噪聲的定義的信息包含關於從預先假定的發生 源發生的噪聲的聲音獲得的噪聲特徵量的數據。作為步驟S104中的比較結果,當關於噪聲的定義的信息和關於噪聲特徵量的信 息之間的近似率等於或大於某一值時,確定存在噪聲。另一方面,當近似率等於或小於某一 值時,確定不存在噪聲。當在步驟S104中確定不存在噪聲時,輸入的語音信號在步驟S107中被輸出而不 執行噪聲去除處理。另一方面,當確定存在噪聲時,執行步驟S105和S106中的處理。在步驟S105中,檢測噪聲發生時段。也就是說,直到步驟S104,檢測是否存在噪 聲。在步驟S105中,對檢測到的噪聲的發生時段(發生時間)進行檢測。在步驟S106中,執行去除在步驟S105中檢測到的噪聲發生時段內的在步驟S101 中輸入的噪聲信號中發生的噪聲的處理。當在噪聲去除處理中作為噪聲去除語音分量時,在原始輸入的語音信號的噪聲去 除目標區間中可能遺漏了與作為噪聲被去除的語音分量對應的語音信息。在這種情況下, 為了補充語音信息的遺漏,執行插值語音信號分量的處理。隨後,在步驟S107中,輸出經受 了噪聲去除和插值的語音信號。2、噪聲識別處理器的示例性結構(第一示例)2-1、總體結構圖1中示出的步驟S101至S105的處理是通常在根據這個實施例的噪聲減小設備 的噪聲識別處理器1中執行的處理。圖2是示出作為執行圖1中示出的步驟S101至S105的處理的噪聲識別處理器1 的結構的第一示例的總體結構的圖。圖2中示出的噪聲識別處理器1包括成幀(framing)單元11、FFT單元12、三維 對應構圖單元13、噪聲確定單元14和匹配表15。成幀單元11在圖1的步驟S101中輸入語音信號。在成幀單元11、FFT單元12和 三維對應構圖單元13中執行步驟S102中提取噪聲特徵量的處理。2_2、FFT 處理在這個實施例中,在時間軸上輸入的語音信號通過FFT (快速傅立葉變換)被變換 成頻域的信號(頻率信號)。成幀單元11執行這樣的處理在FFT處理之前,以幀為單位處理輸入語音信號,幀 是FFT處理的單位。由成幀單元11輸入的語音信號是通過預定採樣頻率fs和量化比特率形成的時域 的實數數據(時域數據)。例如,當輸入語音信號的採樣頻率fs是44. 1kHz時,成幀單元 11通過使用與預定持續時間對應的數據數量1024形成一幀,如圖3A所示。FFT單元12在一幀的每個數據中執行FFT處理以把該數據變換成由實數數據Re 和虛數數據Im形成的頻域數據(頻率信號),如圖3B和3C所示。以這種方式,通過把頻域 數據表示為複數數據,可以實現頻域中包含相位的波表現。
當如圖3A所示一幀的數據數量是1024並且採樣頻率fs是44. 1kHz時,在實數數 據Re和虛數數據Im中,尼奎斯特(Nyquist)頻率是22. 05kHz (44. 1 kHz/2)並且數據數量 是512,如圖3B和3C所示。實數數據Re和虛數數據Im中的每一個的頻率解析度大約為 43Hz (22. 05kHz/512 :Nyquist頻率/數據數量)。也就是說,在這種情況下,通過執行FFT 處理,可以獲得包含通過把從0到22. 05kHz的頻帶範圍以43Hz為單位分割為512份而獲 得的每個頻率(以下,稱為分割頻率)的數據的頻率信號。例如,能夠獲得由FFT單元12輸出的頻率信號的數據作為下面的絕對值振幅Va。式 1絕對值振幅 式1的絕對值振幅Va是使用在圖3A至3C的示例中形成實數數據Re和虛數數據 Im的512個數據之中相同分割頻率的實數數據Re計算的。在一幀中,獲得512個絕對值振 幅Va以對應於每個分割頻率。在這個實施例中,位於FFT單元12的後級的三維對應構圖單元13輸入絕對值振 幅Va以執行處理。根據這個實施例的成幀單元11通過在沿輸入語音信號的時間軸(T軸)的前後幀 之間形成交疊區間來使輸入語音信號形成幀,如圖4所示。FFT單元12對以這種方式獲得 的每個幀執行FFT處理以把語音信號轉換成頻率信號。這裡,以這種方式在前後幀之間形成交疊區間的原因如下。對幀的多個數據執行FFT處理。因此,在幀的開始/結束位置附近的FFT處理中, 必須使用一幀的開始位置或結束位置之前的數據。然而,由於無法使用該數據,所以難以從 FFT處理後的數據獲得確切的值。然而,當形成交疊區間時,使用與另一幀交疊所需的所有數據適當地執行一幀的 開始/結束位置附近的FFT處理。以這種方式,通過針對FFT處理提高時間解析度,可以更 確切地獲得FFT處理的計算結果。考慮到FFT處理的頻率解析度和時間解析度之間的平衡,必須在從0%到小於100% 的值的範圍中適當地設置交疊區間的交疊率,即,與一幀交疊的前一幀和後一幀的時間比。2-3、峰值檢測由FFT單元12獲得的頻率信號被輸出到圖2中的三維對應構圖單元13。三雛對應構圖單元13基於由FFT單元12獲得的頻率信號為語音信號的每個噪聲 分量生成一個多項式以獲得多項式的係數圖案(pattern),如下所述。也就是說,執行噪聲 圖案識別(構圖)。噪聲圖案識別對應於步驟S102中的噪聲特徵量的提取。在圖5中示出三維對應構圖單元13的示例性結構。圖5中示出的三維對應構圖單元13包括峰值檢測部分21和n個多項式計算/ 正規化部分22-1至22-n。從FFT單元12輸出的頻率信號被輸入到峰值檢測部分21。如上所述,來自FFT單元12的頻率信號包括圖3B和3C中示出的實數數據Re和 虛數數據Im。例如,針對實數數據Re和虛數數據Im中的每個數據(即,在圖3A至3C的示 例中具有大約43Hz的頻率解析度的頻帶1至512 (分割頻率)中的每個),能夠獲得通過式 1計算的512個絕對值振幅Va(l)至Va(512)。
作為由FFT單元12處理後的示例性結果,在圖6中示出了三維波形。作為由FFT 單元12獲得的頻率信號的該三維波形可通過在每個幀中獲得的512個絕對值振幅Va(l) 至Va(512)的集合而形成。在該三維波形中,頻率軸(F軸)和時間軸(T軸)在平面方向上彼此垂直,A軸代 表垂直方向上的絕對值振幅的值。這裡,在該三維波形中由實線包圍的區域部分An中,在 不同的頻帶中獲得三個峰值。比峰值附近更加突出的波形部分對應於實際上發生噪聲的區 域。也就是說,區域部分An代表發生噪聲的時頻域(噪聲發生區域)。圖5中的峰值檢測部分21檢測例如如圖6中的噪聲發生區域An中所示的三維波 形的峰值。因此,峰值檢測部分21通過使用輸入頻率信號的數據(每個分割頻率處的絕對值 振幅)執行數據映射以獲得圖7中示出的映射數據。這個映射數據表示圖6中示出的三維 波形。在圖7的映射數據中,橫軸代表時間,縱軸代表頻率。這裡,時間Tl、T2、T3、T4、 T5…和頻率Fl、F2、F3、F4、F5…的矩陣被形成為映射數據的一部分。頻率Fl、F2、F3、F4、 F5…中的各頻率對應於與包括實數數據Re和虛數數據Im的512個數據中的各數據對應的 各分割頻率。時間T1、T2、T3、T4、T5…中的各時間對應於獲得一幀的時間。在圖7的對應關係中,峰值檢測部分21從一幀中在時間T1獲得的頻率信號執行 與頻率(分割頻率)Fl、F2、F3、F4、F5…對應的絕對值振幅1、17、33、83、90…的映射。隨 後,從幀單位輸入的頻率信號順序地映射與頻率Fl、F2、F3、F4、F5…對應的絕對值振幅,以 對應於時間T2、T3、T4、T5…。當以這種方式準備了映射數據時,峰值檢測部分21從映射數據的振幅值分布中 檢測等於或大於1的絕對值振幅Va的峰值。在使用映射數據的峰值檢測算法中,3X3矩陣 的塊(採樣點)的集合被設置為峰值檢測範圍。隨後,在峰值檢測範圍中沿同一時間方向和同一頻率方向搜索峰值,如短劃線箭 頭所示。當沿時間方向和頻率方向在相同採樣點獲得峰值作為搜索結果時,與該採樣點對 應的時頻坐標被設置為第一暫時峰值點。另外,在同一峰值檢測範圍中沿與時間方向/頻率方向垂直的兩個方向搜索峰值 以超過頻率和時間,如單點劃線所示。當沿時間方向和頻率方向在相同採樣點獲得峰值作 為搜索結果時,該採樣點的時頻坐標被設置為第二暫時峰值點。當第一暫時峰值點與第二暫時峰值點相同時,該採樣點的時頻坐標被設置為真實 峰值點。在圖7的示例中,通過峰值檢測算法,具有絕對值振幅141的採樣點的坐標(T2, F4)和具有絕對值振幅166的採樣點的坐標(T4,F2)被設置為在映射數據上檢測到的峰值。在這個實施例中,當在分割頻率信號中檢測峰值時,與分割頻率對應的時間順序 的變化同頻率方向上的振幅的變化一起顯示。也就是說,基於由頻率軸和時間軸形成的絕 對值振幅的二維分布檢測峰值。因此,更確切地檢測峰值。該峰值檢測方法只是個示例。實際上,在峰值檢測範圍中形成的採樣點的數量可 以進一步增加。此外,在為檢測峰值而搜索的軸中,可以選擇在該峰值檢測方法中使用的四 個方向中的至少一個。
2-4、多項式計算/正規化處理在圖8A和圖8B中,分別利用特定頻率Fa和Fb下絕對值振幅隨時間的變化來描 述基於從FFT單元12輸出的頻率信號獲得的時間順序頻帶信號(分割頻率信號)。橫軸代 表時間(T軸),縱軸代表絕對值振幅(A軸)。根據這個實施例的語音信號是數字數據,因此在時間上被離散地採樣。例如,在圖 8A的頻率Fa的頻帶信號中,在時間Tl、T2、T3、T4、T5、T6和T7的採樣點的絕對值振幅是 Ala、A2a、A3a、A4a、A5a、A6a和A7a。另外,在圖8B的頻率Fb的頻帶信號中,在時間T1、T2、 T3、T4、T5、T6 和 T7 的採樣點的絕對值振幅是 Alb、A2b、A3b、A4b、A5b、A6b 和 A7b。這裡,在時間上離散地對絕對值振幅進行採樣的事實意味著採樣的絕對值振幅的 峰值不一定表示真實頻帶信號的峰值。例如,圖8A中示出的採樣點的絕對值振幅的峰值是在時間T4的A4a。然而,通過 假想地以曲線(由圖中的短劃線表示)連接時間T1至T7的絕對值振幅Ala至A7a而推定 的真實峰值存在於時間T4之前。同樣地,圖8B中示出的採樣點的絕對值振幅的峰值是在時間T5的A5b。然而,通 過假想地以曲線(由圖中的短劃線表示)連接時間T1至T7的絕對值振幅Alb至A7b而推 定的真實峰值存在於時間T5之前。為了從採樣的絕對值振幅計算儘可能地接近於真實峰值的值,作為一種方法,使 時間解析度提高。也就是說,可以使採樣頻率提高。然而,由於時間解析度和頻率解析度具 有折衷權衡關係,所以最好不要過度地提高時間解析度。為了在考慮到折衷權衡關係的情 況下適當地提高時間解析度,例如,在幀單位的FFT處理中提供了交疊區間,如圖4所示。然 而,當交疊率增加時,處理量變得過大。因此,實際上必須使採樣點以相應的時間間隔離散。根據檢測的峰值獲得的頻帶信號的波形每次會不同,以從由圖8A和圖8B中的每 個短劃線指示的採樣點的包絡線知道波形。這意味著根據由峰值檢測部分21檢測的峰值 獲得的波形可能具有噪聲波形圖案並且可能具有除噪聲以外的必要聲音波形。因此,當由峰值檢測部分21檢測採樣點的峰值時,獲得關於與高精度地推定真實 峰值位置的波形對應的圖案的信息。隨後,需要把這個圖案與準備的噪聲圖案比較。三維對應構圖單元13中的多項式計算/正規化部分22-1至22-n執行下面的處 理以獲得對應於檢測的峰值的圖案。三維對應構圖單元13的峰值檢測部分21輸出各檢測峰值1至n的峰值檢測信號 1至n。在圖7的對應關係中,峰值檢測部分21首先檢測到時間T2處頻率F4的峰值1,然 後輸出與峰值1對應的峰值檢測信號1。隨後,峰值檢測部分21檢測到時間T4處頻率F2 的峰值2,然後輸出與峰值2對應的峰值檢測信號2。在峰值檢測信號中,被檢測為峰值的採樣位置的絕對值振幅點被設置為基準採樣 點。在基準採樣點的絕對值振幅和具有與基準採樣點的頻率相同的頻率的採樣點的絕對值 振幅之中,在時間軸上緊挨在基準採樣點前面的N個採樣點的絕對值振幅和在時間軸上緊 挨在基準採樣點後面的N個採樣點的絕對值振幅被首先輸出。這裡,根據由多項式計算/正規化部分22(22-1至22-n)計算的多項式的次數設 定來確定緊挨在基準採樣點前面和後面的各N個採樣點,如下所述。
多項式計算/正規化部分22首先計算通過與作為峰值檢測信號輸入的一個特定 頻率對應的基準採樣點(具有絕對值振幅)和在時間上分別位於該基準採樣點前面和後面 的各N個採樣點(以下,基準採樣點和分別位於該基準採樣點前面和後面的各N個採樣點 被稱為計算採樣點)的曲線的多項式,或者計算近似這些採樣點的曲線的多項式。這裡,採 樣點指的是其採樣時間和絕對值振幅分別由x軸和y軸表示的點。以這種方式獲得的多項式代表檢測到峰值的頻帶信號的波形。作為通過插值多個採樣點(S卩,它們的坐標)來計算曲線的多項式的方法,已知拉 格朗日插值法、樣條插值法、最小均方近似法等。在這個實施例中,可以使用這些方法中的 任何方法。在下面的描述中,將使用拉格朗日插值法。將簡單地對拉格朗日插值法進行描述。假定在n+1個離散的採樣點x0、xl、x2、…、xn(其中,x0 < xl < x2 <丨< xn) 存在數據 y0、yl、y2、…、yn。通過點(xO,yO)、(xl,yl)、(x2,y2)、…、(Xn,yn)的拉格朗 日插值曲線的函數F(x)是n次多項式,並且能夠通過以下描述的式2來獲得。式2 在圖9A中示出由四次多項式表示基於峰值檢測信號檢測峰值的頻帶信號的示 例。在該四次多項式中,需要五個(=n+1)採樣點。因此,對於在這種情況下的峰值 檢測信號,基準採樣點和與基準採樣點的頻率相同的頻率的在時間上分別位於基準採樣點 前面和後面的各兩個採樣點被輸出到多項式計算/正規化部分22。在圖9A 中,顯示了五個坐標(0.0,7. 0), (-1.0,6. 0), (-2.0,1.0), (1. 0,3. 0)和 (2.0,1.0)作為五個採樣點。在這些坐標之中,坐標(0.0,7.0)是基準採樣點,坐標(-1.0,6.0)和(-2. 0,1. 0) 是緊挨在基準採樣點前面的兩個採樣點,坐標(1.0,3.0)和(2.0,1.0)是緊挨在基準採樣 點後面的兩個採樣點。多項式計算/正規化部分22計算通過這些採樣點的四次多項式。在表達式1中 示出了該四次多項式。 圖9A中示出的曲線通過表達式1獲得。從圖9A的曲線可以看出,通過表達式1獲得的四次多項式的最大值(極值)不同 於基準採樣點的y坐標值。也就是說,在這個實施例中,通過形成更高次多項式,能夠在頻 帶信號(分割頻率信號)中獲得更加近似於真實波形的波形。以這種方式,能夠更確切地 獲得頻帶信號的峰值電平和峰值時間。
多項式處理是通過把時間軸(圖9A至9C和圖10A至10C中的x軸)加到具有頻
率軸和振幅軸的二維頻率信號來形成三維頻率信號的處理。隨後,多項式計算/正規化部分22對通過表達式1獲得的四次多項式進行正規 化。這種正規化是使奇數次項的係數近似於0或足以視為0的值,並簡化與匹配表15的比 較處理以確定噪聲的處理,如下所述。為了執行正規化,多項式計算/正規化部分22首先通過使通過四次多項式最初計 算的最大值的x坐標變為0來執行四次多項式的轉換,如圖9A和9B所示,也就是說,多項 式計算/正規化部分22執行X軸方向(即,時間軸方向)的正規化。在表達式2中示出了代表圖9B中示出的曲線的四次多項式,即,通過時間軸方向 的正規化獲得的四次多項式。F(x) = 0. 3x4+0. 1x3-3. 1x2+7. 3 表達式 2通過比較表達式2和表達式1可知,x3的奇數次係數被轉換為0. 1,即,足以視為 0的值。此外,x的奇數次項的係數被轉換為0。上述時間軸方向的正規化基於這樣的事實「隨著時間間歇地不規則地發生的噪 聲」即去除目標在一定時間內相對急劇地增加和減小。也就是說,具有該性質的噪聲的波形 以峰值點為基準左右對稱。因此,該噪聲強烈地傾向於具有偶函數的曲線。此外,當執行時 間軸方向的正規化時,如圖9B所示,奇數次項的係數被轉換為0或與0相當的值。以這種 方式,抑制了以下描述的係數圖案的變化,並且在匹配表15中準備的匹配範圍的係數圖案 也受到限制。因此,容量變小。多項式計算/正規化部分22還執行振幅軸方向的正規化,從圖9B和9C中的轉變 可以看出。也就是說,圖9B中示出的最大值的坐標是(0.0,7. 3)。示出了 Y坐標值為7. 3 的截距,但此時的截距的值不是整數值。因此,多項式計算/正規化部分22執行正規化以 使截距的值為整數值。這裡,執行正規化以使截距的值變為最接近於正規化前的截距的坐 標的值的整數值。以這種方式,獲得表達式3作為四次多項式。該曲線的最大值的坐標是(0.0, 7. 0),如圖9c所示。F(x) = 0. 3x4+0. 1x3-3. 1x2+7. 0 表達式 3當截距以這種方式變為整數值時,對於係數圖案中的截距的值而言僅需要整數 值。因此,能夠更容易地簡化係數圖案。將參照圖10A至10C描述如下的情況使圖9A至9C中的檢測到峰值的頻帶信號 表達為二次多項式。在二次多項式(其中,n = 2)中,多項式計算/正規化部分22採用基準採樣點和 在時間上位於基準採樣點前面和後面的各一個採樣點(即,總共3( = n+1)個採樣點)作 為峰值檢測信號。然後,在與圖9A至9C中的頻帶信號相同的頻帶信號的情況下,獲得三個 採樣點(0.0,7.0)、(-1.0,6.0)和(1.0,3.0)作為峰值檢測信號,如圖10A所示。通過拉格朗日插值法使用這些採樣點獲得的二次多項式是表達式4。在圖10A中 示出該曲線。F(x) = -2. 5x2-1. 5x+7. 0 表達式 4接下來,通過在時間軸方向上對表達式4進行正規化獲得的二次多項式是表達式
135。通過在時間軸方向上的正規化獲得的二次多項式的曲線顯示在圖10B中。F(x) = -2. 5x2+7. 2 表達式 5從表達式5中可知,通過在時間軸方向上的正規化,x的奇數次項的係數變為0。另外,通過在振幅軸方向上對表達式5進行正規化獲得的二次多項式是表達式6。 通過在振幅軸方向上的正規化獲得的二次多項式的曲線顯示在圖10C中。F (x) = -2. 5x2+7. 0 表達式 6這裡,四次多項式和二次多項式被用作在多項式計算/正規化部分22中正規化的 多項式的示例。然而,在這個實施例中,例如,可以使用六次多項式或除四次多項式和二次 多項式以外的多項式。在以上對正規化的描述中,首先執行時間軸方向的正規化,然後執行振幅軸方向 的正規化。然而,實際上,通過適當地執行時間軸方向和振幅軸方向的正規化,正規化最 終會收斂,並且在收斂完成之前可以交替地執行時間軸方向的正規化和振幅軸方向的正規 化。當檢測到峰值的頻帶信號的多項式和正規化完成時,多項式計算/正規化部分22 輸出代表正規化多項式的係數的數據。也就是說,四次多項式可被表示為F(x) = ax4+bx3+cx2+dx+e0因此,多項式計算/ 正規化部分22輸出代表正規化四次多項式的係數[a、b、c、d和el的組合的數據。這裡, 截距(e)被用作x°的係數。另外,二次多項式可被表示為F(x) = ax2+bx+Co因此,多項式計算/正規化部分 22輸出代表正規化二次多項式的係數[a、b和c]的組合的數據。多項式計算/正規化部分22-1至22-n輸出分別代表相應頻帶信號的係數的組合 的數據(峰值1的係數數據至峰值n的係數數據)。峰值1的係數數據至峰值n的係數數 據是三維對應構圖單元13的輸出。也就是說,峰值1的係數數據至峰值n的係數數據是頻 帶信號被假定為檢測到峰值(即,噪聲被構圖)的頻帶信號的數據。如圖2和圖5所示,為 了方便,作為峰值1的係數數據至峰值n的係數數據的構圖數據基於通過拉格朗日插值法 獲得的函數F(x)的係數被表示為F(x)。2-5、確定是否存在噪聲的處理從三維對應構圖單元13輸出的圖案數據F(x)被輸入到噪聲確定單元14,如圖2 所示。噪聲確定單元14把圖案數據F(x)與匹配表15中保持的參考圖案數據P(x)進行 比較。隨後,基於比較結果,噪聲確定單元14針對每個分割頻率確定是否存在噪聲。這裡,將描述參考圖案數據P (x)。根據這個實施例的噪聲減小設備假定存在去除目標噪聲並且針對這個噪聲(稱 為假定噪聲)執行上述多項式計算和正規化處理。這裡,計算二次多項式(正規化二次多 項式)。圖11是示意性地示出頻率和以上述方式獲得的假定噪聲的正規化二次多項式的 係數a、b和c的數值範圍之間的關係的圖。在圖11中,縱軸代表多項式的係數值,橫軸代表頻率。從圖11可知,假定噪聲的 正規化二次多項式的係數的數值範圍是根據頻率確定的。
14
在這個實施例中,以這種方式獲得的假定噪聲的正規化二次多項式的係數圖案的 範圍被用作匹配範圍。在圖11中,係數a和b以及係數3與(之間的係數比-c/a被定義 為匹配範圍。例如,替代係數比-c/a,可將係數c 一般地定義為匹配範圍。然而,在根據這個實 施例的正規化多項式中,當係數a大時,係數c (截距)傾向於增大。因此,定義了係數比-c/ a,而非係數c。以這種方式,與簡單地將係數c確定為匹配範圍的情況相比,使係數的變化 平均化。結果,由於抑制了匹配範圍的變化並且能夠使匹配範圍更小,所以能夠期待更準確 地獲得噪聲確定結果。保持參考圖案數據P(x)的匹配表15變為代表圖11中示出的係數a和b以及係數 比-c/a的匹配範圍的表格式的數據(匹配數據)。匹配表15的詳細示例顯示在圖12中。 實際上,存儲在匹配表中的數據存儲於例如存儲器等。圖12中示出的匹配表15是FFT處理後的數據,並且假設已獲得圖3B和3C中示 出的數據。此外,為了方便,FFT處理後的信號的頻帶(Nyquist頻率)假設為22. 1kHz。在圖12示出的匹配表15中,FFT處理後的數據位置1到512根據每個預定範圍 進行分割。這裡,該範圍被分割成數據位置1到8、數據位置9到40、數據位置41到53以 及數據位置54到512。這意味著FFT處理後的數據(頻率信號)的頻帶22. 1kHz (源信號 的Nyquist頻率)被分割成四個頻帶範圍(分割頻帶範圍)。換句話說,在每個分割頻帶範 圍中,與數據位置1到512對應的512個分割頻率被分成四組。對於與每個分割頻帶範圍對應的實際頻率範圍,數據位置1到8在從43. 1Hz到 344. 5Hz的範圍中,數據位置9到40在從387. 6Hz到1. 72kHz的範圍中,數據位置41到53 在從1. 77kHz到2. 28kHz的範圍中,數據位置54到512在從2. 33kHz到22. 1kHz的範圍中。針對分別與數據位置1到8、數據位置9到40和數據位置41到53對應的從43. 1Hz 到344. 5Hz、從387. 6Hz到1. 72kHz和從1. 77kHz到2. 28kHz的三個分割頻帶範圍,示出了 係數a和b以及係數比-c/a的每個匹配範圍的上限和下限。沒有針對與數據位置54到512對應的從2. 33kHz到22. 1kHz的最高分割頻帶範 圍存儲有效上限和下限。這意味著在高於大約2. 3kHz的頻帶中不發生假定噪聲。換句話 說,假定噪聲發生在等於或低於大約2. 3kHz (2. 28kHz)的頻帶中。在這種情況下,匹配表15中實際上包含的數據是與數據位置1到8 (從43. 1Hz到 344. 5Hz的分割頻帶頻率)、數據位置9到40 (從387. 6Hz到1. 72kHz的分割頻帶頻率)和 數據位置41到53 (從1. 77kHz到2. 28kHz的分割頻帶頻率)對應的匹配範圍(上限和下 限)的數據。以這種方式,匹配表15不一定具有根據與FFT處理後的數據對應的所有分割 頻率的匹配範圍的數據。匹配表15可具有僅與發生噪聲的頻帶範圍的分割頻率對應的匹 配範圍的數據。以這種方式,能夠減小匹配表15中實際上所需的數據大小。如上所述,匹配表15可以僅具有係數c而非係數比-c/a的匹配範圍。圖12在由 短劃線指示的框中顯示了係數c的每個匹配範圍的上限/下限。由噪聲確定單元14執行的噪聲確定處理按下述方式執行,例如對應於圖12中示 出的匹配表15的結構的情況。噪聲確定單元14首先從三維對應構圖單元13輸入與檢測到峰值的每個頻帶信號 對應的峰值1的係數數據至峰值n的係數數據作為圖案數據F(x)。從匹配表15輸入與峰
15值1的係數數據至峰值n的係數數據對應的分割頻率(數據位置)的係數a和b以及係數 比_c/a(或係數c)的匹配範圍(上限/下限)的數據作為參考圖案數據P(x)。隨後,噪聲確定單元14通過確定由峰值1的係數數據表示的係數a和b以及係數 比-c/a是否包含於與同一分割頻率(數據位置)對應的係數a和b以及係數比-c/a的匹 配範圍中來執行比較處理。當由峰值1的係數數據表示的所有係數a和b以及係數比-c/a包含在該匹配範 圍中時,基於峰值1的係數數據的頻帶信號被確定為噪聲。也就是說,獲得了存在噪聲的確 定結果。另一方面,當由峰值1的係數數據表示的係數a和b以及係數比-c/a中的至少一 個不包含在該匹配範圍中時,獲得了不存在噪聲的確定結果。同樣,基於由峰值2的係數數據至峰值n的係數數據中的各係數數據表示的所有 係數a和b以及係數比-c/a是否包含在該匹配範圍中,確定對於該分割頻率是否存在噪聲。以這種方式,在這個實施例中,對於每個分割頻率確定是否存在噪聲。可以考慮確定是否存在噪聲的不同方法。例如,當由係數數據表示的一定數量以 上的係數包含在該匹配範圍中時,可確定存在噪聲。另一方面,可針對由係數數據表示的系 數值計算與距匹配範圍中的基準值的距離對應的評估值。基於該評估值,可確定是否存在噪聲。上述三維對應構圖單元13允許峰值檢測部分21首先對每個分割頻率的頻帶信號 執行峰值檢測,然後僅對檢測到峰值的頻帶信號執行多項式計算/正規化處理。根據這個實施例,峰值檢測部分21可被省略並且可以不執行峰值檢測。在這種 情況下,各個多項式計算/正規化部分22-1至22-n設置在各分割頻率中。在圖3的示例 中,由於數據數量(即,分割頻率的數量)是512,所以提供512個多項式計算/正規化部分 22-1至22-512以對應於該數據數量。當如參照圖12所述噪聲的頻率特性限制於FFT處理 後獲得的整個頻帶的一些頻帶時,可對應於與噪聲對應的頻帶中所包含的分割頻率提供多 項式計算/正規化部分22。在這種情況下,多項式計算/正規化部分22-1至22-n通常對輸入頻帶信號的每 個採樣執行多項式計算/正規化處理並順序地輸出係數數據。當頻帶信號是噪聲時,以這 種方式輸出的係數數據包含在匹配表15的匹配範圍中。另一方面,當頻帶信號不是噪聲 時,該係數數據不包含在該匹配範圍中。然後,噪聲確定單元14把通常從三維對應構圖單元13作為圖案數據F(x)輸出的 每個分割頻率(頻帶信號)的係數數據與從匹配表15讀取的參考圖案數據P(x)(即,每個 分割頻率的每個係數的匹配範圍)進行比較。作為比較結果,例如,當由係數數據表示的每 個係數值包含在該匹配範圍中時,確定對於該頻帶信號存在噪聲。另一方面,當並非每個系 數值都包含在該匹配範圍中時,確定不存在噪聲。然而,當省略了峰值檢測部分21的峰值檢測時,多項式計算/正規化部分22-1至 22-n需要通常執行多項式計算/正規化處理。此外,噪聲確定單元14需要通常確定是否存 在噪聲。因此,處理量會變得相當大。在這個實施例中,以上述方式執行峰值檢測。如上所述,在這個實施例中的「隨著 時間間歇地不規則地發生」的噪聲(去除目標)相對急劇地增加和減小。因此,當噪聲發生時,相應地獲得顯著的峰值。這意味著當沒有檢測到峰值時,可以認為沒有發生噪聲。因 此,僅當檢測到峰值時,僅通過執行多項式計算/正規化處理就足以檢測到發生的噪聲並 且存在噪聲檢測處理。由於不必通常地執行多項式計算/正規化處理和噪聲檢測處理,所 以處理量變小。例如,能夠減少處理所需的資源。根據這個實施例的噪聲確定單元14能夠確定是否存在噪聲。此外,噪聲確定單元 14能夠輸出關於噪聲確定結果的信息,並且能夠根據需要輸出在噪聲確定結果的計算期間 獲取的計算結果等作為噪聲識別信息。3、噪聲識別處理器的示例性結構(第二示例)圖13是示出根據實施例的噪聲識別處理器的不同示例性結構(第二示例)的圖。 在該圖中,對於與圖2中的部件相同的部件給予相同的標號並省略描述。除了圖2中示出的結構以外,圖13中示出的噪聲識別處理器1A還包括二維對應 構圖單元16、圖案匹配單元17和噪聲圖案存儲單元18。二維對應構圖單元16取得FFT單元12的FFT處理後的數據(見圖3B和3C)並 將該數據作為頻率信號F(n)保持。這裡,以如下的方式對語音信號進行構圖保持並獲得 以二維方式由頻率軸(F軸)和振幅軸(A軸)表示的頻率信號F(n)。噪聲圖案存儲單元18是配置為保持噪聲圖案P(n)的存儲器。能夠通過對假定噪 聲的頻率分布進行建模來獲得噪聲圖案P(n)的數據。圖案匹配單元17執行圖案匹配處理以獲得頻率信號F(n)和噪聲圖案P(n)之間 的相關度Ef。能夠通過下面的計算來獲得相關度Ef。式3 在式3中,N是一幀中FFT點(採樣點)的數量。也就是說,當n = 1到N的採樣 點的噪聲圖案和語音信號之間的相關性較高,相關度Ef變得接近於1。也就是說,當相關度 Ef接近於1時,存在噪聲的可能性高。在圖13的結構中,相關度Ef的值由噪聲確定單元14取得。基本上,如以上的描述中那樣,將每個頻帶信號的係數圖案與匹配表15的匹配範 圍進行比較以確定是否存在噪聲。在圖13中,使用匹配表15獲得確定結果,並且還確定相 關度Ef是否等於或大於預定閾值。也就是說,在與一個頻帶信號對應的噪聲的確定過程 中,當該頻帶信號的係數圖案包含在匹配表15的匹配範圍中並且還處於相關度Ef等於或 大於閾值的頻率區域中時,確定存在噪聲。另一方面,當頻帶信號的係數圖案包含在匹配表 15的匹配範圍中但處於相關度Ef小於閾值的頻率區域中時,確定不存在噪聲。因此,能夠 更加確切地獲得噪聲確定結果。4、噪聲減小設備的示例性結構(第一示例)4-1、總體結構
圖14是示出噪聲減小設備的第一示例的圖,該噪聲減小設備包括根據實施例的 作為第一示例的噪聲識別處理器1或作為第二示例的噪聲識別處理器1A。圖14中示出的噪聲減小設備包括麥克風31、放大器32、噪聲去除濾波器33、加 法器34、插值信號源生成器35、插值濾波器36、噪聲識別處理器37、噪聲時間生成處理器38 和開關39。麥克風31包括在安裝有該圖中示出的噪聲減小設備的電子設備中或連接到該電 子設備的外部。例如,當該電子設備是攝像機時,將麥克風31布置為接收記錄語音。麥克 風31接收這個實施例中的去除目標噪聲和原本接收的語音。輸入到麥克風31的語音被轉換成語音信號並被放大器32放大。在這種情況下,從放大器32輸出的數字語音信號(輸入語音信號)被提供給開關 39的端子tm3,並且還轉向以輸入到噪聲去除濾波器33和噪聲識別處理器37。噪聲去除濾波器33由BEF(帶阻濾波器)等形成。噪聲去除濾波器33根據指示 從噪聲識別處理器37輸出的噪聲發生的頻率(分割頻率)的信息(噪聲發生頻率指令信 息),設置必須阻擋(阻止)的頻率。因此,通過噪聲去除濾波器33的語音信號是去除了噪 聲發生的頻率的語音分量的語音。加法器34合成從噪聲去除濾波器33輸出的語音信號和從插值濾波器36輸出的 插值信號。語音信號由插值信號源生成器35和插值濾波器36生成。插值信號源生成器35生成具有在這個實施例中視為噪聲的頻帶(例如,在圖12 的結構中,43. 1Hz到2. 28kHz)的頻率特性的信號。圖16是示出插值信號源生成器35的示例性結構的圖。圖16中示出的插值信號源生成器35包括音調信號生成單元41、M系列信號生成 單元42和合成單元43。音調信號生成單元41通過一定周期的單個或多個正弦波或波脈衝生成音調信 號。由於頻率特性,音調信號具有預定頻率處的單個峰值或者多個峰值。M系列信號生成單元42生成所謂的M系列隨機信號,該信號的電平在整個頻帶上 均一。這個信號的示例是白噪聲。合成單元43以預定合成比合成由音調信號生成單元41生成的音調信號和由M系 列信號生成單元42生成的M系列信號並輸出。從合成單元43輸出的合成信號用作插值信 號源。合成比不是固定的,但是例如可以自適應性地改變。例如,通過分析從麥克風31 接收的語音,計算音調信號的分量和M系列信號的分量之間的近似率。合成比在近似率的 基礎上變化。因此,當在接收的語音中音調信號的分量較大時,可輸出通過分量合成而形成 為接近於音調信號的分量的插值信號源。另一方面,當M系列信號的分量較大時,可輸出通 過分量合成而形成為接近於M系列信號的分量的插值信號源。根據情況,合成比可設置為固定的,以便僅輸出音調信號或僅輸出M系列信號,作 為插值信號源。從插值信號源生成器35輸出的插值信號源被輸出到插值濾波器36。插值濾波器 36是被配置為輸入與從噪聲去除濾波器33輸出的相同的噪聲發生頻率指令信息並設置了與噪聲去除濾波器33的濾波器特性相反的濾波器特性的濾波器。也就是說,在噪聲去除濾 波器33中設置的阻擋頻帶在插值濾波器36中被設置為通過頻帶。在噪聲去除濾波器33 中設置的通過頻帶在插值濾波器36中被設置為阻擋頻帶。採用這種結構,插值濾波器36輸出插值信號源,該插值信號源僅具有與在噪聲去 除濾波器33中被阻擋的頻帶對應的頻帶分量。該插值信號源作為插值信號輸出到加法器 34。加法器34合成從噪聲去除濾波器33輸出的語音信號和從插值濾波器36輸出的 插值信號以把合成的信號輸出到開關39的端子tm2。噪聲識別處理器37具有如上所述的圖2中示出的噪聲識別處理器1的結構或圖 13中示出的噪聲識別處理器1A的結構。在作為噪聲識別處理器37的噪聲識別處理器1和 噪聲識別處理器1A中,由成幀單元11輸入的輸入語音信號用作通過麥克風31和放大器32 獲得的數字語音信號。另外,在作為噪聲識別處理器37的噪聲識別處理器1和噪聲識別處 理器1A中,噪聲去除濾波器33和插值濾波器36輸出噪聲發生頻率指令信息作為噪聲識別 fn息o當噪聲識別處理器37確定在某頻帶信號(分割頻率)中存在噪聲時,噪聲時間生 成處理器38執行確定發生噪聲的時段(噪聲發生時段)的處理。以下描述確定噪聲發生 時段的處理的示例。噪聲時間生成處理器38基於確定結果,把噪聲時間信號tmg_ng輸出給開關39以 指示噪聲發生時段的定時。開關39把端子tml連接到端子tm3以在沒有輸出噪聲時間信號tmg_ng的時段 (即,沒有發生噪聲的時段(噪聲不發生時段))內直接輸出從放大器32輸出的輸入語音信號。相反,在輸出噪聲時間信號tmg_ng的時段(即,發生噪聲的時段)內,開關39把 端子tml連接到端子tm2以輸出從加法器34輸出的語音信號,即,進行了噪聲去除插值處
理的語音信號。例如,當根據這個實施例的噪聲減小設備被安裝在能夠執行記錄的設備中時,記 錄從開關39輸出的語音信號,即,從噪聲減小設備輸出的語音信號。圖18A是示意性地示出從開關39的端子tml隨時間輸出的語音信號的圖。在圖 18A中,橫軸表示時間,縱軸表示語音信號的功率。在圖18A中,噪聲發生時段對應於輸出噪聲時間信號tmg_ng的時段。在噪聲發生時段之前的時段內,從開關39輸出直接從放大器32輸入的語音信號 (輸入語音信號)。也就是說,輸出未進行噪聲去除插值處理的語音信號。這裡,在噪聲發 生時段之前的時段內輸出並且未進行噪聲去除插值處理的語音信號被稱為前語音信號。隨後,當噪聲時間信號tmg_ng的輸出開始並因此噪聲發生時段開始時,未進行噪 聲去除插值處理的語音信號的輸出終止。作為替代,從加法器34輸出的信號(即,進行了 噪聲去除插值處理的語音信號)的輸出開始。當噪聲時間信號tmg_ng的輸出停止並且因此噪聲發生時段終止時,開關39把來 自加法器34的語音信號(進行了噪聲去除插值處理的語音信號)的輸出切換到來自放大 器32的語音信號(未進行噪聲去除插值處理的語音信號)的輸出。在噪聲發生時段之後的時段內輸出並且未進行噪聲去除插值處理的語音信號被稱為後語音信號。在噪聲發生時段內從開關39輸出並且進行了噪聲去除插值處理的語音信號可被 視為以圖18A中示意性地示出的方式通過合成噪聲去除信號和插值信號而形成。這裡,噪聲去除信號是從噪聲去除濾波器33輸出的語音信號。也就是說,噪聲去 除信號是通過由噪聲去除濾波器33從源語音信號中去除發生噪聲的分割頻帶的分量而形 成的語音信號。通過一定程度地去除發生噪聲的頻帶,噪聲去除信號的信號功率變得低於 源語音信號的信號功率。然而,插值信號是由從源語音信號中去除的頻帶形成的語音信號。 因此,通過由加法器34合成插值信號,從開關39輸出並進行了噪聲去除處理的語音信號具 有與源語音信號相同的信號功率。圖18A示出了噪聲發生時段的語音信號的包絡線連接到 前信號和後信號的包絡線。因此,進行了噪聲去除處理的語音信號的信號功率(電平)與 源語音信號的信號功率(電平)相同。在這個實施例中,在噪聲發生時段(其也是去除噪聲的噪聲去除時段)內不去除 源語音信號的整個頻帶的分量。例如,為了執行噪聲去除和插值,通過在噪聲發生時段內去除源語音信號的整個 頻帶的分量首先去除噪聲。另一方面,可將進行了噪聲去除處理的語音信號與具有源語音 信號的整個頻帶的插值信號合成以生成進行了噪聲去除插值處理的語音信號。然而,在這 種情況下,該語音信號在聽覺方面可能不自然,這是因為語音信號容易在噪聲發生時段內 在整個頻帶變成插值信號。然而,在這個實施例中,根據上述噪聲去除濾波器33和插值濾波器36的處理,通 過在噪聲發生(去除)時段內從源語音信號中僅去除確定為具有噪聲的分割頻率的頻帶來 去除噪聲。換句話說,不發生噪聲的頻帶保留在源語音信號中。隨後,通過合成插值信號僅 補充在噪聲去除過程中去除了頻帶的語音信號的分量。以這種方式,可以提高噪聲發生時 段與前面和後面的語音時段的語音連續性。因此,能夠更有效地實現掩蔽效應,由此獲得未 損壞源語音的在聽覺方面自然的語音。圖18B是示出在時間軸方向合成作為前信號和後信號的源語音信號(從放大器32 輸出的語音信號)和噪聲去除/插值信號(從加法器34輸出的語音信號)的另一示例的 圖。在圖18A中,前信號在噪聲發生時段的開始點被瞬時地切換到噪聲去除/插值信 號。同樣地,噪聲去除/插值信號被瞬時地切換到後信號。在信號切換中,例如,在去除了 噪聲的頻帶中,作為前信號的源語音信號的分量被瞬時地切換到插值信號。另外,插值信號 被瞬時地切換到作為後信號的源語音信號。因此,例如,在切換時刻可能發生諧波,由此語 音可能聽起來不自然。因此,在圖18B中,提供了執行淡入淡出(cross-fade)處理的時段(淡入淡出時 段)以在從噪聲發生時段的開始點起的一定時段內逐漸減小前信號並把噪聲去除/插值信 號逐漸增大到其源電平。同樣地,提供了在到噪聲發生時段的結束點為止的一定時段內將 後信號逐漸增大到其源電平並且將噪聲去除/插值信號逐漸減小的淡入淡出時段。以這種方式,通過在噪聲發生時段的開始點和結束點的一定時段內對源語音信 號和噪聲去除/插值信號執行淡入淡出處理,可以顯著地抑制諧波的發生以及避免振鈴 (ringing)現象、過衝(overshot)現象等。因此,能夠獲得在聽覺方面更自然的語音。
20
通過在開關39中提供淡入淡出開關,能夠實現淡入淡出時段的語音信號的電平 變化。例如,淡入淡出開關經由控制係數可變的衰減器合成並輸出兩個輸入語音信號。例 如,控制係數c是從0到1的範圍的值。衰減器輸出具有源信號電平Xc的電平的語音信號。隨後,在淡入淡出時段內,一個衰減器的控制係數cl隨時間變化在從0到1的範 圍中增大,然後,另一衰減器的控制係數c2變化以滿足c2 = 1-cl的關係。淡入淡出時段可基於噪聲時間信號tmg_ng決定。例如,噪聲時間信號tmg_ng具 有用於指示噪聲發生時段的開始/結束時間點的細節。例如,用作淡入淡出開關的開關39 在從噪聲發生時段的開始時間點起的一定時段內執行所有的淡入淡出處理。此外,確定從 噪聲發生時段的結束時間點回溯淡入淡出時段的特定時刻,並且從該特定時刻到噪聲發生 時段的結束時間點執行最後的淡入淡出處理。例如,只有進行了噪聲去除插值處理的信號(即,僅從加法器34輸出的語音信號) 可通常地從噪聲減小設備輸出。然而,由於從加法器34輸出的語音信號是經由配置為執行 噪聲去除插值處理的處理系統輸出的,所以與輸入語音信號相比,從加法器34輸出的語音 信號劣化。然而,在根據這個實施例的噪聲減小設備中,來自開關39的輸入語音信號在沒 有變化的情況下輸出,以輸出高質量語音信號。4-2、確定噪聲發生時段的處理接下來,將參照圖19描述由圖14中的噪聲時間生成處理器38執行的確定噪聲發 生時間的處理。在對附圖的描述中,在多項式計算中使用二次多項式。當噪聲識別處理器37 (噪聲識別處理器1或1A)確定在某頻帶信號(分割頻率) 存在噪聲時,噪聲時間生成處理器38執行確定噪聲發生時段的處理。例如,當噪聲識別處理器37確定存在噪聲時,噪聲識別處理器37例如把存在噪聲 的分割頻率的係數數據作為噪聲識別信息發送給噪聲時間生成處理器38。噪聲時間生成處理器38基於以上述方式獲取並由存在噪聲的分割頻率的係數表 示的二次多項式,計算圖19中示出的坐標P、Q和R。在圖19中,坐標軸中的橫軸和縱軸(A 軸)分別表示時間和絕對值振幅Va。二次多項式變為最大值的時間被設置為水平時間軸上 的0。坐標Q(0,yl)是由係數數據表示的二次多項式的曲線的最大值的坐標。坐標 P(_l,y0)是二次多項式的曲線中在時間上位於坐標Q之前的任意坐標。坐標R(l,y2)是 二次多項式的曲線中在時間上位於坐標Q之後的任意坐標。這裡,曲線中的坐標P在時間 軸上的坐標值是-1。另外,曲線中的坐標R在時間軸上的坐標值是1。隨後,計算二次多項式的曲線的切線,即,通過坐標P (-1,y0)的切線TLp和通過坐 標R(l,y2)的切線TLr。切線TLp和TLr能夠由線性函數表示。針對坐標設置閾值線Lm。閾值線Lm是表示為x = y3並且平行於時間軸的直線。 在這種情況下,閾值y3是根據最大值yl通過表達式y3 = yl*a(其中,a < 1)計算的值。 也就是說,作為相對於最大值小一定比率的值,計算閾值y3。具體地講,閾值y3可被設置為 大約為最大值yl的10% (其中,a = 0. 1)的較小值。隨後,計算閾值線Lm和切線TLp的交點的坐標。在這個實施例中,實際上與該交 點的x坐標對應的時間被設置為噪聲發生的開始時間,即噪聲開始點S。
21
同樣地,計算閾值線Lm和切線TLr的交點的坐標。實際上與該交點的x坐標對應 的時間被設置為噪聲發生的結束時間,即噪聲結束點E。也就是說,從噪聲開始點S的時間到噪聲結束點E的時間的時段是檢測的噪聲發 生時段Tn,如圖中所示。噪聲時間生成處理器38檢測發生噪聲的每個頻帶信號(分割頻率)的噪聲發生 時段。通過使用針對頻帶信號的採樣點獲得的多項式,檢測(確定)噪聲發生時段。由 於如上所述將頻帶信號表示為多項式,所以能夠獲得更接近於更真實的波形的頻帶信號波 形。以這種方式,可以高精度地對每個分割頻率執行噪聲確定處理。能夠基於同一多項式 計算噪聲發生時段。因此,能夠以更高的精度檢測噪聲發生時段的開始時間和結束時間。隨後,噪聲時間生成處理器38基於以上述方式在每個分割頻率確定的噪聲發生 時段,生成噪聲時間信號tmg_ng。例如,通過計算在每個分割頻率確定的噪聲發生時段的邏輯和並且通過把該邏輯 和的輸出設置為噪聲時間信號tmg_ng,來獲得噪聲時間信號tmg_ng。在這種情況下,獲得 如下的噪聲時間信號tmg_ng 該信號在至少一個分割頻率下發生噪聲的時段內變為H電 平,並且在不存在發生噪聲的分割頻率的情況下變為L電平。當噪聲時間信號tmg_ng處於 H電平時,開關39把端子tm2連接到端子tml以輸出進行了噪聲去除處理的語音信號(從 加法器34輸出的語音信號)。另一方面,當噪聲時間信號tmg_ng處於L電平時,開關39把 端子tm3連接到端子tml以輸出未進行噪聲去除處理的語音信號(從放大器32輸出的語 音信號)。5、噪聲減小設備的示例性結構(第二示例)圖15是示出根據這個實施例的噪聲減小設備的第二示例的圖。在該圖中,對於與 圖14中的部件相同的部件給予相同的標號,並且省略描述。在圖15中,替代圖14中示出的插值信號源生成器35,提供了源插值信號生成器 35A。源語音信號從放大器32輸入到插值信號源生成器35。從噪聲時間生成處理器38 輸入噪聲識別信息。圖14中的插值信號源生成器35獨立地生成插值信號源,即插值信號的基本信號。 然而,圖15中的源插值信號生成器35A基於從放大器32輸入的語音信號(輸入語音信號) 生成插值信號的基本語音信號。由源插值信號生成器35A生成的語音信號稱為源插值信號 並且由圖14中示出的插值信號源生成器35生成。例如,源插值信號不同於作為白噪聲等 的插值信號源。參照圖17描述由源插值信號生成器35A生成源插值信號的處理。圖17示出源語音信號的波形。在這個波形中,橫軸表示時間(T軸),縱軸表示振 幅(A軸)。例如,源插值信號生成器35A從噪聲時間生成處理器38作為噪聲識別信息輸入指 示噪聲發生時段的時間ts和時間te的信號以及指示在噪聲發生時段內語音信號(即,噪 聲)變為峰值的時間(峰值時間tq)的信號。例如,指示噪聲發生時段的時間ts和時間te的信號與從噪聲時間生成處理器38
22輸出到開關39的噪聲時間信號tmg_ng相同。例如,從自噪聲識別處理器37輸入的噪聲識 別信息(正規化多項式的係數)能夠獲得指示峰值時間tq的信號。以這種方式,源插值信 號生成器35A能夠識別指示語音信號中噪聲發生的開始和結束的開始時間ts和結束時間 te,並且還能夠識別語音信號中發生的噪聲的振幅變為峰值的峰值時間tq。這裡,由噪聲時間信號tmg_ng指示的噪聲發生時段的時間ts和te對應於如上所 述的一個或多個分割頻率的噪聲發生時段的邏輯和。因此,在圖17中示出的語音信號中, 在噪聲發生時段內從時間ts到時間te發生噪聲,而在時間ts之前和時間te之後沒有噪 聲發生。如圖17所示,源插值信號生成器35A生成前插值信號和後插值信號,並把前插值 信號連接到後插值信號以生成源插值信號。源插值信號生成器35A首先執行生成前插值信號的處理以計算噪聲發生時段中 從開始時間ts到峰值時間tq的持續時間(時間長度)W1。隨後,計算從開始時間ts回溯 持續時間W1的時間tpr。獲取從時間tpr到時間ts的區間中的語音信號,即緊挨在開始時 間ts前面的持續時間W1的區間中的語音信號(噪聲前信號),作為前插值信號。此外,源插值信號生成器35A執行生成後插值信號的處理以計算噪聲發生時段中 從峰值時間tq到結束時間te的持續時間W2。隨後,計算從結束時間te推進了持續時間 W2的時間tps。獲取從時間te到時間tps的區間中的語音信號,即緊挨在結束時間te後 面的持續時間W2的區間中的語音信號(噪聲後信號),作為後插值信號。隨後,源插值信號生成器35A連接以這種方式生成的前插值信號和後插值信號, 使得前插值信號在時間上位於後插值信號之前。以這種方式連接的語音信號具有與噪聲發 生時段對應的時間長度,如圖17所示。該語音信號用作源插值信號。插值濾波器36輸入由源插值信號生成器35A生成的源插值信號。如在第一示例 中那樣,插值濾波器36基於與輸出給噪聲去除濾波器33的噪聲發生頻率指令信息相同的 噪聲發生頻率指令信息,僅使與由噪聲去除濾波器33阻擋的頻帶對應的頻帶分量通過,並 隨後把該頻帶分量作為插值信號輸出到加法器34。即使在這種情況下,通過僅阻擋發生噪聲的分割頻率的分量以由噪聲去除濾波器 33去除該噪聲分量並通過由加法器34利用插值信號補充由噪聲去除濾波器33略去的頻 率,來生成從加法器34輸出的語音信號。也就是說,獲得了進行了噪聲去除插值處理的語
音信號。在第二示例中,如圖17所示,通過使用緊挨在噪聲發生時段前面和後面的語音信 號區間,生成插值信號(源插值信號)。緊挨在噪聲發生時段前面和後面的語音信號區間是 在任何頻帶中沒有噪聲發生的語音信號。此外,由於該語音信號是緊挨在噪聲發生區間前 面和後面的語音信號區間,所以該語音信號與在噪聲發生區間內發生的除噪聲以外的語音 的關聯性和連續性強。也就是說,在這個實施例中,不發生噪聲並且語音內容與噪聲發生區間的語音內 容具有高度連續性的語音信號被用作插值信號。因此,可以期待進行了噪聲去除處理的語 音在聽覺方面更加自然。由源插值信號生成器35A執行的源插值信號生成能夠通過生成僅具有噪聲前信 號或僅具有噪聲後信號的源插值信號而得到簡化。這個處理與以下描述的圖22中示出的
23源插值信號生成處理相同。然而,語音信號的語音內容可能在噪聲發生之前和噪聲發生之後改變。例如,語音 內容可能容易地在發生的噪聲的峰值的邊界處改變。因此,當在聽覺方面的自然聲音優先 時,優選地生成前插值信號和後插值信號,並且將前插值信號和後插值信號的連接點設置 為與噪聲發生時段中噪聲的峰值對應的時間,如圖17所示。作為生成具有前插值信號和後插值信號的源插值信號的情況的變型例,可以考慮 這樣的方法將前插值信號簡單地在預定邊界時間點(諸如噪聲發生時段的中間時間點) 連接到後插值信號。6、噪聲減小設備的示例性結構(第三示例)6-1、示例性總體結構接下來,將描述根據這個實施例的噪聲減小設備的第三和第四示例。在第三和第 四示例中,應用了基於間距周期執行的插值信號生成處理,如下所述。圖20是示出作為根據這個實施例的第三示例的噪聲減小設備的示例性結構的 圖。在圖20示出的結構中,基於間距周期配置在作為圖15示出的第二示例的噪聲減小設 備中執行的插值信號生成處理。在圖20中,對於與圖15中的部件相同的部件給予相同的 標號,並且省略描述。在圖20示出的結構中,間距計算器51被添加到圖15示出的結構。這裡,替代圖 15中示出的源插值信號生成器35A,提供了源插值信號生成器35B,源插值信號生成器35B 基於輸入語音信號(使用語音信號)的間距執行插值信號生成處理(間距對應插值信號生 成處理)以生成源插值信號。在圖20中,噪聲去除插值單元50包括噪聲去除濾波器33、加法器34、插值信號 源生成器35、源插值信號生成器35B、插值濾波器36和間距計算器51。噪聲識別信息從噪 聲時間生成處理器38輸出到噪聲去除插值單元50。從放大器32將輸入語音信號輸入間距計算器51以計算間距。這裡,間距指的是 與語音信號的基本頻率對應的周期時間。存在計算間距的各種方法。這裡,例如,將簡單地描述AMDF (平均振幅差函數)。 AMDF僅執行加法和減法的計算處理。然而,雖然AMDF比自相關或FFT更簡單並簡單地執行 處理,但間距的提取精度相對較高。AMDF的間距通過式4來計算。式 4 在式4中,X表示通過時間1到N的時間窗取得的輸入信號,D(m)表示輸入信號X 的時間差m的差的總和。計算D(m)的最小值m作為間距。D(m)的值變為最小值的情況指 的是這樣的情況兩個信號x的相位差是360°,也就是說,發生了一個周期的時間差,因此 相同的波形彼此交疊。關於以這種方式計算的間距的信息被源插值信號生成器35B輸入並用於生成源
插值信號。由源插值信號生成器35B生成的源插值信號是具有與輸入語音信號對應的頻帶的語音信號。如第一示例和第二示例的噪聲減小設備中那樣,插值濾波器36設置由從噪聲 識別處理器37輸入的噪聲識別信息提供的濾波器特性,並且僅使發生噪聲的頻率通過,並 且使源插值信號通過。以這種方式,獲得僅具有發生噪聲的頻率的頻帶特性的插值信號,並 且該插值信號輸入到加法器34。加法器34合成來自噪聲去除濾波器33的語音信號和該插值信號以輸出合成的信 號作為進行了噪聲去除插值處理的語音信號。6-2、基於間距的插值信號生成處理(第一示例)接下來,將描述基於輸入語音信號(使用語音信號)的間距在圖20示出的第三示 例的噪聲減小設備中執行的插值信號生成處理(間距對應插值信號生成處理)。將描述間 距對應插值信號生成處理的第一示例至第三示例。圖22是示意性地示出在用於執行第一示例的間距對應插值信號生成處理的圖20 示出的噪聲減小設備中的由間距計算器51執行的間距計算和由源插值信號生成器35B執 行的源插值信號(生成源信號)的生成的流程的圖。指示噪聲發生時段的信號(例如,噪聲時間信號tmg_ng)作為從噪聲時間生成處 理器38輸出的噪聲識別信息被輸入到圖20中示出的間距計算器51,以識別噪聲發生時段 Tn的開始時間ts0隨後,間距計算器51按照輸入語音信號的時間順序,將在識別的開始時間ts之前 並在噪聲發生時段Tn附近的預定時段設置為間距計算時段Tp。圖22示出間距計算時段 Tp被設置為緊挨在開始時間ts之前的示例。間距計算器51通過使用以上述方式設置的間距計算時段Tp的輸入語音信號,根 據諸如上述AMDF的方法計算輸入語音信號的間距。這裡,間距計算時段Tp是在噪聲發生時段Tn之前的語音信號區間。也就是說,輸 入語音信號是在任何頻帶沒有噪聲發生的信號。在這個實施例中,使用沒有噪聲發生的區 間的語音信號計算間距。以這種方式,準確地計算間距。隨後,為了生成源插值信號,源插值信號生成器35B作為從噪聲時間生成處理器 38輸出的噪聲識別信息輸入表示噪聲發生時段的信號(例如,噪聲時間信號tmg_ng),以識 別時間長度,即,噪聲發生時段Tn的開始時間ts。隨後,源插值信號生成器35B設置具有通過噪聲發生時段Tn = 1. 5*Tsl的關係表 示的時間長度的噪聲前源信號區間Tsl。噪聲前源信號區間Tsl被設置為緊挨在輸入語音 信號中的開始時間ts前面,如圖22所示。源插值信號生成器35B通過使用噪聲前源信號區間Tsl內的輸入語音信號,以圖 23A和23B中示出的方式生成源插值信號。圖23A示出噪聲前源信號區間Tsl的輸入語音信號的所有部分。如圖23A所示,源插值信號生成器35B根據時間順序把噪聲前源信號區間Tsl的 輸入語音信號分割成作為由間距計算器51計算的間距的周期時間pitch的一半(pitch/2) 的單位(單位周期區間)。以這種方式分割的信號單位按時間順序稱為區間信號1、2、…。隨後,源插值信號生成器35B通過使用具有pitch/2周期的區間信號1、2、…,生 成源插值信號,如圖23A和23B中的遷移狀態所示。也就是說,沿順時間方向的區間信號1首先被複製作為第一個pitch/2周期區間
25中的插值信號。對圖23A中示出的輸入語音信號的區間信號1進行處理以便不加改變地按 FIFO(先入先出)方式對它進行讀取。也就是說,區間信號按時間順序寫入到存儲器,然後 按與寫入時的順序相同的順序被讀取。在第二個pitch/2周期區間中使用沿時間順序源信號的逆方向轉換的區間信號1 和2。關於沿逆方向的區間信號,圖23A中示出的輸入語音信號的區間信號按FIL0(先入後 出)方式輸出。也就是說,區間信號按時間順序寫入到存儲器,然後按與寫入時的順序相反 的順序被讀取。隨後,對於沿逆時間方向的區間信號1和2,例如,區間信號1按照從100%到0% 的比率減小並且區間信號2按照從0%到100%的比率增大,以執行淡入淡出(交疊)處理 和執行合成處理。以這種方式獲得的語音信號作為與第二個Pitch/2周期區間對應的語音 信號被連接。在第三個pitch/2周期區間中連接沿順時間方向的區間信號2。以這種方式,在第一示例的間距對應插值信號生成處理中,使用與兩個連續的 pitch/2周期區間對應的區間信號,生成與三個連續的pitch/2周期區間對應的源插值信 號。隨後,例如,通過與區間信號1和2相同的處理,使用作為輸入語音信號中接下來的兩 個連續信號的區間信號3和4來生成與接下來的三個(第四至第六)連續的pitch/2周期 區間對應的源插值信號。隨後,執行相同的處理,直到噪聲前源信號區間Tsl的末端。在這種情況下,使用形成噪聲前源信號區間Tsl的所有區間信號形成的源插值信 號的時間長度被表示為1. 5*Tsl,如圖22所示。也就是說,該源插值信號可被視為按照噪聲 前源信號區間Tsl的1. 5倍在時間軸方向上擴張。通過以基於從輸入語音信號計算的間距設置的周期區間來排列區間信號而生成 的插值信號具有與輸入語音信號的間距對應的頻率特性。也就是說,通過輸入語音信號和 插值信號能夠獲得頻率特性的連續性。這裡,在圖23B中,通過按照順時間方向和逆時間方向的順序把第一個pitch/2周 期區間的結束位置處的區間信號1連接到第二個pitch/2周期區間的開始位置處的區間信 號1,使相同的區間信號1的振幅彼此對應。也就是說,振幅波形在第一個pitch/2周期區 間和第二個Pitch/2周期區間之間的邊界處被彼此連接。同樣地,通過按照逆時間方向和順時間方向的順序連接第二個pitch/2周期區間 的結束位置和第三個pitch/2周期區間的開始位置的相同的區間信號2,振幅波形在第二 個pitch/2周期區間和第三個pitch/2周期區間之間的邊界處被彼此連接。也就是說,源 插值信號需要在Pitch/2周期區間的邊界處連接。例如,在前述的日本未審專利申請公報No. 2008-52772、日本未審專利申請公報 No. 2008-71374和日本未審專利申請公報No. 2008-77707中公開的插值信號生成方法如下 執行。也就是說,通過對噪聲發生時段的開始點之前和之後的與一個間距周期對應的兩 個信號區間執行淡入淡出處理,生成與一個間距周期對應的加權加法信號。隨後,通過反覆 連接一個相同的加權加法信號,生成與噪聲發生時段對應的前半信號。同樣地,生成後半信 號。也就是說,通過對噪聲發生時段的結束點之前和之後的與一個間距周期對應的兩個信 號區間執行淡入淡出處理,生成與一個間距周期對應的加權加法信號。隨後,通過反覆連接一個相同的加權加法信號,生成與噪聲發生時段對應的後半信號。隨後,通過對以這種方式生成的前半信號和後半信號執行淡入淡出處理,生成與 噪聲發生時段對應的插值信號。在日本未審專利申請公報No. 2008-52772、日本未審專利申請公報No. 2008-71374 和日本未審專利申請公報No. 2008-77707中,通過簡單地把與一個間距周期對應的加權加 法信號反覆彼此連接,形成插值信號。當相同的信號被簡單地重複時,在重複的周期中新出 現稱為比特音的噪聲。例如,當噪聲發生時段變得更長或者間距周期變得更短時,隨著重複 次數的增加,容易發生該比特音。在日本未審專利申請公報No. 2008-52772、日本未審專利申請公報No. 2008-71374 和日本未審專利申請公報No. 2008-77707中,通過對兩個語音信號執行淡入淡出處理形成 插值信號,並且還通過對前半信號和後半信號執行淡入淡出處理形成最終獲得的插值信 號。例如,與使用單個語音信號的情況相比,通過淡入淡出處理容易保持前後語音信號之間 的連續性。然而,根據進行了淡入淡出處理的兩個語音信號之間的相位差的條件,結果可能 互相不匹配。因此,可能無法避免信號電平的劣化。當信號電平的劣化發生時,這種狀態在 噪聲去除處理期間反覆或持續。因此,可能無法獲得充分的插值效果。在日本未審專利申請公報No. 2008-52772、日本未審專利申請公報No. 2008-71374 和日本未審專利申請公報No. 2008-77707中,基於輸入語音信號生成插值信號。因此,容易 實現噪聲發生時段之前和之後的語音信號和插值信號之間的連續性。然而,由於整個噪聲 發生時段或噪聲發生時段的末端的語音信號用於半個加權加法信號中,所以可能形成混合 有噪聲的插值信號,因此,在聽覺方面自然的語音會劣化。然而,在參照圖22以及圖23A和23B描述的這個實施例中,源插值信號中的區間 信號的包絡線(振幅波形)在間距對應插值信號生成處理中的連接位置處連接,如上所述。 因此,在這個實施例中,有效地抑制了引起區間信號的重複的比特音等。當沿相同的順時間 方向的區間信號被簡單地連接時,包絡線在連接點處急劇變化,因此區間信號具有諧波分 量。因此,容易發生比特音。在根據這個實施例的源插值信號中,振幅波形在時間方向反轉的相同區間信號的 連接位置處連接。然而,通常進行點連接,因此很少連接出平滑的切線。因此,在時間方向 反轉的每個區間信號的連接位置處發生諧波分量。然而,與在區間信號的簡單連接中振幅 波形不連續的情況相比,諧波分量較小。因此,相應地抑制了比特音。此外,由源插值信號生成器35B生成的源插值信號通過插值濾波器36僅被限制於 發生噪聲的頻率。此時,由於在點連接發生的諧波分量幾乎被完全去除,所以不會發生問 題。在根據這個實施例的源插值信號中,針對pitch/2周期存在淡入淡出區間。然而, 根據圖23B,每當pitch/2周期連續三次時淡入淡出區間僅出現一次。也就是說,淡入淡出 區間是整個源插值信號的1/3。因此,與對源插值信號的全部區間執行淡入淡出處理的情 況相比,由於淡入淡出區間的相位條件而導致電平降低的可能性低。此外,即使當電平降低 時,降低也在短時間內得到解決。因此,難以注意到該降低。在這個實施例中,由於使用沒有噪聲發生的區間的輸入語音信號來生成源插值信號,所以噪聲混合在源插值信號中。此外,可以提高插值信號與插值信號之前和之後的輸入 語音信號之間的連續性。在這個實施例中,如上所述,通過噪聲去除濾波器33僅去除發生噪聲的頻帶,並 且保留沒有噪聲發生的頻帶而不改變輸入語音信號。因此,通過提高插值信號與插值信號 之前和之後的輸入語音信號之間的連續性,獲得在聽覺方面自然的語音。此外,在執行間距 對應插值信號生成處理的噪聲減小設備中也獲得在聽覺方面自然的語音。在圖22中,當生成源插值信號時,噪聲發生時段Tn之前的輸入語音信號被用作沒 有噪聲發生的區間的輸入語音信號。然而,在上述第一示例的間距對應插值信號生成處理 和下述第二示例的間距對應插值信號生成處理中,可使用噪聲發生時段Tn之後的輸入語 音信號生成源插值信號。在第一示例的間距對應插值信號生成處理中,如圖23A和23B所示,通過把順時間 方向的區間信號和逆時間方向的區間信號均在一個區間信號中彼此連接,形成單位插值信 號部分。然後,將單位插值信號部分按生成源的區間信號的時間順序在時間軸上排列。隨後,在這種情況下,使前單位插值信號部分中的最後區間信號的pitch/2周期 和後單位插值信號部分中的第一區間信號的Pitch/2周期彼此交疊。隨後,在該交疊的 pitch/2周期中,在淡入淡出處理中執行合成。在第一示例中,當使用相同序列(單位周期區間)的偶數個區間信號形成單位插 值信號部分時,使用兩個區間信號。6-3、基於間距的插值信號生成處理(第二示例)接下來,將參照圖24A和24B描述根據這個實施例的間距對應插值信號生成處理 的第二示例。圖24A和24B是示出通過相同時間(單位周期區間)的奇數個區間信號(例如, 最少的三個區間信號)形成單位插值信號部分的示例的圖。在噪聲減小設備中,與圖22的第一示例的間距對應插值信號生成處理中同樣地 執行間距計算器51的間距計算和源插值信號生成器35B的源插值信號(生成源信號)的 生成。在圖24A中,顯示了與圖23A中一樣的噪聲前源信號區間Tsl中的輸入語音信號 的所有部分。也就是說,在第二示例的源插值信號生成器35B中,噪聲前源信號區間Tsl的 輸入語音信號也被分割成具有Pitch/2周期的區間信號1、2…,這與第一示例中一樣。隨後,源插值信號生成器35B在源插值信號的第一個pitch/2周期區間中沿順時 間方向布置區間信號1,如圖24B所示。隨後,源插值信號生成器35B在第二個pitch/2周 期區間中沿逆時間方向布置區間信號1,然後在第三個Pitch/2周期區間中沿順時間方向 布置區間信號1。隨後,源插值信號生成器35B在源插值信號的第四個pitch/2周期區間中沿順時 間方向布置區間信號2。隨後,源插值信號生成器35B在第五個pitch/2周期區間中沿逆時 間方向布置區間信號2,然後在第六個pitch/2周期區間中沿順時間方向布置區間信號2。也就是說,在第二示例的間距對應插值信號生成處理中,一個區間信號按照順時 間方向、逆時間方向和順時間方向的順序排列。該區間信號按時間順序重複。即使在以這種方式形成的源插值信號中,在區間信號的連接位置處的振幅波形的
28包絡線以點連接保持。在第二示例中,當單位插值信號部分由奇數個區間信號形成時,前單位插值信號 部分的最後區間信號和後單位插值信號部分的最初區間信號按順時間方向排列在一起。也 就是說,在前單位插值信號部分的最後區間信號和後單位插值信號部分的最初區間信號所 排列的時段內,在時間上連續的兩個區間信號不加改變地彼此連接。因此,在這些區間信號 的邊界處形成振幅波形的點連接,由此獲得更令人滿意的切線連接。也就是說,當單位插值 信號部分由奇數個區間信號形成時,單位插值信號部分可以按生成源的區間信號的時間順 序簡單地彼此連接。此外,可以不形成源插值信號中對區間信號進行淡入淡出處理的區間。因此,不存 在由於進行了淡入淡出處理的兩個信號的相位條件導致電平減小的問題。在這種情況下,源插值信號具有擴展為噪聲前源信號區間Tsl的3倍的時間長度。 也就是說,作為與源插值信號對應的噪聲發生時段Tn的關係,滿足Tn = 3*Tsl的關係。這 意味著噪聲前源信號區間Tsl具有噪聲發生時段Tn的1/3的時間長度。例如,與第一示例 相比,對應於相同的噪聲發生時段Tn所需的噪聲前源信號區間Tsl能夠縮短至多1/2。在第二示例中,縮短了生成源插值信號所需的輸入語音信號的時間,因此,處理量 變小。在這個實施例中,去除目標噪聲是隨著時間間歇地不規則地發生的噪聲。當在短時 間內發生了多個噪聲時,在當前噪聲發生時段和一個噪聲發生時段之前的噪聲發生時段之 間,發生噪聲的時段可能縮短。然而,即使在這種情況下,獲得沒有噪聲發生的噪聲前源信 號的可能性仍然很高。6-4、基於間距的插值信號生成處理(第三示例)接下來,將參照圖25和圖26A至26C描述根據這個實施例的間距對應插值信號生 成處理的第三示例。圖25是示意性地示出在第三示例中在噪聲減小設備中由間距計算器51執行的間 距計算和由源插值信號生成器35B執行的源插值信號(生成源信號)的生成的圖。在這種情況下,指示噪聲發生時段的信號(例如,噪聲時間信號tmg_ng)也作為從 噪聲時間生成處理器38輸出的噪聲識別信息被輸入到間距計算器51。間距計算器51基於 該信號識別噪聲發生時段Tn的開始時間ts和結束時間te。此外,間距計算器51還基於作 為從噪聲時間生成處理器38輸出的噪聲識別信息輸出並指示噪聲發生時段Tn中的語音聲 音(噪聲音)的信號,識別峰值時間tp。隨後,如第一示例中那樣,間距計算器51將例如在輸入語音信號的時間順序上緊 挨在開始時間ts前面的某時段設置為間距計算時段Tpl,然後通過使用間距計算時段Tpl 的輸入語音信號計算間距。對應於間距計算時段Tpl而計算出的間距稱為前間距。另外,間距計算器51將在輸入語音信號的時間順序上在結束時間te之後並在噪 聲發生時段Tn附近的預定時段設置為間距計算時段Tp2。在圖25中,設置了緊挨在結束時 間te之後的間距計算時段Tp2。間距計算器51通過使用間距計算時段Tp2的輸入語音信 號計算後間距。隨後,為了生成源插值信號,源插值信號生成器35B輸入從噪聲時間生成處理器 38輸出的噪聲識別信息以識別噪聲發生時段Tn的開始時間ts、結束時間te和峰值時間 tp。
在這種情況下,源插值信號生成器35B把前插值信號(前生成源信號)連接到在 前插值信號之後連續的後插值信號(後生成源信號)以生成與噪聲發生時段Tn對應的源 插值信號。然後,源插值信號生成器35B識別作為從識別的開始時間ts到峰值時間tp的前 插值信號時段Tn-1的時間長度,並基於前插值信號時段Tn-1的時間長度計算設置為緊挨 在噪聲發生時段前面的噪聲前信號區間Tsl的時間長度。同樣地,源插值信號生成器35B識別作為從識別的峰值時間tp到結束時間te的 後插值信號時段Tn-2的時間長度,並基於後插值信號時段Tn-2的時間長度計算設置為緊 挨在噪聲發生時段後面的後插值信號時段Ts2的時間長度。以下參照圖26A至26C描述計算噪聲前信號區間Tsl的時間長度和前插值信號時 段Tn-1的時間長度的方法。接下來,將在第三示例中描述由源插值信號生成器35B執行的間距對應插值信號 生成處理。在第三示例中,如以上描述的示例中一樣,源插值信號生成器35B把噪聲前源信 號區間Tsl和噪聲後源信號區間Ts2的各輸入語音信號分割成pitch/2周期的區間信號單 位。在圖26A中,噪聲前源信號的末端的兩個區間信號N-1和N被顯示為噪聲前源信 號區間Tsl的輸入語音信號。在圖26B中,噪聲後源信號的前端的兩個區間信號N+1和N+2 被顯示為噪聲後源信號區間Ts2的輸入語音信號。作為生成前插值信號和後插值信號的間距對應插值信號生成處理,可以使用與第 一示例中的處理對應的處理(單位插值信號部分由偶數個區間信號形成),或者可以使用 與第二示例中的處理對應的處理(單位插值信號部分由奇數個區間信號形成)。在圖26A 至26C中,如第二示例中一樣,單位插值信號部分由奇數個區間信號(例如,三個區間信號) 形成。通過與第二示例中圖24A和24B示出的處理相同的處理來生成前插值信號。在圖 26C中,源插值信號顯示在前插值信號的結束部分和後插值信號的開始部分之間的邊界處。在圖26C中,通過按照順時間方向、逆時間方向和順時間方向的順序排列緊挨在 噪聲前信號區間Tsl中的最後區間信號前面的前插值信號的結束部分的區間信號N-1來形 成一個單位插值信號部分。下一個pitch/2區間是與前插值信號和後插值信號之間的邊界對應的區間。這 個區間後面的pitch/2區間是後插值信號的區間。如圖中所示,噪聲後源信號區間Ts2的 第二區間信號N+2按照順時間方向、逆時間方向和順時間方向的順序排列在pitch/2區間 中。隨後,第三區間信號以後的每個區間信號按照順時間方向、逆時間方向和順時間方向的 順序排列在pitch/2區間中。當執行這種排列直到噪聲後源信號區間Ts2的最後區間信號 時,在末端部分形成後插值信號。隨後,將與一個pitch/2周期的區間對應的連接部分comb定位於前插值信號的最 後單位插值信號部分和後插值信號的最初單位插值信號部分之間,如圖26C所示。通過對噪聲前源信號區間Tsl的最後區間信號N和噪聲後源信號區間Ts2的最初 區間信號N+1執行淡入淡出處理而形成的語音信號被布置在連接部分comb中。在淡入淡
30出處理中,區間信號N在從0 %到100 %的範圍中增大,區間信號N+1在從100 %到0 %的範 圍中減小。因此,在進行了淡入淡出處理的Pitch/2區間和緊挨在進行了淡入淡出處理的 Pitch/2區間前面的pitch/2區間之間的邊界處,在沿順時間方向的區間信號N-1的結束位 置和沿順時間方向的區間信號N的開始位置之間獲得點連接。另外,在進行了淡入淡出處 理的pitch/2區間和緊挨在進行了淡入淡出處理的pitch/2區間後面的pitch/2區間之間 的邊界處,在沿順時間方向的區間信號N+1的結束位置和沿順時間方向的區間信號N+2的 開始位置之間獲得點連接。通過使用前插值信號和後插值信號生成最簡單的源插值信號的方法是簡單地把 通過單位插值信號部分的連接而形成的前插值信號連接到通過單位插值信號部分的連接 而形成的後插值信號的方法。也就是說,通過去除圖26C中示出的連接部分comb進行連 接。然而,在這種源插值信號中,在前插值信號的結束位置和後插值信號的開始位置可能無 法獲得點連接。因此,在圖26A至26C的示例中,提供了連接部分comb。在生成前插值信號和後插值信號的處理中,噪聲後源信號區間的輸入語音信號被 擴展為三倍,與第二示例的間距對應插值信號生成處理中一樣。因此,噪聲前源信號區間 Tsl被設置為具有前插值信號區間Tn-1的1/3的時間長度。同樣地,噪聲後源信號區間Ts2 也被設置為具有後插值信號區間Tn-2的1/3的時間長度。當通過把前插值信號連接到後插值信號來生成源插值信號時,如前述噪聲減小設 備的第二示例中一樣,能夠進一步提高插值信號與該插值信號前面和後面的輸入語音信號 之間的連續性。存在輸入語音信號的間距在噪聲發生時段Tn之前和之後變化的可能。然 而,尤其是在第三示例的間距對應插值信號生成處理中,可以處理噪聲發生時段之前和之 後的間距周期的變化。因此,可得到在聽覺方面更自然的聲音。在第三示例中,存在如下優點對於具有相同的持續時間的噪聲發生時段Tn,與 圖22的第二示例的噪聲前源信號區間Tsl相比,縮短了噪聲前源信號區間Tsl和噪聲後源 信號區間Ts2。7、噪聲減小設備的示例性結構(第四示例)圖21是示出根據實施例的噪聲減小設備的示例性結構(第四示例)的框圖。在圖21中,對於與圖14的第一示例中的部件相同的部件給予相同的標號並省略 描述。由於不是基於輸入語音信號而是基於在插值信號源生成器35中生成的插值信號源 (使用語音信號)生成插值信號,所以圖21中的結構與圖14的第一示例中的結構相同。在圖21中,除了圖14中的結構之外,還布置了間距計算器51和插值信號生成器 35C。在圖21中,如圖20中一樣,噪聲去除插值單元50包括噪聲去除濾波器33、加法 器34、插值信號源生成器35、源插值信號生成器35C、插值濾波器36和間距計算器51。噪 聲識別信息從噪聲時間生成處理器38輸出到噪聲去除插值單元50。間距計算器51具有與圖20示出的第三示例的噪聲減小設備的結構相同的結構。 間距計算器51計算來自放大器32的輸入語音信號的間距,並把指示計算的間距的信息輸 出給源插值信號生成器35C。源插值信號生成器35C輸入插值信號源作為插值信號的生成源信號,並基於計算 的輸入語音信號的間距以下述方式生成源插值信號。
31
在第四示例的噪聲減小設備中,可以執行與第一示例、第二示例和第三示例的處 理中的任一處理相似的處理,作為間距對應插值信號生成處理。當執行與第一示例和第二示例中的間距對應插值信號生成處理相似的處理時,間 距計算器51被配置為執行與圖22中的處理相同的處理。也就是說,使用除噪聲發生時段 Tn以外的噪聲發生時段Tn之前和之後的輸入語音信號中的任一個計算間距。當執行與第 三示例中的間距對應插值信號生成處理相似的處理時,間距計算器51被配置為執行與圖 25中的處理相同的處理。首先,將描述與第一示例中的間距對應插值信號生成處理相似的間距對應插值信 號生成處理。在這種情況下,源插值信號生成器35C從插值信號源的語音信號中獲取具有噪聲 發生時段Tn的2/3倍的持續時間的語音信號。這對應於圖22中設置噪聲前源信號區間 Tsl並提取噪聲前源信號區間Tsl中的語音信號的處理。然而,插值信號源是連續生成並且 不像輸入語音信號那樣混合有噪聲的語音信號。因此,任意地確定從插值信號源中提取具 有噪聲發生時段Tn的2/3倍的持續時間的語音信號的時間。源插值信號生成器35C把插值信號源生成為具有pitch/2周期的區間信號,通過 與圖23A和23B中描述的處理相同的處理生成僅具有噪聲發生時段Tn的持續時間的源插 值信號,然後把源插值信號輸出給插值濾波器36。當執行與第二示例中的間距對應插值信號生成處理相似的間距對應插值信號生 成處理時,源插值信號生成器35C在任意時間從語音信號中提取具有噪聲發生時段Tn的 1/3的持續時間的語音信號作為插值信號源。隨後,源插值信號生成器35C把插值信號源分割成具有pitch/2周期的區間信號, 通過與圖24中的處理相同的處理生成僅具有噪聲發生時段Tn的持續時間的源插值信號, 然後把源插值信號輸出給插值濾波器36。當執行與第三示例中的間距對應插值信號生成處理相似的間距對應插值信號生 成處理時,源插值信號生成器35C在任意時間從語音信號中提取具有前插值信號時段Tn-1 的1/3的持續時間(其是與圖25中的噪聲前源信號區間Tsl的持續時間相同的持續時間) 的語音信號作為插值信號源,然後把該語音信號設置為噪聲前源信號。同樣地,源插值信號 生成器35C在任意時間從語音信號中提取具有後插值信號時段Tn-2的1/3的持續時間(其 是與圖25中的噪聲後源信號區間Ts2的持續時間相同的持續時間)的語音信號作為插值 信號源,然後把該語音信號設置為噪聲後源信號。隨後,源插值信號生成器35C把噪聲前源信號和噪聲後源信號分割成具有 pitch/2周期的區間信號,並按照與圖26A至26C中的處理相同的處理生成源插值信號。在第四示例的噪聲減小設備中,例如,通過間距對應插值信號生成處理生成的源 插值信號不被設置為輸入語音信號,而是設置為插值信號源,即通過合成音調信號和M系 列信號形成的語音信號。然而,例如,與沿順時間方向簡單地連接插值信號源並生成源插值信號的情況相 比,即使當利用與輸入語音信號不同的信號執行插值時,通過根據以上處理生成源插值信 號也能夠獲得在聽覺方面更加自然的語音。這個事實已被發明人進行的實驗所確認。執行上述間距對應插值信號生成處理(第一示例到第三示例)的第三示例和第四
32示例的噪聲減小設備(圖20和圖21)包括噪聲去除濾波器33和插值濾波器36。因此,僅 從噪聲發生時段的輸入語音信號中去除發生噪聲的分割頻率,保留沒有噪聲發生的分割頻 率以生成噪聲去除信號,然後,通過僅由去除的分割頻率形成的頻帶特性的插值信號來填 充該噪聲去除信號。因此,如上所述,噪聲發生時段的輸入語音信號的分量儘可能地保留。 因此,提高了噪聲發生時段之前和之後的時段的輸入語音信號之間的連續性。然而,在間距對應插值信號生成處理(第一到第三示例)中,在噪聲發生時段內可 去除輸入語音信號的全部頻帶,作為替代可以內插具有與全部頻帶的頻帶特性相同的頻帶 特性的插值信號。即使當使用該噪聲去除插值方法時,也通過圖23A和23B、圖24以及圖26A至26C 中示出的間距對應插值信號生成處理(第一示例到第三示例)生成插值信號。採用這種結 構,實現每個Pitch/2周期區間的波形之間的點連接。因此,通過抑制諧波的發生以及縮短 或去除淡入淡出時段,能夠有效地獲得防止由於相位條件而導致電平降低的優點。在根據實施例的各個示例的噪聲減小設備的結構中,放大器32布置在麥克風31 的後級的結構可通過硬體實現。作為另一選擇,該結構可通過DSP (數位訊號處理器)等來 實現。也就是說,該結構可通過在作為DSP的硬體中執行的程序(指令)來實現。作為另 一選擇,該結構可實現為由CPU(中央處理單元)執行的程序。作為另一選擇,可選擇性地 組合硬體、DSP和CPU的程序中的至少兩種。程序例如可存儲在由噪聲減小設備的ROM、HDD或快閃記憶體構成的輔助存儲單元中,或 者例如可存儲在可移動存儲介質中。作為另一選擇,例如,存儲在網絡上的伺服器中的程序 可經由網絡下載,從而用戶能夠獲取該程序。根據實施例的各示例中的噪聲減小設備的示例包括攝像機、具有記錄功能的數 字靜止照相機、蜂窩電話、IC記錄器、包括麥克風並在存儲介質中記錄接收的語音的記錄再 現設備。在這種設備中,需要從由麥克風接收的語音中近於實時地去除噪聲並記錄語音。然 而,根據這個實施例的噪聲減小設備的結構在實時地確定並去除噪聲時是有效的。然而,例如,由根據這個實施例的噪聲減小設備輸入的包含噪聲的語音源包括由 麥克風接收的語音和通過讀取記錄在記錄介質中的語音獲得的語音信號。然而,不存在任 何問題。也就是說,輸入語音信號以獲得輸入語音信號的方法不限於包括麥克風的語音輸 入系統。本申請包含與2009年4月13日提交到日本專利局的日本在先專利申請 JP2009-097190中所公開的主題相同的主題,通過引用將其全部內容包含於此。本領域技術人員應該理解,可以根據設計要求和其它因素進行各種修改、組合、子 組合和替換,只要它們在權利要求或其等同物的範圍內即可。
權利要求
一種噪聲減小設備,包括語音信號輸入裝置,用於輸入語音信號以獲取輸入語音信號;噪聲發生時段檢測裝置,用於檢測輸入語音信號的噪聲發生時段;噪聲去除裝置,用於從輸入語音信號中去除在噪聲發生時段內發生的噪聲;生成源信號獲取裝置,用於從用於生成插值信號的使用語音信號中獲取生成源信號,該生成源信號的持續時間被確定為對應於與噪聲發生時段對應的持續時間;間距計算裝置,用於計算由語音信號輸入裝置輸入的輸入語音信號中的在噪聲發生時段附近的輸入語音信號區間的間距;區間信號設置裝置,用於從所述生成源信號設置在基於由間距計算裝置計算的間距而設置的各單位周期區間中分割的區間信號;插值信號生成裝置,用於基於通過連接相同單位周期區間的區間信號而形成的單位插值信號部分在時間軸上的排列,生成具有與噪聲發生時段對應的持續時間的插值信號,並且用於至少在所述單位插值信號部分中交替地排列沿順時間方向的區間信號和沿逆時間方向的區間信號;以及合成裝置,用於合成所述插值信號和由噪聲去除裝置去除了噪聲的輸入語音信號並輸出。
2.如權利要求1所述的噪聲減小設備,其中,生成源信號獲取裝置獲取由前生成源信號和連接到前生成源信號後面的後生成源信號形成的生成源信號, 從除噪聲發生時段以外的、噪聲發生時段之前的時段內的使用語音信號獲取所述前生 成源信號,並且從除噪聲發生時段以外的、噪聲發生時段之後的時段內的使用語音信號獲取所述後生 成源信號,其中,插值信號生成裝置基於針對所述前生成源信號設置的區間信號,生成具有與噪聲發生時段的前時段對應 的持續時間的前插值信號,基於針對所述後生成源信號設置的區間信號,生成具有與噪聲發生時段的後時段對應 的持續時間的後插值信號,並且通過順序地把前插值信號和後插值信號彼此連接而生成所述插值信號。
3.如權利要求2所述的噪聲減小設備,還包括峰值檢測裝置,用於檢測噪聲發生時段內的噪聲的峰值,其中,插值信號生成裝置把噪聲發生時段的前時段設置為從噪聲發生時段的開始時間 到由峰值檢測裝置檢測的噪聲的峰值時間的時段,並把噪聲發生時段的後時段設置為從由 峰值檢測裝置檢測的噪聲的峰值時間到噪聲發生時段的結束時間的時段。
4.如權利要求2或3所述的噪聲減小設備,其中,插值信號生成裝置在前插值信號的最 後單位插值信號部分和後插值信號的最初單位插值信號部分之間形成連接部分,其中,在所述連接部分中,插值信號生成裝置從前生成源信號獲取第一合成區間信號,該第一合成區間信號的振幅波形連接到所述 最後單位插值信號部分的最後區間信號的振幅波形,從後生成源信號獲取第二合成區間信號,該第二合成區間信號的振幅波形連接到所述最初單位插值信號部分的最初區間信號的振幅波形,並且合成第一區間信號和第二區間信號以使第一合成區間信號逐漸減小並且使第二合成 區間信號逐漸增大。
5.如權利要求1所述的噪聲減小設備,其中,生成源信號獲取裝置從除噪聲發生時段 以外的、噪聲發生時段之前或之後的時段內的使用語音信號獲取生成源信號。
6.如權利要求1至5中任一項所述的噪聲減小設備,其中,當插值信號部分由偶數個區 間信號形成時,單位插值信號部分按生成源的區間信號的時間順序排列,其中,單位插值信號部分的最後區間信號的時段與下一個單位插值信號部分的最初區 間信號的時段交疊,並且在交疊時段中執行合成以使在該交疊時段中與所述最後單位周期 區間對應的區間信號逐漸減小並且與所述最初單位周期區間對應的區間信號逐漸增大。
7.如權利要求1至6中任一項所述的噪聲減小設備,其中,當插值信號部分由奇數個區 間信號形成時,通過按生成源的區間信號的時間順序連接所述單位插值信號部分來生成所 述插值信號。
8.如權利要求1至7中任一項所述的噪聲減小設備,其中,生成源信號獲取裝置基於用 於形成單位插值信號部分的區間信號的數量和與噪聲發生時段對應的持續時間,計算生成 源信號的持續時間或前生成源信號和後生成源信號的持續時間。
9.如權利要求1至8中任一項所述的噪聲減小設備,其中,間距計算裝置計算在除噪聲 發生時段以外的、噪聲發生時段之前或之後的時段內的所述輸入語音信號區間的間距。
10.如權利要求1至9中任一項所述的噪聲減小設備,其中,生成源信號獲取裝置輸入 所述輸入語音信號作為所述使用語音信號。
11.如權利要求1至9中任一項所述的噪聲減小設備,還包括插值信號源生成裝置,用於生成用作不基於所述輸入語音信號的輸入的語音信號的插 值信號源,以輸出該插值信號源作為所述使用語音信號。
12.如權利要求1至11中任一項所述的噪聲減小設備,還包括噪聲發生頻率檢測裝置,用於檢測所述輸入語音信號中發生噪聲的頻率,其中,噪聲去除裝置設置僅阻擋發生噪聲的頻率的帶通特性,其中,插值信號生成裝置設置僅使發生噪聲的頻率通過的帶通特性。
13.如權利要求1至12中任一項所述的噪聲減小設備,還包括開關裝置,用於輸入從合成裝置輸出的語音信號和所述輸入語音信號,在噪聲發生時 段輸出從合成裝置輸出的語音信號,並且在除噪聲發生時段以外的時段輸出所述輸入語音 信號。
14.如權利要求13所述的噪聲減小設備,其中,開關裝置執行淡入淡出處理,以使得在 噪聲發生時段的開始時段內從合成裝置輸出的語音信號的電平逐漸增大並且所述輸入語 音信號的電平逐漸減小,並且使得在噪聲發生時段的結束時段內從合成裝置輸出的語音信 號的電平逐漸減小並且所述輸入語音信號的電平逐漸增大。
15.一種噪聲減小方法,包括下述步驟將輸入語音信號輸入;檢測輸入語音信號的噪聲發生時段;從輸入語音信號中去除在噪聲發生時段內發生的噪聲;從用於生成插值信號的使用語音信號中獲取生成源信號,該生成源信號的持續時間被 確定為對應於與噪聲發生時段對應的持續時間;計算在語音信號的輸入步驟中輸入的輸入語音信號中的在噪聲發生時段附近的輸入 語音信號區間的間距;從所述生成源信號設置在基於在計算間距的步驟中計算的間距而設置的各單位周期 區間中分割的區間信號;基於通過連接相同單位周期區間的區間信號而形成的單位插值信號部分在時間軸上 的排列,生成具有與噪聲發生時段對應的持續時間的插值信號,並且至少在所述單位插值 信號部分中交替地排列沿順時間方向的區間信號和沿逆時間方向的區間信號;以及 合成所述插值信號和在去除噪聲的步驟中去除了噪聲的輸入語音信號並輸出。
16. 一種噪聲減小設備,包括語音信號輸入單元,用於輸入語音信號以獲取輸入語音信號; 噪聲發生時段檢測單元,用於檢測輸入語音信號的噪聲發生時段; 噪聲去除單元,用於從輸入語音信號中去除在噪聲發生時段內發生的噪聲; 生成源信號獲取單元,用於從用於生成插值信號的使用語音信號中獲取生成源信號, 該生成源信號的持續時間被確定為對應於與噪聲發生時段對應的持續時間;間距計算單元,用於計算由語音信號輸入單元輸入的輸入語音信號中的在噪聲發生時 段附近的輸入語音信號區間的間距;區間信號設置單元,用於從所述生成源信號設置在基於由間距計算單元計算的間距而 設置的各單位周期區間中分割的區間信號;插值信號生成單元,用於基於通過連接相同單位周期區間的區間信號而形成的單位插 值信號部分在時間軸上的排列,生成具有與噪聲發生時段對應的持續時間的插值信號,並 且用於至少在所述單位插值信號部分中交替地排列沿順時間方向的區間信號和沿逆時間 方向的區間信號;以及合成單元,用於合成所述插值信號和由噪聲去除單元去除了噪聲的輸入語音信號並輸出o
全文摘要
本發明涉及噪聲減小設備和噪聲減小方法。該噪聲減小設備包括語音信號輸入單元,把輸入語音信號輸入;噪聲發生時段檢測單元,檢測噪聲發生時段;噪聲去除單元,去除在噪聲發生時段內的噪聲;生成源信號獲取單元,獲取生成源信號,該生成源信號的持續時間對應於與噪聲發生時段對應的持續時間;間距計算單元,計算輸入語音信號區間的間距;區間信號設置單元,設置在每個單位周期區間中分割的區間信號;插值信號生成單元,生成具有與噪聲發生時段對應的持續時間的插值信號,並交替地排列沿順時間方向的區間信號和沿逆時間方向的區間信號;合成單元,合成插值信號和去除了噪聲的輸入語音信號。
文檔編號G11B20/24GK101859583SQ20101015455
公開日2010年10月13日 申請日期2010年4月2日 優先權日2009年4月13日
發明者小澤一彥 申請人:索尼公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀