控制用來傳送語音的信號中可能有害的信號的方法與系統的製作方法

2023-10-08 13:53:04 6

專利名稱：控制用來傳送語音的信號中可能有害的信號的方法與系統的製作方法
技術領域：
本發明涉及一種控制在用來傳送語音的信號中可能有害的信號的方法與系統。
背景技術：
語音通信系統傳送可能包含非語音信號以及語音信號的信號。這些非語音信號包含由諸如傳真機等電話裝備有意製造的噪聲，以及諸如尖叫聲與劈啪聲等非確定來源的不希望的噪聲。當轉換為聲音時，這些非語音信號可能通過例如使聽者經歷聲震而對聽者有害。當接收方通過例如電話聽筒將電聲換能器貼近聽者的耳朵時，就增加了聲震的可能性。如果接收方不能通過例如電話聽筒將電聲換能器從耳朵旁迅速拿開，則聲震的風險更高。此類語音通信系統的例子有固定以及行動電話系統、雙向無線電、錄音機、VoIP系統、助聽器以及對講機。
有理由相信聲震現象對於在諸如呼叫中心等組織中工作的工作人員、接線員、以及在使用通信設備的任何區域中的工作人員具有不利影響。不僅在這些天期間以及在其後的幾天中感到痛苦以及不適，某些呼叫中心工作人員還會抱怨持續數天或幾周的頭疼、噁心、緊張、以及對於聲音的過敏反應等症狀。在有些情形中，有報告說症狀持續了幾年。
已經有幾種通過控制向聽者呈現的聲級來最小化聲震的發生次數與強度的方法。這些方法包括削峰以及壓縮限制(compression limiting)。
削峰器通過防止施加到接收方電聲換能器的電壓超過給定幅度，來控制向聽者呈現的聲級。削峰可以通過在接收方電聲換能器的線圈上放置極性相反的一對二極體來實現。由這一削峰產生的聲信號的頻率內容是接收方電聲換能器響應的函數。削峰也可以在向接收方電聲換能器提供信號的電路之內實現。在將消峰後的信號提供給接收方電聲換能器之前，該電路可以提供對削峰後信號的過濾。在這種情況下，從該削峰中產生的聲信號的頻率內容為濾波器以及接收方電聲換能器的響應兩者的函數。
壓縮限制器通過以下方法控制向聽者呈現的聲級當將向接收方電聲換能器施加的信號具有高幅度時，提供該信號的減小的放大率。壓縮限制可以通過以下方法實現將信號所通過的放大器的增益降低輸入信號包絡超過給定閾值的量。該增益降低可以以寬帶或特定頻率的方式實現，並且可以隨後進行濾波。從壓縮限制中產生的聲信號的頻率內容為壓縮限制後濾波以及接收方電聲換能器的響應的函數。削峰器可以與壓縮限制結合使用。
削峰器與壓縮限制器兩者都可能對語音的質量及可辨性產生不利影響。在這些設備所提供的聲保護以及它們對語音的質量和可辨性的影響之間存在平衡。因為這些設備只控制施加到接收方電聲換能器的電壓，所以接收方電聲換能器敏感度的任何變化將導致呈現給聽者的結果聲級的變化。已知用戶將更換換能器。如果用戶替換了用於較高敏感度的換能器，則仍會向用戶呈現有害信號。各個人對於聲震的敏感性是不同的，並且根據個人的狀態也是不同的。限制在固定級別上將在給定點時間上為給定個人提供足夠的保護，但是在其他時間或者對於其他個體，該級別可能導致保護不足、語音響度不足、或者語音失真。對於高度受控限制器用戶的聲震損傷的報導表明信號的感知頻率特定響度在引起該類損傷中扮演了重要角色。

發明內容
根據本發明的第一方面，提供了一種控制用來傳送語音的信號中可能有害的信號的方法，包含以下步驟確立當信號傳送語音時的信號特性；以及相對於所確立的特性控制所述信號。
這些特性可能包含任何可測量的特性，包含信號的幅度、信號的功率、信號的響度、信號在特定頻帶上的幅度、信號在特定頻帶上的功率、以及信號的特定響度；所有上述都是以時間為基礎進行測量的。
通過以上方法，相對於先前確定的當信號傳送語音時的特性，來控制所述信號。優選地，如果所述信號顯示了在所確立的特性之外的特性，則控制信號。因此，可以提供對可能有害的信號幅度的降低。另外，也可以獨立於用戶所使用的特定聲音再現裝備的敏感度來提供對於可能有害的信號的控制。可選地，以預定間隔再次確立所述特性。信號的特性可以隨時間而變化。這可能是由於許多因素，包括談話者的變化而引起的。定期重新確立信號特性使該方法能夠適應信號條件的變化。這是因為相對於對信號的最近分析來控制信號。
可選地，該方法還包含以下步驟提供預定的所確立的特性。這些特性可以存儲在存儲器中，從而該方法一啟動，例如當啟動用來實施該方法的軟體程序時，就具有可使用的特性。優選地，所述存儲器為非易失存儲器。
根據本發明的第二方面，提供了一種控制用來傳送語音的信號中可能有害的信號的系統，該系統包含確立部件，用來確立當信號傳送語音時的信號特性；以及控制部件，相對於所確立的特性來控制所述信號。
根據本發明的第三方面，提供了一種計算機軟體，其提供用於控制計算機系統執行根據本發明第一方面的方法的指令。
根據本發明的第四方面，提供了一種提供根據本發明的第三方面的計算機軟體的計算機可讀介質。

現在將參照附圖通過示例的方式描述本發明的實施方式，其中圖1為語音傳送系統的示意圖，其包含根據本發明的、用來控制信號中可能有害的信號的系統的實施例；圖2為圖1的系統10的詳細示意圖；圖3為圖2的特徵提取器26的詳細示意圖；圖4為圖2的語音特徵計算器30的詳細示意圖；圖5為圖2的特徵比較器32的詳細示意圖；圖6為圖2的修改參數生成器34的詳細示意圖；圖7為顯示圖2的系統相對於所確立的特性而在第三倍頻程頻帶內控制信號幅度的圖；圖8為圖2的特徵提取器26的第二實施方式的詳細示意圖；圖9為圖1的系統10的第二實施方式的詳細示意圖；圖10為圖9的語音特徵計算器701的詳細示意圖；圖11為圖1的系統10的第三實施方式的詳細示意圖；圖12為圖11的語音特徵計算器803的詳細示意圖；圖13為顯示圖11的系統相對於所確立的特性而在第三倍頻程頻帶內控制信號幅度的圖；圖14為圖1的系統10的第四實施方式的詳細示意圖；
圖15為圖14的語音特徵計算器1001的詳細示意圖。
具體實施例方式
參照圖1，顯示語音傳送系統，其包含用於控制在用來傳送語音的信號中可能有害的信號的系統10。設置系統10在輸入端12接收數字編碼的信號。設置該系統在輸出端14產生數字編碼的輸出信號。設置該系統10使得系統10處理接收信號的採樣速度等於接收信號的採樣速度，該採樣速度典型地為每秒8000個樣本。本領域技術人員應該理解，只要採取了適當措施以最小化混淆，就可以在較低採樣速度上進行接收信號的某些處理，而具有對於信號處理質量的最小影響。
系統10耦合至用來接收模擬信號的模擬數字轉換器16，以及用來產生模擬輸出信號的數字模擬轉換器18。
系統10可選地接收來自聲音重現級20的反饋。該反饋包含在輸入端22處的處理後音量控制設置信號，以及在輸入端24處的從數字級別到聲級信號的轉換函數。
參照圖2，顯示了圖1的系統10的詳細示意圖。在該例子中，系統10以控制數位訊號處理硬體的軟體來實現。圖2顯示系統10的功能塊。系統10包含確立部件，其由特徵提取器26、語音檢測器28、以及語音特徵計算器30構成。該系統還包括監視部件，其形式為特徵提取器26與特徵比較器32相結合；以及控制部件，其形式為修改參數生成器34與自適應修改器26。
在運行時，系統10在輸入端12接收用來傳送語音的數位訊號。特徵提取器26用來提取並存儲信號的特徵，此後稱為所提取的特徵40。根據所接收的信號的編碼性質，該步驟可以包括從編碼格式解碼該信號。
由特徵提取器26提取的特徵被傳送給語音檢測器28，語音檢測器28分析所提取的特徵以確定其是否屬於語音。本領域技術人員應該知道分析信號並確定信號特性的許多現有技術，所述確定信號特性諸如確定是否存在語音以及語音是否在特定頻率區域的信號中或者在寬帶信號中佔主導地位。這些技術一般涉及對信號特性與已知特性進行模式匹配的結果的統計分析。這些技術將以二級或多級形式產生對給定信號類型的存在的識別分級。此類技術包含施加到使用諸如短期頻率分析、短期倒頻譜(cepstral)分析、以及線性預測分析等技術而從信號產生的參數的人工神經網絡、主分量分析、以及模糊邏輯。如果所提取的特徵被判定屬於語音，則語音檢測器28指示語音特徵計算器30通過採樣所提取的特徵並且將其存儲在緩衝器中，而將這些特徵添加到所確立的特性記錄中，以後將詳細描述。
與上述語音檢測操作平行，特徵比較器32將信號的所提取的特徵40與所確立的特性44進行比較。如果信號的所提取的特徵40超過了所確立的特性44，則差別的細節被傳送給修改參數生成器34。修改參數生成器生成指示自適應修改器36控制信號所需的參數。
輸入信號12通過延遲器38傳送給自適應修改器36。延遲器38補償上述特徵提取、特徵比較、以及修改參數生成所需的有限時間。將來自自適應修改器的修改後的信號送入輸出端14。自適應修改器36可以被控制用來提供寬帶衰減以及頻率選擇性衰減。在一種形式中，自適應修改器36為自適應濾波器，可以指示這樣的濾波器衰減特定頻率範圍中的信號分量。本領域技術人員應該知道自適應地濾波信號的許多方法，包括自適應IIR濾波器、自適應FIR濾波器、其後跟隨帶內幅度的自適應修改以及重建合成的IIR濾波器組分析、其後跟隨帶內幅度的自適應修改以及重建合成的FIR濾波器組分析、使用諸如重疊相加或重疊存儲等技術的其後跟隨復譜的自適應修改以及重建的離散傅立葉逆分析的離散傅立葉分析。
如果到自適應修改器的輸入信號50不是線性脈衝碼調製的離散時間採樣的格式，則其被轉換為此格式以用於調製。可替換地，通過直接以其編碼格式進行修改，例如施加到線性預測係數與殘數的直接修改，可以對其進行控制。
該系統配備有信號的、所存儲的預定確立特性。系統一加電就使用這些存儲的特性。
參照圖3，顯示了圖2的特徵提取器26的更詳細的示意圖。如果到特徵提取器的輸入信號12不是線性脈衝碼調製離散時間樣本格式，則通過處理信號格式轉換到線性PCM 100將其轉換為這一格式。本領域技術人員應該知道其他數字編碼格式，包含Δ調製、自適應Δ脈衝碼調製、線性預測編碼、μ法則編碼、A法則編碼G711編碼、以及代碼激發線性預測編碼，以及將這些格式的信號轉換為線性脈衝碼調製的離散時間樣本的方法。
格式轉換後的信號101被傳送給延遲器102並傳送給語音檢測器28。延遲器補償進行上述語音檢測所需的有限時間。延遲後的信號103被傳送給濾波器組104。濾波器組將信號分割為多個(K)頻帶。選擇這些頻帶的中心頻率與帶寬，以近似由人的耳蝸進行的頻率分析。在一種形式中，頻帶的中心頻率相隔第三倍頻程間隔。每個頻帶的帶寬等於該頻帶中心頻率倍頻程的三分之一。可以使用其他中心頻率與帶寬，諸如那些基於臨界頻帶、CB量程或等同矩形帶寬、ERB量程的中心頻率與帶寬。本領域技術人員應該知道將信號分離為多個頻帶的許多技術，包括IIR濾波器組、FIR濾波器組、小波與離散傅立葉分析。
乘法器106用數字到聲校正因子24對頻帶信號105加權，以產生校正後的頻帶信號107。倚賴於頻率的校正因子是在相應於頻帶中心頻率處的測定的數字到聲轉換函數24，加上對於測定中任何未計入的耳道響應以及中耳響應的校正因子。在沒有這些測定的轉換數據的情況下，校正因子可以來自估計數據。選擇校正因子以與耳朵及中耳相結合地補償聲音再現級20(圖1)的效果，以近似耳蝸通道中對信號的過濾。
校正後的頻帶信號107由求和器108組合，以產生總信號109。校正後的頻帶信號107與總信號109被乘方，以分別產生頻帶功率信號110與總功率信號111。將頻帶功率信號施加到短期包絡檢測器112，以產生頻帶包絡113。這些檢測器被設計來近似由聽覺系統產生的頻率特定響度的短期感知。使用公知的被稱為「漏積分」(leaky integration)的方法，在短期上對該信號進行平均提供了短期包絡檢測。「漏積分」的上升與釋放(attack and release)時間常量一般為50到150毫秒。
短期包絡檢測的一種形式為具有可變換係數的第一級IIR低通濾波器。這些係數確定了時間常量，並且根據到包絡檢測器的輸入樣本是否大於或等於所計算的先前包絡樣本而變換。如果輸入樣本大於或等於先前所計算的包絡樣本，則上升係數及其相應的輸入換算因子分別選擇為濾波器的A1與B0係數，其中B0＝1-A1。否則，釋放係數及其相應的輸入換算因子分別選擇為濾波器的A1與B0係數。當輸入樣本大於或等於先前所計算的包絡樣本時，從「漏積分」產生的包絡信號以由上升係數確定的變換率指數增大。否則，該包絡以由釋放係數確定的變換率指數減消。
總功率信號111施加到兩個包絡檢測器，即峰值包絡檢測器114以及短期包絡檢測器115，以產生峰值包絡116以及總包絡117。包絡檢測器114、115與上述短期包絡檢測器相同，只是峰值包絡檢測器使用更快的時間常量。峰值包絡檢測器的上升與釋放時間常量一般分別為1與20毫秒。
峰值包絡116、總包絡117、以及頻帶包絡113由功率到分貝轉換器118轉換為分貝，以產生包含瞬時、總、以及頻帶(k)的所提取的特徵40。本領域技術人員應該知道進行該轉換的幾種方法，包含冪級數近似與查找表。
參照圖4，顯示了語音特徵計算器30(圖2)的更詳細的示意圖。語音特徵計算器30包含一組單獨的語音特徵計算器，即瞬時語音特徵計算器201、總語音特徵計算器202、以及K個單獨的頻帶語音特徵計算器203，以從瞬時、總、以及頻帶(k)的所提取的特徵40計算語音特徵。
因為每個單獨的語音特徵計算器都相同，所以只描述瞬時語音特徵計算器201。瞬時語音特徵計算器201包括S樣本環形緩衝器204，其中S為該緩衝器包含的樣本的數目；緩衝器樣本最大值計算器205；以及加法器206。現在將描述語音特徵計算器的運行。在初始化時，用一組與將由特徵提取器26對低級別語音產生的值相對應的初始值207，來確立環形緩衝器的S個樣本元素。
由語音特徵計算器30從語音檢測器28接收到控制信號42。控制信號42包括多個單獨的控制信號，包括信號語音主宰(predominant)(瞬間)208。控制信號42用來控制語音特徵計算器30對於所提取的特徵40的存儲。當控制信號具有值0時，這表示沒有檢測到語音。當該信號具有值1時，這表示檢測到語音。
針對瞬時語音特徵計算器201，當控制信號語音主宰(瞬間)208為0時，忽略由特徵提取器提供的新樣本209。當控制信號語音主宰(瞬間)208為1時，環形緩衝器用新樣本覆蓋其最老的樣本。緩衝器樣本最大值211由緩衝器樣本最大值計算器205根據所有的環形緩衝器樣本210來計算。加法器206將差值(瞬間)212加到該最大值，以產生確立的特性(瞬間)，作為確立的特性44之一。
對於響度的人類聽覺記憶的準確性隨時間而降低，合理的準確度一般在移除刺激之後延續幾秒。在先前時段內的最大短期級別最接近地近似於響度記憶。設置環形緩衝器的長度，使得器在語音主宰時記錄幾秒的時間段上的短期級別。幾秒的語音足以獲得對語音的典型最大功率特徵的良好記錄。將該記錄的最大值用來近似語音響度的記憶。如果長時間沒有檢測到語音，則用減低的值覆蓋環形緩衝器樣本，以解決人類聽覺記憶準確性隨時間的降低，以及作為結果的、聽覺系統對較低聲音級別的適應。可以採用近似語音響度記憶的其他方法，諸如那些基於先前語音最大特徵的「漏積分」的方法。
添加差值的目的在於允許未被語音檢測器正確識別的、但具有超過先前語音最大特徵級別的特徵的語音。當設置為零時，不允許對具有超過先前語音最大特徵級別的特徵的語音的不正確識別。雖然零差值提供最好的保護，但是一般設置為幾個分貝的可選擇差值提供了在保護與施加到語音的不正確修改之間的較好平衡。
參照圖5，顯示了圖2的特徵比較器32的更詳細的示意圖。特徵比較器32通過分析由特徵提取器26輸出的所提取的特徵40，並且將其與所確立的特性44比較，來監視信號。特徵比較器32包含一組減法器，即瞬時特徵減法器301、總特徵減法器302、以及對於K個頻帶的特徵減法器303。通過從所提取的特徵40減去所確立的特性44，每個減法器產生所提取的特徵40與所確立的特性44之間的差異。每個結果差異與0的最大值由最大值運算304、305、306產生，從而得到瞬時307、總308、以及K個頻帶309特徵的每一個的超過數量。瞬時與總超過量的最大值由最大值運算310得到。該最大值311的輸出表示使用這兩種方法的寬帶超過量。寬帶超過量311與每個頻帶309的超過量的最大值由一組K個最大值運算312取得，以產生K個頻帶的每一個的超過量，其除了頻率特定超過量之外還併入了寬帶超過量。頻帶超過量表示信號需要被衰減、以保持在所確立特性之內的量。
參照圖6，顯示了圖2的修改參數生成器34的更詳細的示意圖。修改參數生成器34從特徵比較器接收每個頻帶的超過量46的量度。每個頻帶的處理是相同的，因此只描述一個頻帶。符號變換處理401將來自特徵比較器的頻帶超過量的符號進行變換，使得以分貝表示的超過量成為以分貝表示的衰減。向低通濾波器403施加衰減402，以平滑掉衰減突變，該衰減突變可能導致可聽到的處理假象。分貝到線性處理404將以分貝表示的低通濾波器的輸出轉換為線性修改參數48。這K個頻帶修改參數48適合於在自適應修改器的將K個頻帶信號幅度的直接縮放。可能需要其他的修改參數生成方法，以適合於除了在頻帶內的信號幅度的直接縮放或者濾波器係數的直接縮放以外的自適應修改方法，諸如當直接修改線性預測係數時。
參照圖7，該圖顯示了由系統10接收的信號12的所提取特徵501、由系統10生成的所確立的特性44、以及系統10的受控輸出信號14的譜分析。所顯示的提取的特徵40為第三倍頻程頻帶內的短期功率級別。所顯示的確立的特性44為在其中語音佔主宰地位的、總共5秒的先前時段期間內採樣的第三倍頻程頻帶中的最大短期功率級別。從所提取的特徵40可以看出，輸入信號12具有以下特徵在2kHz頻帶中具有峰值504，這可能由傳真機音調產生，其可能對聽者有害。在2000Hz頻帶中，可能有害的信號級別超過了所確立的特性44 10dB，所確立的特性44為聽者所習慣的最大短期語音級別。系統10將該頻帶內的信號衰減其超過所確立特性的量。因此，2000Hz頻帶中可能有害的信號被衰減到與該頻帶的所確立特性44基本相同的級別。假定聽者將調整其聲音再現裝備上的音量控制以舒適地聆聽語音，則存在於受控輸出信號中的衰減後的可能有害的信號就比較不可能驚嚇或者衝擊聽者。這是因為其頻帶特定的短期級別沒有超過聽者最近所習慣聽到的語音的最大頻帶特定短期級別。
圖8顯示圖3所示的特徵提取器28的可替換實施方式280。由處理100與102進行的信號處理與圖3中的那些相同。在101與103處的信號與圖3中的那些相同。本領域技術人員應該知道根據數位訊號進行以宋表示的特定與總響度估計的幾種方法。這些方法可以提供以接近瞬時為基礎的、對於特定與總響度的估計，以及短期總響度估計。圖8所示的響度估計器601提供特定響度估計602與總響度估計603。這兩個響度估計都以宋為單位，並且以接近瞬時為基礎根據數位訊號103進行估計，其中數位訊號103與測定或者估計的數字到聲校正因子24一起提供到其輸入端。這些校正因子由響度估計器使用，以得到對於在耳鼓處信號譜內容的估計。
特定響度信號602被施加到短期包絡檢測器604，以產生短期特定響度量度605，其中短期包絡檢測器604與圖3中的短期包絡檢測器112相同。這些檢測器被設計用來近似由聽覺系統產生的對於頻率特定響度的短期感知。時間常量與圖3中短期包絡檢測器112所使用的相類似。
總響度信號603施加到兩個包絡檢測器，即峰值響度包絡檢測器606以及短期響度包絡檢測器607，以產生峰值響度估計608以及總短期響度估計609。包絡檢測器606、607與圖3中的包絡檢測器114、115結構相同，並且採用類似的時間常量。
通過宋到分貝轉換器610將峰值響度608、總短期響度包絡609、以及頻帶特定短期響度605轉換為分貝，以分別產生瞬時、總、以及頻帶(k)的所提取特徵40。本領域技術人員應該知道進行該轉換的幾種方法，包括冪級數近似與查找表等。
現在將描述根據本發明的第二實施方式，其包括倚賴於處理後音量控制設置形式的反饋的處理。參照圖9，顯示了降低用來傳送語音的信號中可能有害的信號的系統200。在第一實施方式中對圖2的描述也總體適用於該實施方式，但該實施方式與圖2所示的實施方式在以下方面有所不同系統200在輸入端22處接收處理後音量控制設置形式的反饋，系統200使用該反饋來控制所確立的特性44。如果處理後音量控制設置從其所確立的位置增大，則語音的所確立特性被類似地降低。這使信號被維持在處理後音量控制輸出端處的語音的所確立特性之內，從而相對於聽者所感受的最後的語音級別來控制信號，而不管增大了音量控制設置。因此，對於增大音量控制設置的情況，達到了對於可能有害的信號的增強的保護。圖3與圖5至9及其詳細描述同樣適用於本實施方式。系統200與圖2中所示的實施方式的不同在於接收音量控制設置22的語音特徵計算器701的實現與運行。
參照圖10，顯示了語音特徵計算器701的更詳細的示意圖。這是圖4所示語音特徵計算器的增強形式。除了與現在要描述的、添加的音量控制設置22有關的方面，對於語音特徵計算器701的詳細描述與對圖4的描述相同。
音量控制設置22是表示以分貝為單位的音量控制設置的數字離散時間信號。音量控制功率調整計算器702包括單位採樣延遲器703、加法器704、以及最小值函數705。現在描述音量控制功率調整計算器的運行。通過從由單位採樣延遲器703產生的先前音量控制設置707中減去音量控制設置22，生成在樣本706之間的音量控制設置的符號變換的變化。最小值函數705產生在樣本706之間的音量控制設置的符號變換的變化與0的最小值，以產生功率調整708。如此運行使得如果音量控制設置22被減小或者保持恆定，則功率調整708為0分貝。如果音量控制設置22被增大，則功率調整708被減少相等的分貝量。
所有的單獨語音特徵計算器，即瞬時201、總202、以及K個波段203的形式都相同，因此只描述瞬時201語音特徵計算器。S樣本環形緩衝器709與圖4中的S樣本環形緩衝器204的不同之處在於每個採樣周期，從在所有樣本(寫入)輸入端710處提供的樣本，同時覆蓋所有的樣本。用於寫入的樣本由加法器711提供。加法器711包含一組S個加法器，一個加法器用於S樣本環形緩衝器中的一個樣本。加法器711將環形緩衝器210的輸出加到功率調整708，以產生所有樣本(寫入)輸入710的值。因此，S樣本環形緩衝器中的值被與音量控制設置的增大成比例地降低。可替換地，語音特徵計算器201以及特別是加法器711與S樣本環形緩衝器709可以被重新設置，使得只有當檢測到音量控制增大時，才發生環形緩衝器整個內容的相加與更新。在所有其他方面，音量特徵計算器701與圖4的音量特徵計算器30相同。
現在將描述根據本發明的第三實施方式，其包括對存在可能有害信號的概率的響應的所確立特性的變化。參照圖11，顯示了減少用來傳送語音的信號中可能有害的信號的系統500。在第一實施方式中給出的對圖2的描述與該實施方式總體相同，但該實施方式與第一實施方式的不同在於系統500包含響應於存在可能有害的信號的概率，對於所確立特性44的生成的修改。系統500包含可能有害信號檢測器801。可能有害信號檢測器從特徵提取器26接收所提取的特徵40，並且以存在可能有害的信號的概率802的形式產生可能有害信號識別分級，該概率802由語音特徵計算器803在生成所確立的特性時使用。圖3與圖5至9及其詳細描述同樣適用於該實施方式。
現在描述可能有害信號檢測器801的運行。分析由特徵提取器26所提取的特徵，以確定它們是否屬於可能有害的信號的已知特性。本領域技術人員應該知道可用來分析信號並確定信號特性的許多現有技術，所述確定信號特性諸如確定是否存在特定的可能有害信號類型，並且其是否在信號的特定頻率範圍中或者在寬帶信號中佔主導地位。這些技術一般涉及對信號特性與已知特性進行模式匹配的結果的統計分析。這些技術可以二級或多級形式產生給定信號類型的存在的識別分級。此類技術包含施加到使用諸如短期頻率分析、短期倒頻譜分析、以及線性預測分析等技術而從信號產生的參數的人工神經網絡、主分量分析、以及模糊邏輯。可能有害信號檢測器801以存在可能有害信號的概率的形式產生可能有害信號識別分級802。對瞬時、總、以及K頻帶的每一個所提取的特徵，產生存在可能有害信號的概率。
參照圖12，顯示了圖11的語音特徵計算器803的更詳細的示意圖。這是圖4所示語音特徵計算器的增強形式。除了有關於現在要描述的、倚賴於存在可能有害信號的概率802的特性確立的方面，對於語音特徵計算器803的詳細描述與對圖4的描述是相同的。
從可能有害信號檢測器801接收存在可能有害信號的概率802。每個概率都具有從0到1的範圍，其中0表示存在可能有害信號的低概率，而1表示存在可能有害信號的高概率。因為單獨的語音特徵計算器，即瞬時、總、與K頻帶，的運行基本相同，所以只描述瞬時語音特徵計算器201對存在可能有害信號的概率的倚賴。額外的處理為乘法器804與加法器805。現在將描述這些處理的操作。由乘法器804將存在可能有害信號的概率(對於瞬時語音特徵計算器)806乘以最大減少範圍807，以便產生以分貝表示的減少因子808，該因子與存在可能有害信號的概率成比例。最大減少範圍一般在5到30分貝級別上。加法器805從差別212中減去以分貝表示的減少因子808，以產生偏移809。加法器206將該偏移加到所有緩衝器樣本的最大值211，以產生所確立的特性44。
參照圖13，該圖顯示了由系統500接收的信號12的所提取特徵40；由系統500生成的、存在可能有害信號的概率為低的所確立的特性902；當存在可能有害信號的概率為低時，系統500的受控輸出信號14的譜分析903；由系統500生成的、存在可能有害信號的概率為高的所確立的特性904；以及當存在可能有害信號的概率為高時，系統500的受控輸出信號14的譜分析905。所提取特徵40以第三倍頻程頻帶內的短期功率級別顯示。所確立的特性以在其中語音佔主宰地位的、總共5秒的先前時段期間內採樣的第三倍頻程頻帶中的最大短期功率級別顯示，其中適當的偏移倚賴於所選擇的差值、所選擇的最大減少範圍、以及存在可能有害信號的概率。
可以看出接收信號12具有以下特徵在2000Hz頻帶中具有峰值906，這可能由傳真機音調產生，其可能對聽者有害。在2000Hz頻帶中，可能有害的信號級別超過了存在可能有害信號的概率為低的所確立的特性902 10分貝，所述確立的特性902聽者所習慣的。系統500將該頻帶內的信號衰減其超過存在可能有害信號的概率為低的所確立特性902的量。因此，輸出信號譜分析905的2000Hz頻帶中可能有害的信號的級別基本與對於該頻率存在可能有害信號的概率為低的所確立的特性的級別907相同。其他頻帶中的信號保持不變。
當存在可能有害信號的概率為高時，通過存在可能有害信號的概率為高的所確立的特性904、如圖所示地減小所確立地特性。可以看出在2000Hz頻帶中具有峰值的接收信號超過了該頻帶內所確立的特性908 20分貝。系統500將該頻帶內的信號衰減其超過存在可能有害信號的概率為低的所確立特性908的量。因此，輸出信號譜分析909的2000Hz頻帶中可能有害的信號的級別基本與對於該頻率存在可能有害信號的概率為高的所確立的特性的級別908相同。在這種情況下，與在該頻率範圍中存在可能有害信號的概率為低不同，作為檢測到可能有害信號的概率為高的結果，在該頻率上還提供了額外的10分貝的保護。
可以看出在2500Hz頻帶內的信號的所提取特徵40 910沒有超出存在可能有害信號的概率為低的所確立特性911。然而，其超過了存在可能有害信號的概率為高的所確立特性912幾個分貝，並且在輸出信號14的譜分析905中由系統500減少了這一數量。該圖示出了當被傳送的信號顯示出與已知可能有害的信號接近的屬性時所提供的較高程度的保護。
在圖14中顯示了根據本發明的系統600的第四實施方式，其包括倚賴於處理後音量控制設置22形式的反饋的處理以及作為對存在可能有害信號的概率的響應的所確立特性的減小兩者。在第一實施方式中對圖2的描述也一般地適用於該實施方式，但第四實施方式包括在第二與第三實施方式兩者中的、向第一實施方式的添加。
參照圖15，顯示了圖14的系統600的語音特徵計算器1001的更詳細的示意圖。再次地，語音特徵計算器的該實施方式包括圖10與12中所示的在第二與第三實施方式兩者中的、向第一實施方式的添加。
上述發明可用於電話呼叫中心、包括行動電話系統的總體電話系統、以及其中信號被轉換為聲音的任何應用，其中該信號也許包含可能有害的信號。
本發明的上述實施方式採用數位訊號處理技術。然而，本發明不限於這些技術，並且可以類似地使用模擬信號處理技術。
本領域技術人員應該理解，通過使用與上述具體描述不同的其他手段也可以實施本發明的方法。
除非另外指明，此處所包含的對現有技術的任何引用都不應該被理解為是對所述信息為公知常識的承認。
最後，應該理解，在不脫離本發明精神與範圍的前提下可以對上述部件進行各種改變或添加。
權利要求
1.一種控制用來傳送語音的信號中可能有害的信號的方法，該方法包含以下步驟確立當信號傳送語音時的信號特性；以及相對於所確立的特性控制所述信號。
2.根據權利要求1的方法，其中所確立的特性包含幅度、功率、響度或者特定響度。
3.根據權利要求2的方法，其中所述幅度特性包含幅度變化率或者倚賴於頻率的幅度特性。
4.根據權利要求3的方法，其中所述倚賴於頻率的幅度特性包含頻帶內的短期級別。
5.根據權利要求4的方法，其中所述頻帶內的短期級別包含第三倍頻程頻帶內的最大短期級別。
6.根據權利要求2的方法，其中通過對倚賴於頻率的幅度特性的非線性映射的求和或者通過對特定響度特性的求和來確立所述響度特性。
7.根據權利要求2的方法，其中所述響度特性包含最大響度或者最大特定響度。
8.根據權利要求2的方法，其中所述功率特性包含功率的短期級別或者倚賴於頻率的功率特性。
9.根據權利要求8的方法，其中所述倚賴於頻率的功率特性包含頻帶內的短期級別。
10.根據以上權利要求中任一項的方法，其中所述特性通過測量或者估計來確立。
11.根據以上權利要求中任一項的方法，其中以預定間隔再次確立所確立的特性。
12.根據以上權利要求中任一項的方法，還包含以下步驟提供預定的所確立的特性。
13.根據以上權利要求中任一項的方法，其中控制所述信號使得其特性不超出所確立的特性。
14.根據以上權利要求中任一項的方法，其中所述信號通過衰減來控制。
15.根據權利要求14的方法，其中所述衰減包括寬帶或者頻率選擇性衰減。
16.根據以上權利要求中任一項的方法，其中根據在所述信號中存在可能有害的信號的概率，修改所確立的特性。
17.根據以上權利要求中任一項的方法，其中根據聲音再現系統音量控制的調整，修改所確立的特性。
18.一種控制用來傳送語音的信號中可能有害的信號的系統，該系統包含確立部件，用來確立當信號傳送語音時的信號特性；以及控制部件，用來相對於所確立的特性控制所述信號。
19.根據權利要求18的系統，其中所述確立部件用來確立幅度、功率、響度或者特定響度的特性。
20.根據權利要求19的系統，其中所述幅度特性包含幅度變化率或者倚賴於頻率的幅度特性。
21.根據權利要求20的系統，其中所述倚賴於頻率的幅度特性包含頻帶內的短期級別。
22.根據權利要求21的系統，其中所述頻帶內的短期級別包含第三倍頻程頻帶內的最大短期級別。
23.根據權利要求19的系統，其中所述確立部件用來通過對倚賴於頻率的幅度特性的非線性映射的求和或者通過對特定響度特性的求和來確立響度特性。
24.根據權利要求19的系統，其中所述響度特性包含最大響度或者最大特定響度。
25.根據權利要求19的系統，其中所述功率特性包含功率的短期級別或者倚賴於頻率的功率特性。
26.根據權利要求25的系統，其中所述倚賴於頻率的功率特性包含頻帶內的短期級別。
27.根據權利要求18至26中任一項的系統，其中所述確立部件用來通過測量或者估計來確立特性。
28.根據權利要求18至27中任一項的系統，其中所述確立部件用來以預定間隔再次確立所確立的特性。
29.根據權利要求18至28中任一項的系統，還包含預定的所確立的特性。
30.根據權利要求18至29中任一項的系統，其中所述控制部件用來控制所述信號，使得其特性不超出所確立的特性。
31.根據權利要求18至30中任一項的系統，其中所述控制部件用來通過衰減來控制所述信號。
32.根據權利要求31的系統，其中所述衰減包括寬帶或者頻率選擇性衰減。
33.根據權利要求18至32中任一項的系統，還包含修改部件，用來根據在所述信號中存在可能有害的信號的概率，修改所確立的特性。
34.根據權利要求18至33中任一項的系統，還包含修改部件，用來根據聲音再現系統音量控制的調整，修改所確立的特性。
35.一種計算機軟體程序，用來提供控制計算機執行根據權利要求1至17中任一項的方法的指令。
36.一種提供根據權利要求35的計算機軟體程序的計算機可讀介質。
全文摘要
描述了一種控制用來傳送語音的信號中可能有害的信號的方法與系統。該方法包含以下步驟確立當信號傳送語音時的信號特性；監控所述信號；以及相對於所確立的特性來控制所述信號。
文檔編號H04M1/738GK1682280SQ03805824
公開日2005年10月12日申請日期2003年3月13日優先權日2002年3月13日
發明者麥可·J·A·弗希爾申請人:希爾沃克斯有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

控制用來傳送語音的信號中可能有害的信號的方法與系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法