新四季網

語音處理裝置、動態範圍控制模塊及語音振幅調整的方法

2023-10-09 08:59:04 2

專利名稱:語音處理裝置、動態範圍控制模塊及語音振幅調整的方法
技術領域:
本發明涉及語音處理,特別是涉及語音信號的振幅調整。
背景技術:
語音處理裝置以一功率放大器放大一語音信號,以得到具有合適於播放的振幅的 一放大語音信號。然而,當語音信號的振幅超過一界限值時,功率放大器便以較低的增益對 語音信號進行放大,該較低功率是由於功率放大器已達飽和狀態(saturation)。語音處理 裝置因此需要一動態範圍控制模塊以便於語音信號被功率放大器放大之前事先調整語音 信號的振幅,已避免語音信號使功率放大器達到飽和狀態。 現有的動態範圍控制模塊連續地監測語音信號的振幅。當語音信號的振幅高於界 限值時,動態範圍控制模塊便以一衰減倍數降低語音信號的振幅,以免語音信號使功率放 大器達到飽和狀態。功率放大器因此不會達到飽和狀態。然而,現有的動態範圍控制模塊 僅僅在發現語音信號的振幅高於界限值之後才開始衰減語音信號的振幅。這會造成被衰減 前的語音信號的振幅與衰減後的語音信號的振幅有較大的差距,而使語音信號帶有較大的 噪音。 此外,語音信號包括一連串的音節(syllable)。由於現有的動態範圍控制模塊依 據語音信號的振幅以不同的衰減倍數分別衰減語音信號的各區段,因此語音信號同一音節 的不同區段可能因為有不同的振幅而被以不同的衰減倍數進行衰減。這會使得現有的動態 範圍控制模塊所產生的衰減語音信號產生較嚴重的信號失真(signal distortion)。由於 現有的動態範圍控制模塊有此缺陷,因此需要一種新型態的動態範圍控制模塊,可以避免 上述的缺陷。

發明內容
有鑑於此,本發明的目的在於提供一種語音處理裝置,以解決現有技術存在的問 題。於一實施例中,該語音處理裝置包括一語音信號源、一動態範圍控制(dynamic range control)模塊、以及一功率放大器。該語音信號源產生一語音信號。該動態範圍控制模塊 耦接至該語音信號源,用以決定該語音信號的一音節(syllable),計算該音節的一振幅峰 值,以及依據該振幅峰值調整該音節的振幅以得到一調整語音信號。該功率放大器耦接至 該動態範圍控制模塊,用以放大該調整語音信號以得到一放大語音信號。
本發明還提供一種動態範圍控制模塊。於一實施例中,該動態範圍控制模塊設置 於一語音處理裝置,包括一緩衝器、一語音行為檢測器(voiceactivity detector)、一峰值 計算模塊、以及一振幅調整模塊。該緩衝器緩衝一語音信號以得到一延遲語音信號。該語 音行為檢測器自該延遲語音信號決定一音節(syllable)。該峰值計算模塊計算該音節的一 振幅峰值。該振幅調整模塊依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該 音節的振幅以得到一調整語音信號。 本發明提供一種對語音信號進行振幅調整的方法。首先,緩衝一語音信號以得到一延遲語音信號。接著,自該延遲語音信號決定一音節(syllable)。接著,計算該音節的一 振幅峰值。接著,依據該音節的該振幅峰值決定對應於該音節的一衰減倍數。最後,依據該 衰減倍數以相同增益調整該音節的振幅以得到一調整語音信號。 為了使本發明的上述和其它目的、特徵、和優點能更明顯易懂,下文特舉數較佳實 施例,並結合附圖詳細說明如下。


圖1為依據本發明的語音處理裝置的區塊圖2為依據本發明的動態範圍控制模塊的區塊圖3為依據本發明的一音節的振幅峰值與衰減倍數間的關係的示意圖
圖4為依據本發明的對語音信號進行振幅調整的方法的流程圖。
附圖符號說明
(圖1)
100 --語音處理裝置;102 --語音信號源;104 --動態範圍控制模塊;106 --功率放大器;108 -、揚聲器;(圖2)
200 --語音處理裝置;202 --語音信號源;204 --動態範圍控制模塊;206 --功率放大器;208 -、揚聲器;212 --緩衝器;214 --峰值計算模塊;216 -^語音行為檢測器;218 --振幅調整模塊。
具體實施例方式
圖1為依據本發明的語音處理裝置100的區塊圖。於一實施例中,語音處理裝置 100包括語音信號源102、動態範圍控制模塊(dynamic rangecontrol module) 104、功率放 大器106、以及揚聲器108。語音信號源102產生一語音信號x(n)。動態範圍控制模塊104 接著決定語音信號x(n)的音節(syllable)並儲存該音節的樣本。接著,動態範圍控制模 塊104計算該音節的振幅峰值,並依據該振幅峰值決定該音節的衰減倍數。動態範圍控制 模塊104接著依據衰減倍數對該音節的振幅進行調整以得到一調整語音信號y (n)。因此, 該音節的所有樣本的振幅均是依據相同的衰減倍數而衰減,因此可防止引起現有技術中的 剌耳噪音或信號失真。功率放大器106接著放大調整語音信號y(n)以得到一放大語音信 號z(n)。由於調整語音信號y(n)已被適當地衰減過,因此不會使功率放大器106達到飽和狀態,而引起信號失真。最後,揚聲器108播放放大語音信號z(n)。 圖2為依據本發明的動態範圍控制模塊204的區塊圖。於一實施例中,該動態 範圍控制模塊204包括緩衝器212、峰值計算模塊214、語音行為檢測器(voice activity detector) 216、以及振幅調整模塊218。緩衝器212自語音信號源202接收語音信號x (n), 並儲存語音信號x(n)後再輸出為延遲語音信號x(n-D),其中n為樣本序號,D為延遲樣本 數。語音行為檢測器216接著自延遲語音信號x(n-D)決定一音節(syllable)。於一實施 例中,語音行為檢測器216檢測延遲語音信號x(n-D)的振幅。當延遲語音信號x(n-D)的 一樣本的振幅超過一界限值,語音行為檢測器216將該樣本是為該音節的起始邊緣。當延 遲語音信號x (n-D)的一樣本的振幅低於該界限值,語音行為檢測器216將該樣本是為該音 節的結束邊緣。因此,語音行為檢測器216將延遲語音信號x(n-D)界於起始邊緣與結束邊 緣之間的多個樣本決定為該音節的樣本。 當該音節的樣本被決定之後,峰值計算模塊214計算該音節的振幅峰值p (n)。於 一實施例中,峰值計算模塊214首先計算延遲語音信號x (n-D)於音節範圍的多個樣本的振 幅值,接著自所述振幅值選擇一最大值作為振幅峰值P(n)以遞送至振幅調整模塊218。振 幅調整模塊218接著依據振幅峰值p (n)決定該音節的一衰減倍數,並依據該衰減倍數調整 該音節的所有樣本的振幅,以得到一調整語音信號y(n)。換句話說,動態範圍控制模塊204 是以音節為單位處理語音信號x(n),而單一音節範圍內的所有樣本皆是以同一衰減倍數進 行振幅衰減。因此,由動態範圍控制模塊204處理所得的調整語音信號y(n)不會有信號失 真,並且亦不會如現有技術般帶有噪音。 圖3為依據本發明的一音節的振幅峰值與衰減倍數間的關係的示意圖。於一實施 例中,振幅峰值的可能值lx(n) I被區分為以多個界限值1\、^3劃分的多個振幅區域。當 音節的振幅峰值lx(n) I低於第一界限值1\時,音節的多個樣本的振幅|y(n) |是依據衰減 倍數gO進行調整,以得到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |介於第一 界限值1\與第二界限值L之間時,音節的多個樣本的振幅|y(n) I是依據衰減倍數gl進行 調整,以得到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |介於第二界限值L與 第三界限值T3之間時,音節的多個樣本的振幅|y(n) I是依據衰減倍數g2進行調整,以得 到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |高於第三界限值T3時,音節的多 個樣本的振幅|y(n) I是依據衰減倍數g3進行調整,以得到調整語音信號y(n)的樣本。
於一實施例中,振幅調整模塊218依據下式調整音節的振幅
1 —n
n <|72 .
gl > g2 > g3。 因此,振幅調整模塊218依據較高的衰減倍數衰減具有較高的振幅的音節的樣本以產生調 整語音信號y(n)。 圖4為依據本發明的對語音信號進行振幅調整的方法400的流程圖。首先,緩衝 =
x(")-gO ^ x(").gl +鄉w[x(")〗.ri x(").g2 + Wg"[xO)〗';T2一語音信號x(n)以得到一延遲語音信號x(n-D)(步驟402)。接著,決定該延遲語音信號 x (n-D)的一音節v (n)(步驟404),並計算該音節的一振幅峰值p (n)。接著,依據該振幅峰 值P(n)決定一衰減倍數(步驟408)。接著,依據該衰減倍數調整該音節的多個樣本的振幅 以得到一調整語音信號y(n)(步驟410)。接著,放大該調整語音信號y(n)以得到一放大語 音信號z (n)(步驟412)。最後,播放該放大語音信號z (n)(步驟414)。
雖然本發明已以較佳實施例揭示如上,然其並非用以限定本發明,本領域的技術 人員,在不脫離本發明的精神和範圍的前提下可作若干的更動與潤飾,因此本發明的保護 範圍以本發明的權利要求為準。
權利要求
一種語音處理裝置,包括一語音信號源,產生一語音信號;一動態範圍控制模塊,耦接至該語音信號源,決定該語音信號的一音節,計算該音節的一振幅峰值,以及依據該振幅峰值調整該音節的振幅以得到一調整語音信號;一功率放大器,耦接至該動態範圍控制模塊,放大該調整語音信號以得到一放大語音信號。
2. 如權利要求1所述的語音處理裝置,其中該動態範圍控制模塊還包括一緩衝器,緩衝該語音信號以得到一延遲語音信號;一語音行為檢測器,自該延遲語音信號決定該音節;一峰值計算模塊,計算該音節的該振幅峰值;以及一振幅調整模塊,依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到該調整語音信號。
3. 如權利要求2所述的語音處理裝置,其中該語音行為檢測器計算該延遲語音信號的振幅,決定是否該振幅超過一界限值以判定該音節的一起始邊緣,決定是否該振幅低於該界限值以判定該音節的一結束邊緣,並將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
4. 如權利要求2所述的語音處理裝置,其中該峰值計算模塊計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值,並自所述振幅值選取一最大值作為該音節的該振幅峰值。
5. 如權利要求2所述的語音處理裝置,其中該振幅調整模塊自多個振幅區域決定包含該振幅峰值的一 目標振幅區域,決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數,並依據該衰減倍數調整該音節的振幅。
6. 如權利要求2所述的語音處理裝置,其中該振幅調整模塊依據下式調整該音節的振幅formula see original document page 2其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且gO > gl > g2 > g3, n為樣本序號。
7. 如權利要求1所述的語音處理裝置,其中該語音處理裝置還包含一揚聲器,用以播放該放大語音信號。
8. —種動態範圍控制模塊,設置於一語音處理裝置,包括一緩衝器,緩衝一語音信號以得到一延遲語音信號;一語音行為檢測器,自該延遲語音信號決定一音節;一峰值計算模塊,計算該音節的一振幅峰值;以及一振幅調整模塊,依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到一調整語音信號。
9. 如權利要求8所述的動態範圍控制模塊,其中該語音處理裝置包括一語音信號源,產生該語音信號;該動態範圍控制模塊,耦接至該語音信號源,依據該語音信號產生該調整語音信號;一功率放大器,耦接至該動態範圍控制模塊,放大該調整語音信號以得到一放大語音信號。
10. 如權利要求9所述的動態範圍控制模塊,其中該語音處理裝置還包含一揚聲器,用以播放該放大語音信號。
11. 如權利要求8所述的動態範圍控制模塊,其中該語音行為檢測器計算該延遲語音信號的振幅,決定是否該振幅超過一界限值以判定該音節的一起始邊緣,決定是否該振幅低於該界限值以判定該音節的一結束邊緣,並將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
12. 如權利要求8所述的動態範圍控制模塊,其中該峰值計算模塊計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值,並自所述振幅值選取一最大值作為該音節的該振幅峰值。
13. 如權利要求8所述的動態範圍控制模塊,其中該振幅調整模塊自多個振幅區域決定包含該振幅峰值的一 目標振幅區域,決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數,並依據該衰減倍數調整該音節的振幅。
14. 如權利要求8所述的動態範圍控制模塊,其中該振幅調整模塊依據下式調整該音節的振幅formula see original document page 3其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且g0 > gl > g2 > g3, n為樣本序號。
15. —種對語音信號進行振幅調整的方法,包括下列步驟緩衝一語音信號以得到一延遲語音信號;自該延遲語音信號決定一音節;計算該音節的一振幅峰值;以及依據該音節的該振幅峰值決定對應於該音節的一衰減倍數;以及依據該衰減倍數以相同增益調整該音節的振幅以得到一調整語音信號。
16. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該方法還包括放大該調整語音信號以得到一放大語音信號;以及播放該放大語音信號。
17. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該音節的決定步驟包括計算該延遲語音信號的振幅;決定是否該振幅超過一界限值以判定該音節的一起始邊緣; formula see original document page 3決定是否該振幅低於該界限值以判定該音節的一結束邊緣;以及將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
18. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該振幅峰值的計算包括計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值;以及自所述振幅值選取一最大值作為該音節的該振幅峰值。
19. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該衰減倍數的決定包括自多個振幅區域決定包含該振幅峰值的一目標振幅區域;決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數;以及依據該衰減倍數調整該音節的振幅。
20. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該音節的振幅的調整是依據下式formula see original document page 4其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且g0 > gl > g2 > g3, n為樣本序號。
全文摘要
本發明提供一種語音處理裝置、動態範圍控制模塊及語音振幅調整的方法。於一實施例中,該動態範圍控制模塊設置於一語音處理裝置,包括一緩衝器、一語音行為檢測器、一峰值計算模塊、以及一振幅調整模塊。該緩衝器緩衝一語音信號以得到一延遲語音信號。該語音行為檢測器自該延遲語音信號決定一音節。該峰值計算模塊計算該音節的一振幅峰值。該振幅調整模塊依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到一調整語音信號。
文檔編號H03G11/00GK101729034SQ20091020971
公開日2010年6月9日 申請日期2009年10月30日 優先權日2008年10月31日
發明者張銘, 白宛傑 申請人:美商富迪科技股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀