語音處理裝置、動態範圍控制模塊及語音振幅調整的方法
2023-10-09 08:59:04 2
專利名稱:語音處理裝置、動態範圍控制模塊及語音振幅調整的方法
技術領域:
本發明涉及語音處理,特別是涉及語音信號的振幅調整。
背景技術:
語音處理裝置以一功率放大器放大一語音信號,以得到具有合適於播放的振幅的 一放大語音信號。然而,當語音信號的振幅超過一界限值時,功率放大器便以較低的增益對 語音信號進行放大,該較低功率是由於功率放大器已達飽和狀態(saturation)。語音處理 裝置因此需要一動態範圍控制模塊以便於語音信號被功率放大器放大之前事先調整語音 信號的振幅,已避免語音信號使功率放大器達到飽和狀態。 現有的動態範圍控制模塊連續地監測語音信號的振幅。當語音信號的振幅高於界 限值時,動態範圍控制模塊便以一衰減倍數降低語音信號的振幅,以免語音信號使功率放 大器達到飽和狀態。功率放大器因此不會達到飽和狀態。然而,現有的動態範圍控制模塊 僅僅在發現語音信號的振幅高於界限值之後才開始衰減語音信號的振幅。這會造成被衰減 前的語音信號的振幅與衰減後的語音信號的振幅有較大的差距,而使語音信號帶有較大的 噪音。 此外,語音信號包括一連串的音節(syllable)。由於現有的動態範圍控制模塊依 據語音信號的振幅以不同的衰減倍數分別衰減語音信號的各區段,因此語音信號同一音節 的不同區段可能因為有不同的振幅而被以不同的衰減倍數進行衰減。這會使得現有的動態 範圍控制模塊所產生的衰減語音信號產生較嚴重的信號失真(signal distortion)。由於 現有的動態範圍控制模塊有此缺陷,因此需要一種新型態的動態範圍控制模塊,可以避免 上述的缺陷。
發明內容
有鑑於此,本發明的目的在於提供一種語音處理裝置,以解決現有技術存在的問 題。於一實施例中,該語音處理裝置包括一語音信號源、一動態範圍控制(dynamic range control)模塊、以及一功率放大器。該語音信號源產生一語音信號。該動態範圍控制模塊 耦接至該語音信號源,用以決定該語音信號的一音節(syllable),計算該音節的一振幅峰 值,以及依據該振幅峰值調整該音節的振幅以得到一調整語音信號。該功率放大器耦接至 該動態範圍控制模塊,用以放大該調整語音信號以得到一放大語音信號。
本發明還提供一種動態範圍控制模塊。於一實施例中,該動態範圍控制模塊設置 於一語音處理裝置,包括一緩衝器、一語音行為檢測器(voiceactivity detector)、一峰值 計算模塊、以及一振幅調整模塊。該緩衝器緩衝一語音信號以得到一延遲語音信號。該語 音行為檢測器自該延遲語音信號決定一音節(syllable)。該峰值計算模塊計算該音節的一 振幅峰值。該振幅調整模塊依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該 音節的振幅以得到一調整語音信號。 本發明提供一種對語音信號進行振幅調整的方法。首先,緩衝一語音信號以得到一延遲語音信號。接著,自該延遲語音信號決定一音節(syllable)。接著,計算該音節的一 振幅峰值。接著,依據該音節的該振幅峰值決定對應於該音節的一衰減倍數。最後,依據該 衰減倍數以相同增益調整該音節的振幅以得到一調整語音信號。 為了使本發明的上述和其它目的、特徵、和優點能更明顯易懂,下文特舉數較佳實 施例,並結合附圖詳細說明如下。
圖1為依據本發明的語音處理裝置的區塊圖2為依據本發明的動態範圍控制模塊的區塊圖3為依據本發明的一音節的振幅峰值與衰減倍數間的關係的示意圖
圖4為依據本發明的對語音信號進行振幅調整的方法的流程圖。
附圖符號說明
(圖1)
100 --語音處理裝置;102 --語音信號源;104 --動態範圍控制模塊;106 --功率放大器;108 -、揚聲器;(圖2)
200 --語音處理裝置;202 --語音信號源;204 --動態範圍控制模塊;206 --功率放大器;208 -、揚聲器;212 --緩衝器;214 --峰值計算模塊;216 -^語音行為檢測器;218 --振幅調整模塊。
具體實施例方式
圖1為依據本發明的語音處理裝置100的區塊圖。於一實施例中,語音處理裝置 100包括語音信號源102、動態範圍控制模塊(dynamic rangecontrol module) 104、功率放 大器106、以及揚聲器108。語音信號源102產生一語音信號x(n)。動態範圍控制模塊104 接著決定語音信號x(n)的音節(syllable)並儲存該音節的樣本。接著,動態範圍控制模 塊104計算該音節的振幅峰值,並依據該振幅峰值決定該音節的衰減倍數。動態範圍控制 模塊104接著依據衰減倍數對該音節的振幅進行調整以得到一調整語音信號y (n)。因此, 該音節的所有樣本的振幅均是依據相同的衰減倍數而衰減,因此可防止引起現有技術中的 剌耳噪音或信號失真。功率放大器106接著放大調整語音信號y(n)以得到一放大語音信 號z(n)。由於調整語音信號y(n)已被適當地衰減過,因此不會使功率放大器106達到飽和狀態,而引起信號失真。最後,揚聲器108播放放大語音信號z(n)。 圖2為依據本發明的動態範圍控制模塊204的區塊圖。於一實施例中,該動態 範圍控制模塊204包括緩衝器212、峰值計算模塊214、語音行為檢測器(voice activity detector) 216、以及振幅調整模塊218。緩衝器212自語音信號源202接收語音信號x (n), 並儲存語音信號x(n)後再輸出為延遲語音信號x(n-D),其中n為樣本序號,D為延遲樣本 數。語音行為檢測器216接著自延遲語音信號x(n-D)決定一音節(syllable)。於一實施 例中,語音行為檢測器216檢測延遲語音信號x(n-D)的振幅。當延遲語音信號x(n-D)的 一樣本的振幅超過一界限值,語音行為檢測器216將該樣本是為該音節的起始邊緣。當延 遲語音信號x (n-D)的一樣本的振幅低於該界限值,語音行為檢測器216將該樣本是為該音 節的結束邊緣。因此,語音行為檢測器216將延遲語音信號x(n-D)界於起始邊緣與結束邊 緣之間的多個樣本決定為該音節的樣本。 當該音節的樣本被決定之後,峰值計算模塊214計算該音節的振幅峰值p (n)。於 一實施例中,峰值計算模塊214首先計算延遲語音信號x (n-D)於音節範圍的多個樣本的振 幅值,接著自所述振幅值選擇一最大值作為振幅峰值P(n)以遞送至振幅調整模塊218。振 幅調整模塊218接著依據振幅峰值p (n)決定該音節的一衰減倍數,並依據該衰減倍數調整 該音節的所有樣本的振幅,以得到一調整語音信號y(n)。換句話說,動態範圍控制模塊204 是以音節為單位處理語音信號x(n),而單一音節範圍內的所有樣本皆是以同一衰減倍數進 行振幅衰減。因此,由動態範圍控制模塊204處理所得的調整語音信號y(n)不會有信號失 真,並且亦不會如現有技術般帶有噪音。 圖3為依據本發明的一音節的振幅峰值與衰減倍數間的關係的示意圖。於一實施 例中,振幅峰值的可能值lx(n) I被區分為以多個界限值1\、^3劃分的多個振幅區域。當 音節的振幅峰值lx(n) I低於第一界限值1\時,音節的多個樣本的振幅|y(n) |是依據衰減 倍數gO進行調整,以得到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |介於第一 界限值1\與第二界限值L之間時,音節的多個樣本的振幅|y(n) I是依據衰減倍數gl進行 調整,以得到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |介於第二界限值L與 第三界限值T3之間時,音節的多個樣本的振幅|y(n) I是依據衰減倍數g2進行調整,以得 到調整語音信號y(n)的樣本。當音節的振幅峰值lx(n) |高於第三界限值T3時,音節的多 個樣本的振幅|y(n) I是依據衰減倍數g3進行調整,以得到調整語音信號y(n)的樣本。
於一實施例中,振幅調整模塊218依據下式調整音節的振幅
1 —n
n <|72 .
gl > g2 > g3。 因此,振幅調整模塊218依據較高的衰減倍數衰減具有較高的振幅的音節的樣本以產生調 整語音信號y(n)。 圖4為依據本發明的對語音信號進行振幅調整的方法400的流程圖。首先,緩衝 =
x(")-gO ^ x(").gl +鄉w[x(")〗.ri x(").g2 + Wg"[xO)〗';T2一語音信號x(n)以得到一延遲語音信號x(n-D)(步驟402)。接著,決定該延遲語音信號 x (n-D)的一音節v (n)(步驟404),並計算該音節的一振幅峰值p (n)。接著,依據該振幅峰 值P(n)決定一衰減倍數(步驟408)。接著,依據該衰減倍數調整該音節的多個樣本的振幅 以得到一調整語音信號y(n)(步驟410)。接著,放大該調整語音信號y(n)以得到一放大語 音信號z (n)(步驟412)。最後,播放該放大語音信號z (n)(步驟414)。
雖然本發明已以較佳實施例揭示如上,然其並非用以限定本發明,本領域的技術 人員,在不脫離本發明的精神和範圍的前提下可作若干的更動與潤飾,因此本發明的保護 範圍以本發明的權利要求為準。
權利要求
一種語音處理裝置,包括一語音信號源,產生一語音信號;一動態範圍控制模塊,耦接至該語音信號源,決定該語音信號的一音節,計算該音節的一振幅峰值,以及依據該振幅峰值調整該音節的振幅以得到一調整語音信號;一功率放大器,耦接至該動態範圍控制模塊,放大該調整語音信號以得到一放大語音信號。
2. 如權利要求1所述的語音處理裝置,其中該動態範圍控制模塊還包括一緩衝器,緩衝該語音信號以得到一延遲語音信號;一語音行為檢測器,自該延遲語音信號決定該音節;一峰值計算模塊,計算該音節的該振幅峰值;以及一振幅調整模塊,依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到該調整語音信號。
3. 如權利要求2所述的語音處理裝置,其中該語音行為檢測器計算該延遲語音信號的振幅,決定是否該振幅超過一界限值以判定該音節的一起始邊緣,決定是否該振幅低於該界限值以判定該音節的一結束邊緣,並將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
4. 如權利要求2所述的語音處理裝置,其中該峰值計算模塊計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值,並自所述振幅值選取一最大值作為該音節的該振幅峰值。
5. 如權利要求2所述的語音處理裝置,其中該振幅調整模塊自多個振幅區域決定包含該振幅峰值的一 目標振幅區域,決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數,並依據該衰減倍數調整該音節的振幅。
6. 如權利要求2所述的語音處理裝置,其中該振幅調整模塊依據下式調整該音節的振幅formula see original document page 2其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且gO > gl > g2 > g3, n為樣本序號。
7. 如權利要求1所述的語音處理裝置,其中該語音處理裝置還包含一揚聲器,用以播放該放大語音信號。
8. —種動態範圍控制模塊,設置於一語音處理裝置,包括一緩衝器,緩衝一語音信號以得到一延遲語音信號;一語音行為檢測器,自該延遲語音信號決定一音節;一峰值計算模塊,計算該音節的一振幅峰值;以及一振幅調整模塊,依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到一調整語音信號。
9. 如權利要求8所述的動態範圍控制模塊,其中該語音處理裝置包括一語音信號源,產生該語音信號;該動態範圍控制模塊,耦接至該語音信號源,依據該語音信號產生該調整語音信號;一功率放大器,耦接至該動態範圍控制模塊,放大該調整語音信號以得到一放大語音信號。
10. 如權利要求9所述的動態範圍控制模塊,其中該語音處理裝置還包含一揚聲器,用以播放該放大語音信號。
11. 如權利要求8所述的動態範圍控制模塊,其中該語音行為檢測器計算該延遲語音信號的振幅,決定是否該振幅超過一界限值以判定該音節的一起始邊緣,決定是否該振幅低於該界限值以判定該音節的一結束邊緣,並將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
12. 如權利要求8所述的動態範圍控制模塊,其中該峰值計算模塊計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值,並自所述振幅值選取一最大值作為該音節的該振幅峰值。
13. 如權利要求8所述的動態範圍控制模塊,其中該振幅調整模塊自多個振幅區域決定包含該振幅峰值的一 目標振幅區域,決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數,並依據該衰減倍數調整該音節的振幅。
14. 如權利要求8所述的動態範圍控制模塊,其中該振幅調整模塊依據下式調整該音節的振幅formula see original document page 3其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且g0 > gl > g2 > g3, n為樣本序號。
15. —種對語音信號進行振幅調整的方法,包括下列步驟緩衝一語音信號以得到一延遲語音信號;自該延遲語音信號決定一音節;計算該音節的一振幅峰值;以及依據該音節的該振幅峰值決定對應於該音節的一衰減倍數;以及依據該衰減倍數以相同增益調整該音節的振幅以得到一調整語音信號。
16. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該方法還包括放大該調整語音信號以得到一放大語音信號;以及播放該放大語音信號。
17. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該音節的決定步驟包括計算該延遲語音信號的振幅;決定是否該振幅超過一界限值以判定該音節的一起始邊緣; formula see original document page 3決定是否該振幅低於該界限值以判定該音節的一結束邊緣;以及將該延遲語音信號自該起始邊緣至該結束邊緣的範圍決定為該音節的範圍。
18. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該振幅峰值的計算包括計算該延遲語音信號於該音節的範圍內的多個樣本的多個振幅值;以及自所述振幅值選取一最大值作為該音節的該振幅峰值。
19. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該衰減倍數的決定包括自多個振幅區域決定包含該振幅峰值的一目標振幅區域;決定對應於該目標振幅區域的一衰減幅度作為該衰減倍數;以及依據該衰減倍數調整該音節的振幅。
20. 如權利要求15所述的對語音信號進行振幅調整的方法,其中該音節的振幅的調整是依據下式formula see original document page 4其中y(n)為該調整語音信號,x(n)為該延遲語音信號,sign[x(n)]為該延遲語音信號的正負號,Tl、T2、T3為界限值,gO,gl,g2,g3為衰減幅度且g0 > gl > g2 > g3, n為樣本序號。
全文摘要
本發明提供一種語音處理裝置、動態範圍控制模塊及語音振幅調整的方法。於一實施例中,該動態範圍控制模塊設置於一語音處理裝置,包括一緩衝器、一語音行為檢測器、一峰值計算模塊、以及一振幅調整模塊。該緩衝器緩衝一語音信號以得到一延遲語音信號。該語音行為檢測器自該延遲語音信號決定一音節。該峰值計算模塊計算該音節的一振幅峰值。該振幅調整模塊依據該振幅峰值決定一衰減倍數,以及依據該衰減倍數調整該音節的振幅以得到一調整語音信號。
文檔編號H03G11/00GK101729034SQ20091020971
公開日2010年6月9日 申請日期2009年10月30日 優先權日2008年10月31日
發明者張銘, 白宛傑 申請人:美商富迪科技股份有限公司