新四季網

語音質量評估的方法和裝置製造方法

2023-04-23 21:08:01

語音質量評估的方法和裝置製造方法
【專利摘要】本發明實施例提供一種語音質量評估的方法和裝置。該方法包括:接收待檢測信號,根據待檢測信號的編碼速率,獲取語音質量評估基準分值,對待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,根據語音質量評估基準分值和質量損傷評估值的差值,獲取待檢測信號對應的語音質量最終評估分值。本發明實施例提供的語音質量評估的方法和裝置,實現了對網絡傳輸的語音碼流信號進行實時語音質量評估,從而可實現對網絡情況進行實時監控,同時提高了網絡性能評估效率。
【專利說明】語音質量評估的方法和裝置
【技術領域】
[0001 ] 本發明實施例涉及通信【技術領域】,尤其涉及一種語音質量評估的方法和裝置。
【背景技術】
[0002]語音質量評估可分為主觀語音評估和客觀語音評估兩種,主觀語音評估是以人為主體根據某種預先約定的規則來對失真語音或參考原始語音劃分質量等級,它反映了評聽者對語音質量好壞程度的一種主觀印象。客觀語音評估採用機器自動判別語音質量,它使用某個特定的參數去表徵語音通過編碼或傳輸系統後的失真程度,並以此來評估處理系統的性能優劣。
[0003]另外,對於客觀語音評估,目前主要採用語音質量感知評估(PerceptualEvaluation of Speech Quality,以下簡稱 PESQ),具體的,通過對參考信號和失真信號分別進行電平調整,再用輸入濾波器模擬標準電話揚聲器分別對電平調整後的參考信號和失真信號進行濾波,然後對通過電平調整和濾波後的上述兩個信號在時間上對準,再對時間上對準後的兩個信號分別進行聽覺變換,最後分析2個聽覺變換後的信號之間的擾動曲面,以提取出對稱幹擾和非對稱幹擾2個失真參數,在對這2個失真參數頻率和時間上進行累積,並將累計後的值與主觀平均意見分的預測值相比較,得到PESQ得分。其中,失真信號是參考信號在進入到測試系統後得到的信號。
[0004]但是,由於PESQ是一種波形域侵入式非實時語音質量評估方法,因此要求輸入的信號必須是波形域信號,且還需要提供參考信號,才能進行語音質量評估,這樣就對評估條件有嚴格限制。另外,還需要將待評估信號進行完整錄音後再進行質量評估,從而無法對語音質量進行實時評估。

【發明內容】

[0005]本發明實施例提供一種語音質量評估的方法和裝置,以實現對網絡傳輸的語音碼流信號進行非侵入式線上實時語音質量評估,不需要參考信號,同時實現了對網絡情況進行實時監控。
[0006]第一方面,本發明實施例提供一種語音質量評估的方法,包括:
[0007]接收待檢測信號;
[0008]根據所述待檢測信號的編碼速率,獲取語音質量評估基準分值;
[0009]對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值;
[0010]根據所述語音質量評估基準分值和所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
[0011]在第一方面的第一種可能的實施方式中,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合:
[0012]對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值;[0013]對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值;
[0014]對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值;
[0015]對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值;
[0016]對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和
[0017]對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
[0018]結合第一方面的第一種可能的實施方式,在第一方面的第二種可能的實施方式中,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,還包括:
[0019]對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
[0020]結合第一方面,在第一方面的第三種可能的實施方式,當所述待檢測信號包括上行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合:
[0021]對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值;
[0022]對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值;
[0023]對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值;
[0024]對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值;
[0025]對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和
[0026]對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
[0027]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第四種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值,包括:
[0028]在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式M_Clip=Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ;
[0029]其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
[0030]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第五種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值,包括:
[0031]在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式
[0032]M FER= Packci_ loss_rate + B + C*{Consecutive Loss Count -D),獲取丟中貞損傷值M_FER ;
[0033]其中,A、B、C、D為丟幀損傷因子,A、B隨著編解碼的碼率不同會有差別,Packet,loss_rate為檢測到的丟包率,Consecutive_Loss_Count為檢測到的長時連續丟包率。
[0034]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第六種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值,包括:
[0035]在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn=Aglith ;[0036]在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜
音損傷= a uPdate_giithXM_Glithn_1 ;或者,
[0037]其中,a update glith為雜音損傷更新因子,ILGlithlri為前一幀的雜音損傷,Aglith為雜音損傷因子。
[0038]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第七種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值,包括:
[0039]在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
[0040]
【權利要求】
1.一種語音質量評估的方法,其特徵在於,包括: 接收待檢測信號; 根據所述待檢測信號的編碼速率,獲取語音質量評估基準分值; 對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值; 根據所述語音質量評估基準分值和所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
2.根據權利要求1所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合: 對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
3.根據權利要求2所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,還包括: 對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
4.根據權利要求1所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括上行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合: 對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
5.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式M_Clip= =Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ; 其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
6.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式MFER= sJa* Packci _ loss _ rate + B +C* (('o/isecui/ve Loss Count - D),獲取丟中貞損傷值 MJ7ER ;其中,A、B、C、D為丟幀損傷因子,A、B隨著編解碼的碼率不同會有差別,Packet_l0SS_rate為檢測到的丟包率,Consecutive Loss Count為檢測到的長時連續丟包率。
7.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn = Aglith ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn= a update glithXM_G1 Ithn^1 ; 其中,α UPdatejIith為雜音損傷更新因子,M_G1 Ithn^1為前一幀的雜音損傷,Aglith為雜音損傷因子。
8.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
9.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在單通信號時,設置當前幀的單通損傷值 M_one_wayn = Aone way ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在單通信號時,設置當前幀的單通損傷值 M_one_wayn= a update one way X M_one_wayn_!; 其中,α update_one_way為單通損傷更新因子,M_One_Wayn_!為前一幀的單通損傷,Aone way為單通損傷因子。
10.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值,包括: 根據獲取到的網絡默認延遲Tdefault和網絡當前延遲T,採用公式M_Delay= a delayX(T一Tdefault),獲取延遲損傷值M_Delay ; 其中,adelay是延遲損傷因子。
11.根據權利要求3所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值,包括: 在判斷出所述下行碼流信息和上行碼流信息存在回聲信號時,採用公式 M_Echo=long_time_echo_percent*basic_efect,獲取回聲損傷值 M_Echo ; 其中,
basic_effect=Aecho*log10 (long_time_energy_ratio+Becho),long_time_echo_percent為檢測到的長時回聲百分比,long_time_energy_ratio為檢測到的長時回聲能量比,Aecho>B-。為回聲損傷因子。
12.—種語音質量評估的裝置,其特徵在於,包括: 接收模塊,用於接收待檢測信號;第一評估處理模塊,用於根據所述接收模塊接收到的所述待檢測信號的編碼速率,獲取語音質量評估基準分值; 第二評估處理模塊,用於對所述接收模塊接收到的所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值; 獲取模塊,用於根據所述第一評估處理模塊獲取到的所述語音質量評估基準分值和所述第二評估處理模塊獲取到的所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
13.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述第二評估處理模塊包括如下一種或者幾種單元的組合: 削波損傷質量評估處理單元,用於對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 丟幀損傷質量評估處理單元,用於對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 雜音損傷質量評估處理單元,用於對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 噪聲損傷質量評估處理單元,用於對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 單通損傷質量評估處理單元,用於對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 延遲損傷質量評估處理單元,用於對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
14.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述第二評估處理模塊還包括: 回聲損傷質量評估處理單元,用於對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
15.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括上行碼流信息時,所述第二評估處理模塊包括如下一種或者幾種單元的組合: 削波損傷質量評估處理單元,用於對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 丟中貞損傷質量評估處理單元,用於對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 雜音損傷質量評估處理單元,用於對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 噪聲損傷質量評估處理單元,用於對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 單通損傷質量評估處理單元,用於對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 延遲損傷質量評估處理單元,用於對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
16.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述削波損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式 M_Clip=Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ; 其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
17.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述丟幀損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式
18.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述雜音損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值M_G1 Uchn=Aglith ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn= a update glithXM_G1 Ithn^1 ; 其中,α UPdatejIith為雜音損傷更新因子,M_G1 Ithn^1為前一幀的雜音損傷,Aglith為雜音損傷因子。
19.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述噪聲損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
20.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述單通損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在單通信號時,設置當前幀的單通損傷= Aone way ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在單通信號時,設置當前幀的單通損傷值 M_one_wayn= a tpdate one way X M_one_wayn_!; 其中,α update_one_way為單通損傷更新因子,M_One_Wayn_!為前一幀的單通損傷,Aone way為單通損傷因子。
21.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述延遲損傷質量評估處理單元具體用於根據獲取到的網絡默認延遲Tdefault和網絡當前延遲T,採用公SM_Delay=a delayX (T一Tdefault),獲取延遲損傷值 M_Delay ; 其中,adelay是延遲損傷因子。
22.根據權利要求14所述的語音質量評估的裝置,其特徵在於,所述回聲損傷質量評估處理單元具體用於在判斷出所述下行碼流信息和上行碼流信息存在回聲信號時,採用公式M_Echo=long_time_echo_percent*basic_effect,獲取回聲損傷值 M_Echo ; 其中,
basic_effect=Aecho*log10 (long_time_energy_ratio+Becho),long_time_echo_percent為檢測到的長時回聲百分比,long_time_energy_ratio為檢測到的長時回聲能量比,Aecho>B-。為回聲損傷因 子。
【文檔編號】H04L12/26GK103839554SQ201210487008
【公開日】2014年6月4日 申請日期:2012年11月26日 優先權日:2012年11月26日
【發明者】張德明, 張琦, 李海婷, 張夢晗 申請人:華為技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀