語音質量評估的方法和裝置製造方法
2023-04-23 21:08:01 2
語音質量評估的方法和裝置製造方法
【專利摘要】本發明實施例提供一種語音質量評估的方法和裝置。該方法包括:接收待檢測信號,根據待檢測信號的編碼速率,獲取語音質量評估基準分值,對待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,根據語音質量評估基準分值和質量損傷評估值的差值,獲取待檢測信號對應的語音質量最終評估分值。本發明實施例提供的語音質量評估的方法和裝置,實現了對網絡傳輸的語音碼流信號進行實時語音質量評估,從而可實現對網絡情況進行實時監控,同時提高了網絡性能評估效率。
【專利說明】語音質量評估的方法和裝置
【技術領域】
[0001 ] 本發明實施例涉及通信【技術領域】,尤其涉及一種語音質量評估的方法和裝置。
【背景技術】
[0002]語音質量評估可分為主觀語音評估和客觀語音評估兩種,主觀語音評估是以人為主體根據某種預先約定的規則來對失真語音或參考原始語音劃分質量等級,它反映了評聽者對語音質量好壞程度的一種主觀印象。客觀語音評估採用機器自動判別語音質量,它使用某個特定的參數去表徵語音通過編碼或傳輸系統後的失真程度,並以此來評估處理系統的性能優劣。
[0003]另外,對於客觀語音評估,目前主要採用語音質量感知評估(PerceptualEvaluation of Speech Quality,以下簡稱 PESQ),具體的,通過對參考信號和失真信號分別進行電平調整,再用輸入濾波器模擬標準電話揚聲器分別對電平調整後的參考信號和失真信號進行濾波,然後對通過電平調整和濾波後的上述兩個信號在時間上對準,再對時間上對準後的兩個信號分別進行聽覺變換,最後分析2個聽覺變換後的信號之間的擾動曲面,以提取出對稱幹擾和非對稱幹擾2個失真參數,在對這2個失真參數頻率和時間上進行累積,並將累計後的值與主觀平均意見分的預測值相比較,得到PESQ得分。其中,失真信號是參考信號在進入到測試系統後得到的信號。
[0004]但是,由於PESQ是一種波形域侵入式非實時語音質量評估方法,因此要求輸入的信號必須是波形域信號,且還需要提供參考信號,才能進行語音質量評估,這樣就對評估條件有嚴格限制。另外,還需要將待評估信號進行完整錄音後再進行質量評估,從而無法對語音質量進行實時評估。
【發明內容】
[0005]本發明實施例提供一種語音質量評估的方法和裝置,以實現對網絡傳輸的語音碼流信號進行非侵入式線上實時語音質量評估,不需要參考信號,同時實現了對網絡情況進行實時監控。
[0006]第一方面,本發明實施例提供一種語音質量評估的方法,包括:
[0007]接收待檢測信號;
[0008]根據所述待檢測信號的編碼速率,獲取語音質量評估基準分值;
[0009]對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值;
[0010]根據所述語音質量評估基準分值和所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
[0011]在第一方面的第一種可能的實施方式中,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合:
[0012]對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值;[0013]對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值;
[0014]對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值;
[0015]對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值;
[0016]對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和
[0017]對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
[0018]結合第一方面的第一種可能的實施方式,在第一方面的第二種可能的實施方式中,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,還包括:
[0019]對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
[0020]結合第一方面,在第一方面的第三種可能的實施方式,當所述待檢測信號包括上行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合:
[0021]對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值;
[0022]對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值;
[0023]對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值;
[0024]對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值;
[0025]對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和
[0026]對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
[0027]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第四種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值,包括:
[0028]在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式M_Clip=Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ;
[0029]其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
[0030]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第五種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值,包括:
[0031]在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式
[0032]M FER= Packci_ loss_rate + B + C*{Consecutive Loss Count -D),獲取丟中貞損傷值M_FER ;
[0033]其中,A、B、C、D為丟幀損傷因子,A、B隨著編解碼的碼率不同會有差別,Packet,loss_rate為檢測到的丟包率,Consecutive_Loss_Count為檢測到的長時連續丟包率。
[0034]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第六種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值,包括:
[0035]在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn=Aglith ;[0036]在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜
音損傷= a uPdate_giithXM_Glithn_1 ;或者,
[0037]其中,a update glith為雜音損傷更新因子,ILGlithlri為前一幀的雜音損傷,Aglith為雜音損傷因子。
[0038]結合第一方面的第一種可能的實施方式或第一方面的第三種可能的實施方式,在第一方面的第七種可能的實施方式中,所述對所述下行碼流信息或上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值,包括:
[0039]在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
[0040]
【權利要求】
1.一種語音質量評估的方法,其特徵在於,包括: 接收待檢測信號; 根據所述待檢測信號的編碼速率,獲取語音質量評估基準分值; 對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值; 根據所述語音質量評估基準分值和所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
2.根據權利要求1所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合: 對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
3.根據權利要求2所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,還包括: 對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
4.根據權利要求1所述的語音質量評估的方法,其特徵在於,當所述待檢測信號包括上行碼流信息時,所述對所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值,包括如下一種或者幾種組合: 對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
5.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式M_Clip= =Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ; 其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
6.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式MFER= sJa* Packci _ loss _ rate + B +C* (('o/isecui/ve Loss Count - D),獲取丟中貞損傷值 MJ7ER ;其中,A、B、C、D為丟幀損傷因子,A、B隨著編解碼的碼率不同會有差別,Packet_l0SS_rate為檢測到的丟包率,Consecutive Loss Count為檢測到的長時連續丟包率。
7.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn = Aglith ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn= a update glithXM_G1 Ithn^1 ; 其中,α UPdatejIith為雜音損傷更新因子,M_G1 Ithn^1為前一幀的雜音損傷,Aglith為雜音損傷因子。
8.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
9.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值,包括: 在判斷出所述下行碼流信息或上行碼流信息存在單通信號時,設置當前幀的單通損傷值 M_one_wayn = Aone way ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在單通信號時,設置當前幀的單通損傷值 M_one_wayn= a update one way X M_one_wayn_!; 其中,α update_one_way為單通損傷更新因子,M_One_Wayn_!為前一幀的單通損傷,Aone way為單通損傷因子。
10.根據權利要求2或4所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息或上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值,包括: 根據獲取到的網絡默認延遲Tdefault和網絡當前延遲T,採用公式M_Delay= a delayX(T一Tdefault),獲取延遲損傷值M_Delay ; 其中,adelay是延遲損傷因子。
11.根據權利要求3所述的語音質量評估的方法,其特徵在於,所述對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值,包括: 在判斷出所述下行碼流信息和上行碼流信息存在回聲信號時,採用公式 M_Echo=long_time_echo_percent*basic_efect,獲取回聲損傷值 M_Echo ; 其中,
basic_effect=Aecho*log10 (long_time_energy_ratio+Becho),long_time_echo_percent為檢測到的長時回聲百分比,long_time_energy_ratio為檢測到的長時回聲能量比,Aecho>B-。為回聲損傷因子。
12.—種語音質量評估的裝置,其特徵在於,包括: 接收模塊,用於接收待檢測信號;第一評估處理模塊,用於根據所述接收模塊接收到的所述待檢測信號的編碼速率,獲取語音質量評估基準分值; 第二評估處理模塊,用於對所述接收模塊接收到的所述待檢測信號進行質量損傷評估處理,獲取質量損傷評估值; 獲取模塊,用於根據所述第一評估處理模塊獲取到的所述語音質量評估基準分值和所述第二評估處理模塊獲取到的所述質量損傷評估值的差值,獲取所述待檢測信號對應的語音質量最終評估分值。
13.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括下行碼流信息,或者上行碼流信息和下行碼流信息時,所述第二評估處理模塊包括如下一種或者幾種單元的組合: 削波損傷質量評估處理單元,用於對所述下行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 丟幀損傷質量評估處理單元,用於對所述下行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 雜音損傷質量評估處理單元,用於對所述下行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 噪聲損傷質量評估處理單元,用於對所述下行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 單通損傷質量評估處理單元,用於對所述下行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 延遲損傷質量評估處理單元,用於對所述下行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
14.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括上行碼流信息和下行碼流信息時,所述第二評估處理模塊還包括: 回聲損傷質量評估處理單元,用於對所述下行碼流信息和上行碼流信息進行回聲損傷質量評估處理,獲取回聲損傷值。
15.根據權利要求12所述的語音質量評估的裝置,其特徵在於,當所述待檢測信號包括上行碼流信息時,所述第二評估處理模塊包括如下一種或者幾種單元的組合: 削波損傷質量評估處理單元,用於對所述上行碼流信息進行削波損傷質量評估處理,獲取削波損傷值; 丟中貞損傷質量評估處理單元,用於對所述上行碼流信息進行丟幀損傷質量評估處理,獲取丟幀損傷值; 雜音損傷質量評估處理單元,用於對所述上行碼流信息進行雜音損傷質量評估處理,獲取當前幀的雜音損傷值; 噪聲損傷質量評估處理單元,用於對所述上行碼流信息進行噪聲損傷質量評估處理,獲取噪聲損傷值; 單通損傷質量評估處理單元,用於對所述上行碼流信息進行單通損傷質量評估處理,獲取當前幀的單通損傷值;和 延遲損傷質量評估處理單元,用於對所述上行碼流信息進行延遲損傷質量評估處理,獲取延遲損傷值。
16.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述削波損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在削波信號時,採用公式 M_Clip=Aclip X long-time-clip-percent,獲取削波損傷值 M_Clip ; 其中,long-time-clip-percent為檢測到的長時削波百分比,Aclip為削波損傷因子。
17.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述丟幀損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在丟幀信號時,採用公式
18.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述雜音損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在雜音信號時,設置當前幀的雜音損傷值M_G1 Uchn=Aglith ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在雜音信號時,設置當前幀的雜音損傷值 M_Glitchn= a update glithXM_G1 Ithn^1 ; 其中,α UPdatejIith為雜音損傷更新因子,M_G1 Ithn^1為前一幀的雜音損傷,Aglith為雜音損傷因子。
19.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述噪聲損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在噪聲信號時,採用公式
20.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述單通損傷質量評估處理單元具體用於在判斷出所述下行碼流信息或上行碼流信息存在單通信號時,設置當前幀的單通損傷= Aone way ;或者, 在判斷出所述下行碼流信息或上行碼流信息不存在單通信號時,設置當前幀的單通損傷值 M_one_wayn= a tpdate one way X M_one_wayn_!; 其中,α update_one_way為單通損傷更新因子,M_One_Wayn_!為前一幀的單通損傷,Aone way為單通損傷因子。
21.根據權利要求13或15所述的語音質量評估的裝置,其特徵在於,所述延遲損傷質量評估處理單元具體用於根據獲取到的網絡默認延遲Tdefault和網絡當前延遲T,採用公SM_Delay=a delayX (T一Tdefault),獲取延遲損傷值 M_Delay ; 其中,adelay是延遲損傷因子。
22.根據權利要求14所述的語音質量評估的裝置,其特徵在於,所述回聲損傷質量評估處理單元具體用於在判斷出所述下行碼流信息和上行碼流信息存在回聲信號時,採用公式M_Echo=long_time_echo_percent*basic_effect,獲取回聲損傷值 M_Echo ; 其中,
basic_effect=Aecho*log10 (long_time_energy_ratio+Becho),long_time_echo_percent為檢測到的長時回聲百分比,long_time_energy_ratio為檢測到的長時回聲能量比,Aecho>B-。為回聲損傷因 子。
【文檔編號】H04L12/26GK103839554SQ201210487008
【公開日】2014年6月4日 申請日期:2012年11月26日 優先權日:2012年11月26日
【發明者】張德明, 張琦, 李海婷, 張夢晗 申請人:華為技術有限公司