端到端語音質量自動測試系統及其方法

2023-06-19 23:40:51 1

專利名稱：端到端語音質量自動測試系統及其方法
技術領域：
本發明涉及通信系統語音質量測試技術，特別涉及下一代網絡中端到端語音質量測試技術。
背景技術：
隨著下一代網絡(Next Generation Network，簡稱「NGN」)技術的逐漸成熟和廣泛應用，以前在公用電話交換網(Public Switched TelephoneNetwork，簡稱「PSTN」)網絡中並不被十分關注的語音質量問題逐漸突顯出來。這是因為NGN的語音採用分組的管道進行傳送，質量受網間互聯協議(Internet Protocol，簡稱「IP」)承載網、網關的數位訊號處理(Digital SignalProcessing，簡稱「DSP」)處理器效率等多個方面的影響，語音服務質量(Quality of Service，簡稱「QoS」)的提高需要多方面的努力；而PSTN的語音傳送使用專用時隙，不存在明顯的時延、抖動、語音丟包等問題，語音質量比較穩定。對於NGN，在很多情況下，語音質量已經成為產品能否成功商用的重要因素，因此語音質量測試也就成為NGN相關產品的一項重要測試內容。
端到端的語音質量是通信網絡QoS的重要測試指標，在各種入網測試以及其它測試中，運營商最關注的也是端到端的語音質量。比如對於NGN網絡來說，端到端的語音質量涵蓋了網關編碼解碼、靜音壓縮、增益變化、環境噪聲、承載網丟包、抖動等等各種因素，是用戶真正感受到的語音質量。
影響語音質量的主要因素有清晰度、時延、回聲等，其中語音清晰度對語音質量的影響最大，是衡量語音質量最主要的指標，一般在不引起歧義時，語音質量通常也指清晰度。
有幾種標準方法來衡量語音質量。一個明顯的方法是平均評定得分法(Mean Opinion Score，簡稱「MOS」)，該方法通過一個受控制的測試來獲得，在測試中，很多人互相打電話並評定語音質量。評價者是直接參與到語音呼叫中的個人。MOS是從這群人的評價中來計算平均分數的(1～5分，5是最好，4被認為是長途電話質量)。MOS是主觀測試的一種評價標準，其缺點是耗時、高成本和不方便。
因此，語音質量的衡量通常是使用下列分析算法中的一種感知話音質量測量法(Perceptual Speech Quality Measure，簡稱「PSQM」)、感知分析測量系統法(Perceptual Analysis Measurement System，簡稱「PAMS」)、感知話音評估法(Perceptual Evaluation of Speech，簡稱「PESQ」)等。這些衡量方法提供了客觀評定和定量測量語音清晰度所必需的度量標準。
其中PESQ是目前業界應用最廣泛，並且被一致認為是最準確可靠的方法。通過PESQ衡量的語音質量結果的輸出值是一個在[-0.5～4.5]之間的得分值，得分越高，說明語音質量越好。關於PESQ的詳細內容，可以參考國際電信聯盟-電信標準部(International Telecommunication UnionTelecommunication Standardization Sector，簡稱「ITU-T」)的P862建議。
目前對PESQ的測量基本都是通過專用的語音質量測量儀器來進行的，比如AGILENT公司的VQT(Voice Quality Test，語音質量測試)就是一種測試語音質量的常用設備。VQT的工作原理如下在硬體方面，VQT提供普通電話埠，與被測試設備相連，在軟體方面，VQT本身提供一套作業系統(目前常用的是Windows作業系統)，用於運行VQT軟體，執行具體的測試任務。利用VQT測試語音質量的一般步驟是a.連接VQT與被測語音設備；b.運行VQT軟體，建立測試環境；c.選擇配置所用的物理埠，配置主被叫號碼，創建測試任務表；
d.測試執行；e.查看測試結果。
在實際應用中，上述方案存在以下問題不能進行自動化測試、操作複雜、成本高、只能進行單路語音質量測試。
造成這種情況的主要原因在於，因為VQT沒有提供通用的編程接口，不能進行測試腳本的定製，無法實現業務多樣化和測試流程的多樣化設定，只能夠使用其已經提供的幾個功能，無法進一步擴展，因此無法實現測試的自動化。由於無法實現自動化，所以需要測試人員在整個測試過程中進行比較多的操作，因此操作比較複雜和繁瑣。因為是專門為NGN語音測試研製的工具，批量很小，導致成本高。由於VQT設計上的限制只能進行單路語音質量測試。

發明內容
有鑑於此，本發明的主要目的在於提供一種端到端語音質量自動測試系統及其方法，使得語音質量的自動化測試得以實現，並支持同時對多路通話進行語音質量測試。
為實現上述目的，本發明提供了一種端到端語音質量自動測試系統，包含通過網間互聯協議承載網連接的第一和第二媒體網關，語音卡，控制和計算裝置，其中所述語音卡用於將播放第一語音文件產生的語音信號通過第一埠傳送給所述第一媒體網關，使用第二埠接收來自第二媒體網關的語音信號，並錄製成第二語音文件；所述第一和第二媒體網關用於通過信令和媒體流的交互實現所述語音卡的第一、第二埠之間的端到端語音信號傳遞；所述控制和計算裝置用於對所述語音卡進行控制，並根據所述第一、第二語音文件計算代表語音質量的指標。
其中，所述代表語音質量的指標是感知話音評估法的評分。
所述語音卡還通過其他埠連接到其他媒體網關，在所連接的多個媒體網關之間同時進行多路端到端語音質量測試。
所述第一語音文件是國際電信聯盟-電信標準部推薦的感知話音評估法的標準語音文件。
所述控制和計算裝置是個人電腦。
本發明還提供了一種端到端語音質量自動測試方法，包含以下步驟A通過語音卡的第一埠向第一媒體網關播放第一語音文件；B所述第一媒體網關通過網間互聯協議承載網向第二媒體網關傳送語音信號；C所述語音卡通過第二埠接收來自所述第二媒體網關的語音信號，並錄製成第二語音文件；D比較所述第一、第二語音文件，計算代表語音質量的指標。
其中，所述步驟D中，使用感知話音評估法計算出代表語音質量的指標。
所述步驟A還進一步包含以下子步驟所述語音卡在播放所述第一語音文件的開始前和結束後都分別插入具有特定頻譜特徵的同步信號；所述步驟C還進一步包含以下子步驟所述語音卡檢測到起始同步信號後開始錄音，在檢測到結束同步信號後停止錄音。
還包含以下步驟所述語音卡同時啟動播放和錄製功能，通過感知話音評估法保證播放和錄製的同步開始；在播放結束後，立即通過所述第一埠發送一個結束通知音，所述第二埠收到該結束通知音後立即停止錄製。
所述語音卡在預先設定的時間段內播放所述第一語音文件和錄製所述第二語音文件。
通過比較可以發現，本發明的技術方案與現有技術的區別在於，利用語音卡控制兩部接入NGN的電話進行通話，通話的一方播放一個語音文件，同時通話的另一方進行錄音，並存儲為另一語音文件，然後將這兩個語音文件作為PESQ算法的輸入，進行分析計算，得到代表語音清晰度的PESQ得分。
這種技術方案上的區別，帶來了較為明顯的有益效果，即通過使用語音卡並對語音卡的對外接口進行編程控制，可以實現語音清晰度的自動化測試，簡化了人工操作，提高了語音質量測試效率，節約人力成本。因為語音卡是生產量比較大的通用板卡，相對於專用的VQT設備，成本要低很多。因為語音卡可以實現同時對多路語音的控制，因此可以同時進行多路的語音質量測試。

圖1是根據本發明的一個實施例的端到端語音清晰度自動測試系統結構圖；圖2是根據本發明的一個實施例的端到端語音清晰度自動測試方法流程圖。
具體實施例方式
為使本發明的目的、技術方案和優點更加清楚，下面將結合附圖對本發明作進一步地詳細描述。
下面參照圖1，詳細描述根據本發明的一個實施例的端到端語音清晰度自動測試系統。該系統包含語音卡10、MGW20、MGW30、IP承載網40和軟交換設備50，控制和計算裝置60。語音卡10通過普通電話線分別連接到MGW20和MGW30；MGW20與MGW30之間通過IP承載網40連接；軟交換設備50連接到IP承載網40中。其中，語音卡10用於使用第一埠模擬普通電話機向MGW20播放第一語音文件，並使用第二埠對來自MGW30的語音進行錄音，並以文件形式保存為第二語音文件。這裡的第一語音文件是事先錄製的標準語音文件。播放的語音信號經過被測試的MGW20、IP承載網40、MGW30的傳輸以後最終到達語音卡10第二埠，輸出降級信號。之所以稱為降級信號是因為語音信號在傳播過程中不可避免地會有一定的損失(因為經過了MGW編碼和解碼等過程)。
語音卡是一種能夠模擬普通電話機所有功能的板卡，此外還有錄音放音等功能，可以安裝在個人電腦(Personal Computer，簡稱「PC」)上，可以通過編程控制其行為，這樣就為通過軟體實現自動化控制提供了可能性。語音卡是一種比較普及的板卡，成本較低，有許多廠商都能夠獨力設計和生產，其中比較著名的廠商有Dialogic等。本發明中對語音卡10的要求如下首先，能夠通過對外開放的編程接口控制語音卡10進行電話機的基本操作，如摘機、掛機、撥號、信號音檢測等。
其次，能夠通過對外開放的編程接口控制語音卡10進行語音文件的播放和錄音。
再次，語音卡10對外提供至少兩個電話埠，能夠對各個電話埠同時進行操作。
目前主流的語音卡一般都能夠同時滿足以上三個要求。
MGW20和MGW30各用於接入一路語音信號，藉助IP承載網40的傳輸，實現端到端的語音通信。熟悉本發明領域的技術人員可以知道，從一端的話機到MGW使用的是模擬信號，走普通電話線，在兩個MGW之間使用的是數位訊號，採用基於IP的網絡進行傳輸。
IP承載網40是用於實現MGW20和MGW30之間的數據傳輸。IP承載網40為了能夠實現數據傳輸的功能，還連接著許多傳輸設備，包括實現交換功能的軟交換設備50。MGW20、30與軟交換設備50之間控制信令、以及MGW20和MGW30之間的媒體流，都是通過IP承載網來傳送的。
控制和計算裝置60用於對語音卡進行控制，並根據第一、第二語音文件計算PESQ得分，該得分就是代表語音清晰度的指標。
在本發明的一個較佳實施例中，控制和計算裝置60是一臺PC，語音卡10插在PC的槽口中。PC通過自行編制的軟體調用語音卡10的應用編程接口(Application Programming Interface，簡稱「API」)函數，實現對語音卡10的控制，實現摘機、撥號、放音、錄音、掛機等功能。本發明中測試的自動化就是指通過自行編制的軟體把原先需要人手工操作的步驟自動執行，並且根據運行的中間結果智能地選擇下一步需要進行的操作。
在本發明的另一個較佳實施例中，控制和計算裝置60是插有多塊語音卡的PC，每一塊語音卡有多個埠，分別控制一路電話進行相互之間的端到端語音清晰度自動測試。這些測試可以同時進行。
上面描述了實現本發明的一個系統，下面根據該系統結合圖2詳細描述根據本發明的一個實施例的端到端語音清晰度自動測試方法。
在步驟110中，語音卡10向MGW20播放第一語音文件。這裡的第一語音文件是事先錄製好的標準語音文件，之所以使用語音文件，是因為對於非語音的信號，如音樂，所得到的結果是不具有代表性的。ITU-T提供了一套標準的語音文件，包括不同語言的男聲、女聲、童聲等等，時間都為8秒鐘，在本發明的一個較佳實施例中，使用這些標準的語音文件進行測試。
此後進入步驟120，MGW20通過IP承載網40向MGW30傳送語音。MGW20對來自語音卡10第一埠的語音進行編碼，通過和軟交換設備50的信令交互，建立和MGW30的連接，然後向MGW30發送編碼後的媒體流，MGW30收到媒體流以後進行解碼，轉換成普通的語音信號，發送到語音卡10的第二埠。
此後進入步驟130，語音卡10對來自MGW30的語音進行錄音。通過錄音得到降級語音文件。
此後進入步驟140，通過比較標準語音文件和降級語音文件，計算PESQ得分。
PESQ是一個成熟的現有技術，用於測量單邊語音質量，這裡簡單介紹一下。一個信號(簡稱A)輸入給被測系統，得到一個降級輸出信號(簡稱B)，通過PESQ算法對A和B進行比較分析，即可計算出PESQ得分。一般而言，B和A相比，總是有一定的差異或者損傷，但這樣的損傷在MGW等網絡設備提供一定的網絡保障以後，人耳朵是感覺不到的，或者是人耳朵可以接受的，不然這樣的網絡設備可以認為不可用。PESQ指標就是評估A和B的熵類參數，值越高，表示語音傳送的質量越好。PESQ計算需要經過電平調整(Level alignment)、輸入濾波(Input filtering)、時間校正(Timealignment)、聽覺轉換(Auditory transform)、幹擾處理(Disturbance processing)等幾個階段。PESQ考慮了濾波、抖動和短的局部失真等因素的影響，採取了增加了轉換函數相等化、時間排序，平均失真的新算法等措施，大量的試驗結果表明了PESQ算法的正確性。ITU-T提供了PESQ的標準算法，該算法的輸入為兩個WAV格式的語音文件，一個是原始語音文件，一個是經過被測系統，降級後的語音文件，算法輸出為一個[-0.5～4.5]之間的得分值，表示語音傳送的質量。
在本發明的另一個較佳實施例中，對上述系統和方法中放音和錄音的同步問題進行了改進。放音和錄音的同步問題比較重要，因為如果放音和錄音不同步的話，生成的降級文件就會丟失信息，或者多了冗餘信息，這樣會對PESQ的計算結果產生影響。
同步問題可有兩種解決方法一種方法是插入同步音，即在放音開始前和結束後都分別插入具有特定頻譜特徵的同步信號，接收端在檢測到起始同步信號後才開始錄音，在檢測到結束同步信號後則停止錄音。
另一種方法是通過結束通知音控制，這一方法實現較簡單，主要是基於PESQ算法能夠自動處理語音靜默期和語音活動期。按這種方法，放音和錄音同時開始比較容易保證(PESQ算法可以自動區別是不是語音)，在收到計算PESQ的命令後，同時啟動放音和錄音就可以了；要保證放音和錄音同時結束，可以在放音結束後立即向錄音端發送一個停止錄音的結束通知音信號，錄音的埠收到結束通知音後，立即停止錄音。
網絡一般會有時延，單純的時延一般不會導致相關語音控制信號和語音信號的失真，上面的方法依然有效；但如果時延加上抖動和丟包引起同步音和結束音失真變形，則被叫埠——錄音方無法區別開始和結束，這樣就不能得到準確的被錄文件。不過這類問題在實際語音測試的時候一般不會遇到，因為在主觀評估的時候語音質量就很差，再使用客觀評估的意義就很小了。
當網絡狀況非常差，以至於聲音嚴重失真變形時，以上兩種方法都可能會失效，因為同步音或結束通知音也同樣會失真變形，導致錄音方無法識別。在這種情況下，應該採用絕對時間的控制方式，即使用固定時長的標準語音文件(ITU-T提供的標準語音文件一般是8秒鐘)，錄音端也設定在確定的時間後結束錄音。
在本發明的另一個較佳實施例中，使用多路通話同時進行語音質量測試。
同時控制多路通話的方式更加接近實際，測試結果也才更符合實際情況。這是因為一般被測試的MGW都是支持多路的，對多路同時進行語音質量的測試才可以進一步評估該設備的性能。另外同時控制多路可以測試不同MGW之間的呼叫，減少用戶接口的頻繁物理連線、減少組網變動的壓力，便於自動化測試的更好開展。
由於語音卡上有多個用戶埠，並且在PC機上可以同時安裝多塊語音卡，這樣就可以控制多個電話埠，通過多線程的機制實現同時對多路通話進行語音質量的測試。
雖然通過參照本發明的某些優選實施例，已經對本發明進行了圖示和描述，但本領域的普通技術人員應該明白，可以在形式上和細節上對其作各種各樣的改變，而不偏離所附權利要求書所限定的本發明的精神和範圍。
權利要求
1.一種端到端語音質量自動測試系統，其特徵在於，包含通過網間互聯協議承載網連接的第一和第二媒體網關，語音卡，控制和計算裝置，其中所述語音卡用於將播放第一語音文件產生的語音信號通過第一埠傳送給所述第一媒體網關，使用第二埠接收來自第二媒體網關的語音信號，並錄製成第二語音文件；所述第一和第二媒體網關用於通過信令和媒體流的交互實現所述語音卡的第一、第二埠之間的端到端語音信號傳遞；所述控制和計算裝置用於對所述語音卡進行控制，並根據所述第一、第二語音文件計算代表語音質量的指標。
2.根據權利要求1所述的端到端語音質量自動測試系統，其特徵在於，所述代表語音質量的指標是感知話音評估法的評分。
3.根據權利要求1所述的端到端語音質量自動測試系統，其特徵在於，所述語音卡還通過其他埠連接到其他媒體網關，在所連接的多個媒體網關之間同時進行多路端到端語音質量測試。
4.根據權利要求1所述的端到端語音質量自動測試系統，其特徵在於，所述第一語音文件是國際電信聯盟-電信標準部推薦的感知話音評估法的標準語音文件。
5.根據權利要求1所述的端到端語音質量自動測試系統，其特徵在於，所述控制和計算裝置是個人電腦。
6.一種端到端語音質量自動測試方法，其特徵在於，包含以下步驟A通過語音卡的第一埠向第一媒體網關播放第一語音文件；B所述第一媒體網關通過網間互聯協議承載網向第二媒體網關傳送語音信號；C所述語音卡通過第二埠接收來自所述第二媒體網關的語音信號，並錄製成第二語音文件；D比較所述第一、第二語音文件，計算代表語音質量的指標。
7.根據權利要求6所述的端到端語音質量自動測試方法，其特徵在於，所述步驟D中，使用感知話音評估法計算出代表語音質量的指標。
8.根據權利要求6所述的端到端語音質量自動測試方法，其特徵在於，所述步驟A還進一步包含以下子步驟所述語音卡在播放所述第一語音文件的開始前和結束後都分別插入具有特定頻譜特徵的同步信號；所述步驟C還進一步包含以下子步驟所述語音卡檢測到起始同步信號後開始錄音，在檢測到結束同步信號後停止錄音。
9.根據權利要求6所述的端到端語音質量自動測試方法，其特徵在於，還包含以下步驟所述語音卡同時啟動播放和錄製功能，通過感知話音評估法保證播放和錄製的同步開始；在播放結束後，立即通過所述第一埠發送一個結束通知音，所述第二埠收到該結束通知音後立即停止錄製。
10.根據權利要求6所述的端到端語音質量自動測試方法，其特徵在於，所述語音卡在預先設定的時間段內播放所述第一語音文件和錄製所述第二語音文件。
全文摘要
本發明涉及通信系統語音質量測試技術，公開了一種端到端語音質量自動測試系統及其方法，使得語音質量的自動化測試得以實現，並支持同時對多路通話進行語音質量測試。這種端到端語音質量自動測試系統及其方法利用語音卡控制兩部接入NGN的電話進行通話，通話的一方播放一個語音文件，同時通話的另一方進行錄音，並存儲為另一語音文件，然後將這兩個語音文件作為PESQ算法的輸入，進行分析計算，得到代表語音質量的PESQ得分。
文檔編號H04M3/22GK1691710SQ20041003880
公開日2005年11月2日申請日期2004年4月30日優先權日2004年4月30日
發明者宋永剛申請人:華為技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

端到端語音質量自動測試系統及其方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法