一種用於電話外撥系統的呼叫進程分析方法和設備的製作方法

2023-05-17 06:26:31 2

專利名稱：一種用於電話外撥系統的呼叫進程分析方法和設備的製作方法
技術領域：
本發明涉及電話外撥技術領域以及語音識別領域，尤其涉及一種用於電話外撥系統的呼叫進程分析方法和設備。
背景技術：
電話外撥是指撥打電話，並識別被叫方的呼叫狀態，根據呼叫狀態進行後續處理的操作。所述呼叫狀態包括但不限於對方接通、空號、被叫用戶關機、被叫不在服務區、被叫停機、有呼叫等待功能被叫忙、無呼叫等待功能被叫忙、中繼忙/網絡忙、被叫用戶設置了呼入限制、其它運營商方向線路故障、被叫久叫不應等。電話外撥系統是指計算機自動撥打電話，並自動判斷呼叫狀態，根據呼叫狀態進行後續處理的系統，根據後續處理的類型，分成自動外撥和預測式外撥兩種類型。電話外撥系統被廣泛應用於市場營銷、商務辦公、金融服務、售前售後服務、社會信息調查等方面。電話外撥方案的核心，是準確識別出被叫方的呼叫狀態，該過程被稱為呼叫進程分析。在現有技術中，電話外撥系統最常用的電信線路為綜合業務數字網(ISDN， Integrated Services Digital Network)線路。ISDN線路上的信息分成兩類，一類是帶外信息，S卩ISDN信令，一類是帶內信息，即人可以聽到的音頻。傳統的基於ISDN線路的呼叫進程分析檢測方法包括以下三種信令檢測方法、標準信息音檢測方法和人聲檢測方法。信令檢測方法就是根據ISDN所接收的ISDN信令判斷被叫方的呼叫狀態。標準信息音檢測方法就是通過檢測標準信息音來判斷被叫方的呼叫狀態。標準信息音是帶內信息的一種，由單一頻率的、有佔空比的聲音信號組成。常用的標準信息音包括回鈴音和忙音。回鈴音和忙音都是具有特定頻譜特徵的聲音信號。圖1所示為回鈴音的波形示意圖，採用頻率為450士25Hz的交流電源，發送電平為-10士3dBm，它是k 斷續的信號音，即Is送，如斷。圖2所示為忙音的波形示意圖，採用頻率為450士25Hz的交流電源，發送電平為-10士3dBm，它是0. 7斷續的信號音，即0. 35送，0. 35斷。標準信息音的檢測原則一般為檢測到回鈴音，回鈴音消失，則認為對方接通；檢測到忙音，則認為對方沒有接通。人聲檢測方法就是檢測ISDN線路接收的帶內信息是否符合人聲的頻譜特徵來判斷其是否為人聲。該方法可以區分出聲音信號不是標準信息音，但對於區分此聲音是用戶說話聲，還是彩鈴或錄音通知的準確率非常低。在實際應用中，可以將三種方法綜合使用，以提高檢測準確率。以下針對多種呼叫進程的情況進行具體分析。對於被叫方應答的情況，在呼叫端收到的信號序列依次為回鈴信令、回鈴音或彩鈴、接通信令和人聲。採用標準信息音檢測方式，如果收到的是彩鈴而不是回鈴音，則無法檢測到對方回鈴，如果採用人聲檢測方式，在收到彩鈴時就會判定為對方應答，以致出現誤判。對於空號、被叫用戶關機、被叫停機、有呼叫等待功能被叫忙、無呼叫等待功能被叫忙、中繼忙/網絡忙、被叫用戶設置了呼入限制、其它運營商方向線路故障的情況，在呼叫端收到的信號序列依次為錄音通知(持續約10秒，內容為例如「您好！您所撥打的號碼是空號，請核對後再撥」、「您好！您所撥打的電話已關機」、「對不起！您撥打的用戶暫時無法接通，請稍後再撥」、「對不起！您撥打的電話已停機」等)、忙音(持續約20秒)、用戶請求拆線的信令。通過信令檢測方法可以檢測沒有接通，但是有較大的延遲，將近30秒(錄音通知10秒，忙音20秒)，並且無法從用戶請求拆線信息中獲取具體的呼叫狀態；通過標準信息音檢測方法，可以檢測沒有接通，但是有較大的延遲，將近10秒，並且無法從用戶請求拆線信息中獲取具體的呼叫狀態；通過真人聲檢測方法，會將錄音通知誤判為真人接通，也無法獲取具體的呼叫狀態。對於尋呼被叫不成功的情況，在呼叫端收到的信號序列依次為靜音(持續約15 秒)、錄音通知(持續約10秒，內容為「對不起，您撥打的電話暫時無人接聽，請稍後再撥」)、忙音(持續約20秒)、用戶請求拆線的信令。通過信令檢測方法，可以檢測沒有接通，但是有較大的延遲，約45秒(15+10+20)，並且無法獲取對方不在服務區的呼叫狀態；通過標準信息音檢測方法，可以檢測沒有接通，但是有較大的延遲，將近25秒，並且無法獲取對方不在服務區；通過真人聲檢測方法，會將錄音通知誤判為真人接通，並且無法獲取對方不在服務區。如果是尋呼被叫成功，但被叫方久不應答的情況，在呼叫端收到的信號序列依次為回鈴音或彩鈴、錄音通知(持續約10秒，內容為「對不起，您撥打的電話暫時無人接聽，請稍後再撥」)、忙音(持續約20秒)、用戶請求拆線的信令。通過信令檢測方法可以檢測沒有接通，但是有較大的延遲，將近30秒(錄音通知10秒，忙音20秒)，並且無法獲取對方是久叫不應；通過標準信息音檢測方法，可以檢測沒有接通，但是有較大的延遲，將近10 秒，並且無法獲取對方是久叫不應；通過真人聲檢測方法，會將錄音通知誤判為真人接通，並且無法獲取對方是久叫不應。從以上分析可以看出，即使將上述三種方法混合使用，仍然會產生檢測錯誤、檢測延遲太大和無法獲知被叫方準確的狀態等問題。

發明內容
本發明提供了用於電話外撥系統的呼叫進程分析方法和裝置，可以提高被叫方狀態的檢測正確率，獲取呼叫的準確狀態，縮短檢測延遲。本發明實施例提出一種用於電話外撥系統的呼叫進程分析方法，包括如下步驟A、電話外撥系統撥打狀態已知的被叫方號碼，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形關鍵詞語音幀特徵序列模板；B、電話外撥系統撥打被叫方號碼，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；C、利用關鍵詞語音幀特徵序列模板，對目標語音幀特徵序列進行識別。較佳地，步驟A和/或步驟B所述從呼叫線路中提取來自被叫方的語音包括語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機從呼叫線路中提取音頻數據，並對所提取的音頻數據進行線性化處理。較佳地，步驟A所述選取包含關鍵詞的源語音樣本進行特徵提取形成幀特徵序列，將所述幀特徵序列存儲為關鍵詞語音幀特徵序列模板包括Al、對每一份包含關鍵詞的源語音樣本進行分幀加窗處理，得到源語音幀；A2、使用幀過零率或短時能量特徵對所述源語音幀進行靜音判定，對於每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識；A3、對每一個源語音幀的靜音標識進行識別，若靜音標識指示源語音幀為非靜音幀，根據該源語音幀的語音線性猜測模型計算語音特徵的倒譜係數；A4、依次存儲每一個源語音幀的靜音標識以及倒譜係數形成分幀語音倒譜係數序列；將所述分幀語音倒譜係數序列作為關鍵詞語音幀特徵序列模板。較佳地，步驟B所述對目標語音樣本進行特徵提取，形成目標語音幀特徵序列包括Bi、對每一份目標語音樣本進行分幀加窗處理，得到目標語音幀；B2、使用幀過零率或短時能量特徵對所述目標語音幀進行靜音判定，對於每一個目標語音幀，生成用於指示該目標語音幀是否為靜音幀的靜音標識；B3、對每一個目標語音幀的靜音標識進行識別，若靜音標識指示目標語音幀為非靜音幀，根據該目標語音幀的語音線性猜測模型計算語音特徵的倒譜係數；B4、將目標語音幀的靜音標識以及倒譜係數按照順序排列，形成分幀語音倒譜係數序列；將所述分幀語音倒譜係數序列作為目標語音幀特徵序列。較佳地，所述步驟Al進一步包括對源語音樣本進行預加重處理。較佳地，所述關鍵詞包括是空號、已關機、無法接通、正在通話中、無法接通、呼入限制、無需加零、網絡暫時無法接通、暫時無人接聽或以上關鍵詞的任意組合。較佳地，所述步驟C包括Cl、將目標語音幀特徵序列分別對每一個關鍵詞語音幀特徵序列模板進行匹配，計算出與每一個關鍵詞語音幀特徵序列模板對應的匹配誤差；C2、將所有關鍵詞語音幀特徵序列模板對應的匹配誤差進行比較，找出其中最小的匹配誤差；C3、判斷所述最小的匹配誤差是否小於預先設定的誤差門限，若是，認為目標語音包含該最小的匹配誤差對應的關鍵詞語音幀特徵序列模板所對應的關鍵詞，否則，認為語音不包含關鍵詞。較佳地，步驟Cl中對一個關鍵詞語音幀特徵序列模板進行匹配，計算出與該關鍵詞語音幀特徵序列模板對應的匹配誤差包括設目標語音幀特徵序列中的一個幀Fl與關鍵詞語音幀特徵序列模板的一個幀F2 之間的歐拉距離的表達式為Df(F\, F2)=如、-βι)2+(α2-β2)2- + {ακ 一凡)2 ；其中，α」 α2··· α κ 為所述幀
Fl的倒譜係數，β β 2. . . β κ為所述幀F2的倒譜係數；設目標語音幀特徵序列共包括M個語音幀，分別為FDpFD1. . . FDsh，而關鍵詞語音幀特徵序列模板包括N個語音幀分別為FI；、FT1. . . FTim，其中M > N，目標語音幀特徵序列中進行匹配的起始幀號為s ；計算關鍵詞語音幀特徵序列模板與目標語音中從幀s到幀s+Ν-Ι的平均歐拉距離平均歐拉距離DTs
DTs = [Df (FDs+0, FT0) +Df (FDS+1，FT1) +··· +Df (FDs^1, FV1) ] /N ；將所述起始幀號s從0遍歷到M-N+1，計算所有的平均歐拉距離DI；、 DT1. · · · DTm—N+i 『在所述平均歐拉距離DTr DT1. . . . DTm_n+1中找到一個最小值，作為該關鍵詞語音幀特徵序列模板的匹配誤差。本發明實施例還提出一種用於電話外撥系統的呼叫進程分析裝置，包括源語音幀特徵序列提取模塊，用於在電話外撥系統撥打狀態已知的被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形成關鍵詞語音幀特徵序列模板；目標語音特徵提取模塊，用於在電話外撥系統撥打被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；特徵識別模塊，用於利用所述特徵模塊建立的關鍵詞語音幀特徵序列模板，對信號提取模塊所提取的目標語音幀特徵序列進行識別。較佳地，所述源語音幀特徵序列提取模塊包括第一音頻數據提取單元，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP 交換機中提取音頻數據並輸出所述音頻數據；第一線性化處理單元，用於對第一音頻數據提取單元所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據；關鍵詞選擇單元，用於從第一線性化處理單元輸出的音頻數據中截取包含關鍵詞的音頻片段作為源語音樣本；第一加窗處理單元，用於對每一份包含關鍵詞的源語音樣本進行分幀加窗處理，得到源語音幀並輸出；第一靜音判定單元，用於使用幀過零率與短時能量特徵對所述源語音幀進行靜音判定，對於加窗處理單元輸出的每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識；第一計算單元，用於對每一個源語音幀的靜音標識進行識別，若靜音標識指示源語音幀為非靜音幀，根據該源語音幀的語音線性猜測模型計算語音特徵的倒譜係數；存儲單元，用於依次存儲每一個源語音幀的靜音標識以及倒譜係數形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列即為關鍵詞語音幀特徵序列模板。較佳地，所述目標語音特徵提取模塊包括第二音頻數據提取單元，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP 交換機中提取音頻數據並輸出所述音頻數據；第二線性化處理單元，用於對音頻數據提取單元所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據作為目標語音樣本；第二加窗處理單元，用於對每一份目標語音樣本進行分幀加窗處理，得到並輸出目標語音幀；第二靜音判定單元，用於使用幀過零率與短時能量特徵對所述目標語音幀進行靜音判定，對於每一個目標語音幀，生成用於指示該目標語音幀是否為靜音幀的靜音標識；
第二計算單元，用於對每一個目標語音幀的靜音標識進行識別，若靜音標識指示目標語音幀為非靜音幀，根據該目標語音幀的語音線性猜測模型計算語音特徵的倒譜係數；特徵序列單元，用於將目標語音幀的靜音標識以及倒譜係數按照順序排列，形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列作為目標語音幀特徵序列。較佳地，所述特徵識別模塊包括匹配單元，用於將目標語音幀特徵序列分別對每一個關鍵詞語音幀特徵序列模板進行匹配，計算出與該關鍵詞語音幀特徵序列模板對應的匹配誤差；比較單元，用於將所有匹配誤差進行比較，找出其中最小的匹配誤差並輸出至判斷單元；以及判斷單元，用於判斷來自所述比較單元的匹配誤差是否小於預先設定的誤差門限，若是，判斷結果為目標語音包含該關鍵詞語音幀特徵序列模板對應的關鍵詞，否則，判斷結果為語音不包含關鍵詞，並輸出該判斷結果。從以上技術方案可以看出，在電話外撥系統撥打被叫號碼時，提取來自被叫方的信號，根據預先建立錄音通知包含的關鍵詞的特徵模板對該信號進行識別。該技術方案具有如下有益效果1、檢測時間短，在接收到關鍵詞30毫秒內，即可檢測完成；2、檢測信息全面，不但通過信令可以檢測對方接通，還可以檢測出空號、被叫用戶關機、被叫不在服務區、被叫停機、有呼叫等待功能被叫忙、無呼叫等待功能被叫忙、中繼忙 /網絡忙、被叫用戶設置了呼入限制、GSM手機撥GSM手機加〃 0〃、固定網撥本地GSM手機加"0"、撥號未加長途區號、其它運營商方向線路故障、被叫久叫不應等信息；3、誤判率低不會將彩鈴或錄音通知誤判為對方應答，不會因為彩鈴誤判為沒有回鈴。

圖1為回鈴音的波形示意圖；圖2為忙音的波形示意圖；圖3為本發明實施例提出的呼叫進程分析的流程示意圖；圖4為本發明實施例提出的用於電話外撥系統的呼叫進程分析裝置的結構框圖；圖5為圖4中的源語音幀特徵序列提取模塊401的內部結構圖；圖6為圖4中的目標語音特徵提取模塊402的內部結構圖；圖7為圖4中的特徵識別模塊的內部結構圖。
具體實施例方式本發明實施例提出的用於電話外撥系統的呼叫進程分析方法，其關鍵技術特徵為對被叫方的信號進行關鍵詞語音識別，以解決檢測錯誤、檢測延遲太大和無法獲知被叫方準確的狀態等問題。圖3所示為本發明實施例提出的呼叫進程分析的流程示意圖，包括如下步驟步驟301 建立關鍵詞語音幀特徵序列模板。
建立關鍵詞語音幀特徵序列模板的流程包括如下步驟步驟301a 建立關鍵詞字典，所述關鍵詞包含但不限於「是空號」、「已關機」、「無法接通」、「正在通話中」、「無法接通」、「呼入限制」、「無需加零」、「網絡暫時無法接通」、「暫時無人接聽」等；步驟301b 電話外撥系統撥打狀態已知的被叫方號碼，從呼叫線路中提取來自被叫方的語音作為源語音樣本。目前有大量的設備可以提取音頻數據和信令，形成音頻數據流，包括語音板卡、 ISDN到H. 323或SIP語音的網關、IP交換機等。通過這些設備可以直接從呼叫線路中提取音頻數據，數據編碼格式常用的是G. 711 A Law，將其線性化處理後即可進行語音識別處理。步驟301c 選取包含關鍵詞的源語音樣本進行特徵提取形成關鍵詞語音幀特徵序列模板。步驟如下步驟301C-1 對源語音樣本進行預加重處理，該步驟為可選步驟，其目的是提升高頻部分，使信號的頻譜變得平坦，保證語音特徵明顯，減少噪聲對頻譜分析的影響。步驟301c-2 對每一份目標語音樣本進行分幀加窗處理，得到目標語音幀，該步驟的目的是保證分幀語音的短時平穩性；步驟301C-3 使用幀過零率或短時能量特徵對所述源語音幀進行靜音判定，對於每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識。使用幀過零率的判定方法如下設置採樣值門限G和過零率門限為R，過零率=幀中採樣值超過G的數量/N。當過零率 N，起始幀為S。計算關鍵詞語音幀特徵序列模板與目標語音中從幀s到幀s+Ν-Ι的平均歐拉距離 DTs:DTs = [Df(FDs+0, FT0)+Df (FDS+1, FT1)+···+Df (FDs^1, FV1) ]/N3、將所述起始幀號 s 從0遍歷到M-N+1，計算所有的平均歐拉距離DTpDT1. . . . DTM_N+14、在所述平均歐拉距離DT。、 DT1. . . . DTm_n+1中找到一個最小值，作為該關鍵詞語音幀特徵序列模板的匹配誤差步驟305-2 將所有匹配誤差進行比較，找出其中最小的匹配誤差，作為關鍵詞語音幀特徵序列模板的匹配誤差；步驟305-3 判斷所述最小的匹配誤差是否小於預先設定的誤差門限，若是，認為目標語音包含該關鍵詞語音幀特徵序列模板對應的關鍵詞，否則，認為語音不包含關鍵詞。本發明實施例還提出一種用於電話外撥系統的呼叫進程分析裝置，其結構框圖如圖4所示，該呼叫進程分析裝置400包括源語音幀特徵序列提取模塊401，用於在電話外撥系統撥打狀態已知的被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形成關鍵詞語音幀特徵序列模板；目標語音特徵提取模塊402，用於在電話外撥系統撥打被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；特徵識別模塊403，用於利用所述特徵模塊建立的關鍵詞語音幀特徵序列模板，對信號提取模塊所提取的目標語音幀特徵序列進行識別。較佳地，所述源語音幀特徵序列提取模塊401的內部結構如圖5所示，包括第一音頻數據提取單元501，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機中提取音頻數據並輸出所述音頻數據；第一線性化處理單元502，用於對第一音頻數據提取單元所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據；關鍵詞選擇單元503，用於從第一線性化處理單元502輸出的音頻數據中截取包含關鍵詞的音頻片段作為源語音樣本；第一加窗處理單元504，用於對每一份包含關鍵詞的源語音樣本進行分幀加窗處理，得到源語音幀並輸出；第一靜音判定單元505，用於使用幀過零率與短時能量特徵對所述源語音幀進行靜音判定，對於加窗處理單元輸出的每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識；第一計算單元506，用於對每一個源語音幀的靜音標識進行識別，若靜音標識指示源語音幀為非靜音幀，根據該源語音幀的語音線性猜測模型計算語音特徵的倒譜係數；存儲單元507，用於依次存儲每一個源語音幀的靜音標識以及倒譜係數形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列即為關鍵詞語音幀特徵序列模板。較佳地，所述目標語音特徵提取模塊402的內部結構如圖6所示，包括第二音頻數據提取單元601，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機中提取音頻數據並輸出所述音頻數據；第二線性化處理單元602，用於對音頻數據提取單元601所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據作為目標語音樣本；第二加窗處理單元603，用於對每一份目標語音樣本進行分幀加窗處理，得到並輸出目標語音幀；第二靜音判定單元604，用於使用幀過零率與短時能量特徵對所述目標語音幀進行靜音判定，對於每一個目標語音幀，生成用於指示該目標語音幀是否為靜音幀的靜音標識；第二計算單元605，用於對每一個目標語音幀的靜音標識進行識別，若靜音標識指示目標語音幀為非靜音幀，根據該目標語音幀的語音線性猜測模型計算語音特徵的倒譜係數；特徵序列單元606，用於將目標語音幀的靜音標識以及倒譜係數按照順序排列，形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列作為目標語音幀特徵序列輸出。較佳地，所述特徵識別模塊的內部結構如圖7所示，包括匹配單元701，用於將目標語音幀特徵序列分別對每一個關鍵詞語音幀特徵序列模板進行匹配，計算出與該關鍵詞語音幀特徵序列模板對應的匹配誤差；比較單元702，用於將所有匹配誤差進行比較，找出其中最小的匹配誤差並輸出至判斷單元；以及判斷單元703，用於判斷來自所述比較單元的匹配誤差是否小於預先設定的誤差門限，若是，判斷結果為目標語音包含該關鍵詞語音幀特徵序列模板對應的關鍵詞，否則，判斷結果為語音不包含關鍵詞，並輸出該判斷結果。本發明實施例的技術方案具有以下有益效果1、檢測時間短，在接收到關鍵詞30毫秒內，即可檢測完成，例如，在聽到「是空號」的聲音30毫秒後，即可判定對方是空號；2、檢測信息全面，不但通過信令可以檢測對方接通，還可以檢測出空號、被叫用戶關機、被叫不在服務區、被叫停機、有呼叫等待功能被叫忙、無呼叫等待功能被叫忙、中繼忙 /網絡忙、被叫用戶設置了呼入限制、GSM手機撥GSM手機加〃 0〃、固定網撥本地GSM手機加"0"、撥號未加長途區號、其它運營商方向線路故障、被叫久叫不應等信息；3、誤判率低不會將彩鈴或錄音通知誤判為對方應答，不會因為彩鈴誤判為沒有回鈴。利用本發明實施例提出的呼叫進程分析方案，可以極大提高自動外撥的速度和效率。具體分析如下在實際使用中，電話外撥系統經常利用外撥資源同時發起上百個外撥任務，而且對於呼叫沒有接通的電話需要重新呼叫。一方面，利用本發明實施例提出的呼叫進程分析方案快速檢測呼叫狀態，可以減少外撥資源佔用，提高外撥效率；另一方面，通過制定策略，可以減少無效外撥對外撥資源的佔用，並提高接通率，具體策略如下對於空號、被叫用戶設置了呼入限制等狀態的電話不再重複呼叫；對於被叫停機的狀態，選擇M小時後重複呼叫，避免資源佔用；對於被叫用戶關機的狀態，選擇延遲Ml小時後重複呼叫，例如，延遲5小時後呼叫；對於被叫不在服務區、被叫久叫不應的狀態，選擇延遲M2小時後重複呼叫；例如，所述M2 = 2。一般來說，M2應小於Ml。對於有呼叫等待功能被叫忙、無呼叫等待功能被叫忙、中繼忙/網絡忙、其它運營商方向線路故障的狀態，選擇M3小時後重複呼叫。例如，所述M3=l。一般來說，M3應小於M2。本發明實施例提出的準確的呼叫進程分析還可以用於提高預測式外撥的人員利用率。預測式外撥系統在自動外撥的基礎上，增加接通後轉接到人工的功能。首先，快速檢測呼叫狀態，可以減少人工等待，降低人力成本。其次，降低誤判，降低人工接聽沒有接通的電話帶來的人力浪費；最後，準確的呼叫進程分析提供的數據，可以大幅優化預測外撥的算法，提高坐席工作效率，降低騷擾率。以上所述僅為本發明的較佳實施例而已，並不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的範圍之內。
權利要求
1.一種用於電話外撥系統的呼叫進程分析方法，其特徵在於，包括如下步驟A、電話外撥系統撥打狀態已知的被叫方號碼，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形關鍵詞語音幀特徵序列模板；B、電話外撥系統撥打被叫方號碼，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；C、利用關鍵詞語音幀特徵序列模板，對目標語音幀特徵序列進行識別。
2.根據權利要求1所述的方法，其特徵在於，步驟A和/或步驟B所述從呼叫線路中提取來自被叫方的語音包括語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機從呼叫線路中提取音頻數據，並對所提取的音頻數據進行線性化處理。
3.根據權利要求1所述的方法，其特徵在於，步驟A所述選取包含關鍵詞的源語音樣本進行特徵提取形成幀特徵序列，將所述幀特徵序列存儲為關鍵詞語音幀特徵序列模板包括Al、對每一份包含關鍵詞的源語音樣本進行分幀加窗處理，得到源語音幀； A2、使用幀過零率或短時能量特徵對所述源語音幀進行靜音判定，對於每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識；A3、對每一個源語音幀的靜音標識進行識別，若靜音標識指示源語音幀為非靜音幀，根據該源語音幀的語音線性猜測模型計算語音特徵的倒譜係數；A4、依次存儲每一個源語音幀的靜音標識以及倒譜係數形成分幀語音倒譜係數序列；將所述分幀語音倒譜係數序列作為關鍵詞語音幀特徵序列模板。
4.根據權利要求1所述的方法，其特徵在於，步驟B所述對目標語音樣本進行特徵提取，形成目標語音幀特徵序列包括Bi、對每一份目標語音樣本進行分幀加窗處理，得到目標語音幀； B2、使用幀過零率或短時能量特徵對所述目標語音幀進行靜音判定，對於每一個目標語音幀，生成用於指示該目標語音幀是否為靜音幀的靜音標識；B3、對每一個目標語音幀的靜音標識進行識別，若靜音標識指示目標語音幀為非靜音幀，根據該目標語音幀的語音線性猜測模型計算語音特徵的倒譜係數；B4、將目標語音幀的靜音標識以及倒譜係數按照順序排列，形成分幀語音倒譜係數序列；將所述分幀語音倒譜係數序列作為目標語音幀特徵序列。
5.根據權利要求3所述的方法，其特徵在於，所述步驟Al進一步包括對源語音樣本進行預加重處理。
6.根據權利要求1所述的方法，其特徵在於，所述關鍵詞包括是空號、已關機、無法接通、正在通話中、無法接通、呼入限制、無需加零、網絡暫時無法接通、暫時無人接聽或以上關鍵詞的任意組合。
7.根據權利要求1至6任一項所述的方法，其特徵在於，所述步驟C包括Cl、將目標語音幀特徵序列分別對每一個關鍵詞語音幀特徵序列模板進行匹配，計算出與每一個關鍵詞語音幀特徵序列模板對應的匹配誤差；C2、將所有關鍵詞語音幀特徵序列模板對應的匹配誤差進行比較，找出其中最小的匹配誤差；C3、判斷所述最小的匹配誤差是否小於預先設定的誤差門限，若是，認為目標語音包含該最小的匹配誤差對應的關鍵詞語音幀特徵序列模板所對應的關鍵詞，否則，認為語音不包含關鍵詞。
8.根據權利要求7所述的方法，其特徵在於，步驟Cl中對一個關鍵詞語音幀特徵序列模板進行匹配，計算出與該關鍵詞語音幀特徵序列模板對應的匹配誤差包括設目標語音幀特徵序列中的一個幀Fl與關鍵詞語音幀特徵序列模板的一個幀F2之間的歐拉距離的表達式為Df(F\, F2) = -β])2+(α2-β2)2·'· + (ακ-βκ)2α」 α 2. . . α κ 為所述幀 Fl的倒譜係數，β β 2. . . β κ為所述幀F2的倒譜係數；設目標語音幀特徵序列共包括M個語音幀，分別為FDciJD1. . . FDsh，而關鍵詞語音幀特徵序列模板包括N個語音幀分別為FI；、FT1. . . FTim，其中M > N，目標語音幀特徵序列中進行匹配的起始幀號為s ；計算關鍵詞語音幀特徵序列模板與目標語音中從幀s到幀s+Ν-Ι的平均歐拉距離平均歐拉距離DTs DTs = [Df (FDs+0, FT0) +Df (FDS+1，FT1) +··· +Df (FDs^1, FTnJ ] /N ；將所述起始幀號s從0遍歷到M-N+1，計算所有的平均歐拉距離DI；、DT1. . . . DTm_n+1 ；在所述平均歐拉距離DI；、DT1. . . . DTm_n+1中找到一個最小值，作為該關鍵詞語音幀特徵序列模板的匹配誤差。
9.一種用於電話外撥系統的呼叫進程分析裝置，其特徵在於，包括源語音幀特徵序列提取模塊，用於在電話外撥系統撥打狀態已知的被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形成關鍵詞語音幀特徵序列模板；目標語音特徵提取模塊，用於在電話外撥系統撥打被叫方號碼時，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；特徵識別模塊，用於利用所述特徵模塊建立的關鍵詞語音幀特徵序列模板，對信號提取模塊所提取的目標語音幀特徵序列進行識別。
10.根據權利要求9所述的裝置，其特徵在於，所述源語音幀特徵序列提取模塊包括第一音頻數據提取單元，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機中提取音頻數據並輸出所述音頻數據；第一線性化處理單元，用於對第一音頻數據提取單元所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據；關鍵詞選擇單元，用於從第一線性化處理單元輸出的音頻數據中截取包含關鍵詞的音頻片段作為源語音樣本；第一加窗處理單元，用於對每一份包含關鍵詞的源語音樣本進行分幀加窗處理，得到源語音幀並輸出；第一靜音判定單元，用於使用幀過零率與短時能量特徵對所述源語音幀進行靜音判定，對於加窗處理單元輸出的每一個源語音幀，生成用於指示該源語音幀是否為靜音幀的靜音標識；第一計算單元，用於對每一個源語音幀的靜音標識進行識別，若靜音標識指示源語音幀為非靜音幀，根據該源語音幀的語音線性猜測模型計算語音特徵的倒譜係數；存儲單元，用於依次存儲每一個源語音幀的靜音標識以及倒譜係數形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列即為關鍵詞語音幀特徵序列模板。
11.根據權利要求9所述的裝置，其特徵在於，所述目標語音特徵提取模塊包括第二音頻數據提取單元，用於從語音板卡、ISDN到H. 323或SIP語音的網關、或IP交換機中提取音頻數據並輸出所述音頻數據；第二線性化處理單元，用於對音頻數據提取單元所提取的音頻數據進行線性化處理，並輸出線性化處理後的音頻數據作為目標語音樣本；第二加窗處理單元，用於對每一份目標語音樣本進行分幀加窗處理，得到並輸出目標語音幀；第二靜音判定單元，用於使用幀過零率與短時能量特徵對所述目標語音幀進行靜音判定，對於每一個目標語音幀，生成用於指示該目標語音幀是否為靜音幀的靜音標識；第二計算單元，用於對每一個目標語音幀的靜音標識進行識別，若靜音標識指示目標語音幀為非靜音幀，根據該目標語音幀的語音線性猜測模型計算語音特徵的倒譜係數；特徵序列單元，用於將目標語音幀的靜音標識以及倒譜係數按照順序排列，形成分幀語音倒譜係數序列；所述分幀語音倒譜係數序列作為目標語音幀特徵序列。
12.根據權利要求9至11任一項所述的方法，其特徵在於，所述特徵識別模塊包括匹配單元，用於將目標語音幀特徵序列分別對每一個關鍵詞語音幀特徵序列模板進行匹配，計算出與該關鍵詞語音幀特徵序列模板對應的匹配誤差；比較單元，用於將所有匹配誤差進行比較，找出其中最小的匹配誤差並輸出至判斷單元；以及判斷單元，用於判斷來自所述比較單元的匹配誤差是否小於預先設定的誤差門限，若是，判斷結果為目標語音包含該關鍵詞語音幀特徵序列模板對應的關鍵詞，否則，判斷結果為語音不包含關鍵詞，並輸出該判斷結果。
全文摘要
本發明提供了一種用於電話外撥系統的呼叫進程分析方法，包括如下步驟A、電話外撥系統撥打狀態已知的被叫方號碼，從呼叫線路中提取來自被叫方的語音作為源語音樣本，選取包含關鍵詞的源語音樣本進行特徵提取形關鍵詞語音幀特徵序列模板；B、電話外撥系統撥打被叫方號碼，從呼叫線路中提取來自被叫方的語音作為目標語音樣本，對目標語音樣本進行特徵提取，形成目標語音幀特徵序列；C、利用關鍵詞語音幀特徵序列模板，對目標語音幀特徵序列進行識別。本發明還提供了一種用於電話外撥系統的呼叫進程分析裝置。本發明方案可以提高被叫方狀態的檢測正確率，獲取呼叫的準確狀態，縮短檢測延遲。
文檔編號G10L15/06GK102404462SQ20101027700
公開日2012年4月4日申請日期2010年9月8日優先權日2010年9月8日
發明者黃河申請人:北京商路通信息技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種用於電話外撥系統的呼叫進程分析方法和設備的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法