一種語音監聽的自動識別方法及系統的製作方法
2023-06-08 10:54:41 2
專利名稱:一種語音監聽的自動識別方法及系統的製作方法
技術領域:
本發明涉及通信網絡警用監聽中心監聽領域,尤其涉及通信網絡的一種語音監聽的 自動識別方法及系統。
背景技術:
隨著國際政治形勢的發展,合法監聽中心越來越多地被各個國家的安全部門所重視, 成為保障國家安全,獲取必要的國家安全信息的一種對通信網絡進行監控和信息獲取的有效 手段。目前網絡上的語音監聽採用的方式基本上是先把監聽到的語音文件保存,再進行 事後回放。通常的語音監聽在短時間內,就會積累大量的語音文件,需要大量的存儲介 質存放,對一些敏感的語音信息需要監聽坐席的工作人員逐一回放才能識別。這樣花費 大量的人力物力,而且反映的速度非常慢,說話人識別的準確性只能靠人的聽力來保障。
發明內容
本發明所要解決的技術問題是,克服了現有技術識別的效率和準確度不高的缺陷。 為解決上述技術問題,本發明提出了一種語音監聽的自動識別方法,包括
步驟一、設置一說話人識別伺服器;
步驟二、獲取一批語音文件,根據所述語音文件生成相應的語音模型標示ID,將所 述語音模型標示ID保存在所述說話人識別伺服器; 步驟三、設置一批受控目標;
步驟四、所述受控目標發生呼叫,所述說話人識別伺服器接收一語音包,將所述語 音包的信息與所述語音模型標示ID—一進行比較,將識別結果發送出去。
進一步地,步驟四之後還包括所述說話人識別伺服器通過分發伺服器將所述識別 結果發給監控顯示裝置。
進一步地,所述步驟三還包括設置識別算法及設置識別閥值;
所述步驟四具體包括如下步驟
根據所述識別算法,將所述語音包的信息與所述語音模型標示ID —一進行比較, 得到第一組識別值;
在所述第一組識別值中,將高於所述識別閥值的識別值取出,作為第二組識別值; 將所述第二組識別值和其一一對應的語音模型標示ID—起作為識別結果發送出去。 進一步地,所述步驟二還包括建立事件組,將所述語音模型標示ID根據事件類別,存放在相應的事件組中;
所述步驟三還包括設置所述受控目標所屬的事件組;
在步驟四中,將所述語音包的信息與所述受控目標所屬事件組內的語音模型標示ID 一一進行比較,得到第一組識別值。
進一步地,所述將所述第二組識別值和其一一對應的語音模型標示ID—起作為識 別結果發送出去具體為
將所述第二組識別值和其一一對應的語音模型標示ID按照識別值的高低順序排列, 將排列後的識別值和語音模型標示ID作為識別結果發送出去。
進一步地,所述受控目標是指電話號碼或網絡IP位址。
另,本發明還提出了一種語音監聽的自動識別系統,包括一說話人識別伺服器,用 於存儲根據語音文件生成的語音模型標示ID,以及當受控目標呼叫時,接收一語音包, 將所述語音包的信息與所述語音模型標示ID—一進行比較,將識別結果發送出去。
進一步地,所述系統還包括分發伺服器和監控顯示裝置;其中,
所述分發伺服器,用於接收所述說話人識別伺服器發送的所述識別結果,然後將所 述識別結果發送給所述監控顯示裝置。
進一步地,所述監控顯示裝置包括,坐席、告警臺、手機中的至少一個。
與現有技術相比,本發明提供了一種語音監聽的自動識別方法及系統,解決了目前說話 人識別需要監聽坐席逐一回放才能識別的問題,大大提高了識別速度,有助於監聽中心及時 的發現說話人,為相關部門及時提供說話人的通話時間、通話時長以及通話內容等信息,而 無需大量的監聽坐席參與。這在很大程度上提高了語音監聽的準確性和效率,大大降低了人 力消耗。
圖1是本發明的結構示意圖。
圖2是本發明語音監聽的自動識別方法的流程圖。
具體實施例方式
下面結合附圖和具體實施例對技術方案的實施作進一步的詳細描述。 實施例一
以某個犯罪事件為例,說明從一批受控目標中自動識別嫌疑人,從而發現嫌疑人活
動內容及動向的方法,參考圖1及圖2: 一、準備工作-
(1)設置一說話人識別伺服器。(2) 通過坐席建立一個事件組。
(3) 通過合法偵緝手段獲取了這個事件組的一批可疑人員以及和這個事件組相關 的一些通訊手段,比如一批可疑電話號碼和這些可疑人員的一些語音文件,根據語音文 件生成語音模型標示ID。
如果取得同一說話人在多種網絡環境下的語音,可以把說話人的語音模型進行更
新,生成新的語音模型。
(4) 將所述語音模型標示ID保存在所述事件組中,將所述事件組及相應的語音模
型標示ID發送給說話人識別伺服器,說話人識別伺服器再將其發送給資料庫伺服器進 行保存。
(5) 設置受控目標的識別參數,將所述識別參數發送給分發伺服器。 設置受控目標的識別參數,具體包括 A:設置受控目標是否支持自動語音識別;
B:設置受控目標所屬的事件組;
C:設置識別閥值;
C:設定識別算法。
所述受控目標是指,電話號碼或網絡IP位址。
所述設定識別算法,指從效率優先算法和精度優先算法中選擇一種算法。效率優先 算法,指將收到的短時間(如20s)內的有效語音作為識別對象,以儘快進行識別。精 度優先算法,指將收到的較長時間(如30s)內的有效語音作為識別對象,儘可能多的 獲取受控目標的語音信息,以作為準確識別的基準。此處的20s、 30s有效語音參數是 在監控坐席上配置的。
二、呼叫開始
(6) 受控目標發生呼叫,網元將受控目標和對應的語音包通過分發伺服器發給文
件伺服器,同時發呼叫開始消息給監控顯示裝置,用以提示本次監聽開始。
(7) 所述文件伺服器接收受控目標和對應的語音包,根據所述識別參數,判斷所
述受控目標是否支持自動識別,是,發送所述語音包和所述識別參數給所述說話人識別 伺服器,不是,不發送;文件伺服器還對語音包進行錄音,存儲語音文件;分發伺服器 收到文件伺服器發送的文件路徑通知後,將語音包發給資料庫伺服器進行監聽詳單寫庫 操作。
(8) 說話人識別伺服器根據所述識別參數,將所述語音包信息與所述語音模型標 示ID—一進行比較,將識別結果發送出去。
比較步驟具體包括根據所述識別參數,査找到所述受控目標所屬事件組,將所述語音包信息與受控目 標所屬事件組的語音模型標示ID—一進行比較,得到第一組識別值;
在所述第一組識別值中,將高於所述識別閥值的識別值取出作為第二組識別值; 將所述第二組識別值和其一一對應的語音模型標示ID—起作為中間結果; 將中間結果按識別值的高低順序排列作為識別結果發送出去。
(9) 說話人識別伺服器發送識別結果給文件伺服器,文件伺服器停止向說話人識 別伺服器發送語音包,同時向分發伺服器發送識別結果。
(10) 分發伺服器根據受控目標的受控設置將識別結果發送給監控顯示裝置,同時 把識別結果寫入資料庫伺服器。
所述監控顯示裝置包括,坐席、告警臺、手機中的至少一個。 三、呼叫結束
(11) 受控目標呼叫結束,分發伺服器將呼叫結束消息發給文件伺服器,用以請求 停止錄音,同時發給監控顯示裝置,用以提示本次監聽結束,修改資料庫伺服器中本次 監聽的詳單。
所述監控顯示裝置包括,坐席、告警臺、手機中的至少一個,從坐席等界面上就能 査看到本次監聽的嫌疑人是那些,重要事件在監控顯示裝置上可以採用聲、光信息提示。
語音監聽的說話人自動識別方法就是在目前合法語音監聽的基礎上提供一項增值業務, 可以解決目前說話人識別需要坐席工作人員逐一回放才能識別的問題。大大提高了識別速 度,有助於監聽中心及時的發現說話人,為相關部門及時提供說話人的通話時間、通話時長 以及通話內容等信息,而無需大量的監聽坐席參與。這在很大程度上提高了語音監聽的準確 性和效率,大大降低了人力消耗。該方法對監聽中心的要求只需要增加說話人識別伺服器 及語音模型標示ID,就能實現語音監聽說話人的自動識別,利用較少的投資就可以實現,並 且有說話人特徵庫集中管理,語音監聽業務觸發靈活方便,業務邏輯關係便於控制、業務擴 展方便等優點。
監聽中心針對某個事件/案件發起一個監聽,比如,某個恐怖事件,國家安全部門通過 偵緝手段獲取一批嫌疑人以及和這個恐怖事件相關的一些通信手段,如一批可疑的電話號 碼,並且獲得了這些嫌疑人的一些語音片段文件,這樣只要嫌疑人進行語音通信時就能自動 觸發識別信息給坐席,或告警臺,很快就能定位到嫌疑人。從而保障了國家和人民的安全。
實施例二
一種語音監聽的自動識別系統,參考圖l,包括一說話人識別伺服器,用於存儲根 據語音文件生成的語音模型標示ID,以及當受控目標呼叫時,接收一語音包,將所述語音包的信息與所述語音模型標示ID—一進行比較,將識別結果發送出去。
所述系統還包括文件伺服器,用於存儲對受控目標設置的識別參數,以及接收一
受控目標對應的語音包,如果所述受控目標支持自動識別,發送所述語音包和所述識別
參數給所述說話人識別伺服器。
所述系統還包括分發伺服器和監控顯示裝置;其中,
所述分發伺服器,用於接收所述說話人識別伺服器經所述文件伺服器發送的所述識 別結果,然後將所述識別結果發送給所述監控顯示裝置。
所述監控顯示裝置包括,坐席、告警臺、手機中的至少一個。
通過以上方式,在監聽中心實現了語音監聽的說話人自動識別方法和系統。識別結 果可以在坐席的界面上顯示,也可以發往專用的告警臺,還可以以簡訊的形式發給監聽 事件的主要負責人。識別的結果同時存在監聽的詳單中,用於事後分析及某個說話人語 音模型的特徵再次更新。
權利要求
1、一種語音監聽的自動識別方法,其特徵在於,包括步驟一、設置一說話人識別伺服器;步驟二、獲取一批語音文件,根據所述語音文件生成相應的語音模型標示ID,將所述語音模型標示ID保存在所述說話人識別伺服器;步驟三、設置一批受控目標;步驟四、所述受控目標發生呼叫,所述說話人識別伺服器接收一語音包,將所述語音包的信息與所述語音模型標示ID一一進行比較,將識別結果發送出去。
2、 如權利要求1所述語音監聽的自動識別方法,其特徵在於,步驟四之後還包括 所述說話人識別伺服器通過分發伺服器將所述識別結果發給監控顯示裝置。
3、 如權利要求l所述語音監聽的自動識別方法,其特徵在於,所述步驟三還包括 設置識別算法及設置識別閥值;所述步驟四具體包括如下步驟根據所述識別算法,將所述語音包的信息與所述語音模型標示ID—一進行比較, 得到第一組識別值;在所述第一組識別值中,將高於所述識別閥值的識別值取出,作為第二組識別值; 將所述第二組識別值和其一一對應的語音模型標示ID—起作為識別結果發送出去。
4、 如權利要求3所述語音監聽的自動識別方法,其特徵在於,所述步驟二還包括建立事件組,將所述語音模型標示ID根據事件類別,存放在 相應的事件組中;所述步驟三還包括設置所述受控目標所屬的事件組;在步驟四中,將所述語音包的信息與所述受控目標所屬事件組內的語音模型標示ID 一一進行比較,得到第一組識別值。
5、 如權利要求3或4所述語音監聽的自動識別方法,其特徵在於,所述將所述第 二組識別值和其一一對應的語音模型標示ID—起作為識別結果發送出去具體為將所述第二組識別值和其一一對應的語音模型標示ID按照識別值的高低順序排列, 將排列後的識別值和語音模型標示ID作為識別結果發送出去。
6、 如權利要求1所述語音監聽的自動識別方法,其特徵在於,所述受控目標是指電話號碼或網絡IP位址。
7、 一種語音監聽的自動識別系統,其特徵在於,包括一說話人識別伺服器,用於 存儲根據語音文件生成的語音模型標示ID,以及當受控目標呼叫時,接收一語音包,將 所述語音包的信息與所述語音模型標示ID—一進行比較,將識別結果發送出去。
8、 如權利要求7所述語音監聽的自動識別系統,其特徵在於,所述系統還包括 分發伺服器和監控顯示裝置;其中,所述分發伺服器,用於接收所述說話人識別伺服器發送的所述識別結果,然後將所 述識別結果發送給所述監控顯示裝置。
9、 如權利要求8所述語音監聽的自動識別方法,其特徵在於,所述監控顯示裝置 包括,坐席、告警臺、手機中的至少一個。
全文摘要
本發明公開了一種語音監聽的自動識別方法及系統,該方法包括設置一說話人識別伺服器;獲取一批語音文件,根據所述語音文件生成相應的語音模型標示ID,將所述語音模型標示ID保存在所述說話人識別伺服器;設置一批受控目標;所述受控目標發生呼叫,所述說話人識別伺服器接收一語音包,將所述語音包的信息與所述語音模型標示ID一一進行比較,將識別結果發送出去。該系統包括一說話人識別伺服器,用於存儲根據語音文件生成的語音模型標示ID,以及當受控目標呼叫時,接收一語音包,將所述語音包的信息與所述語音模型標示ID一一進行比較,將識別結果發送出去。本發明克服了現有技術中語音識別效率和準確度不高的缺陷。
文檔編號H04W12/00GK101562014SQ20091010744
公開日2009年10月21日 申請日期2009年5月19日 優先權日2009年5月19日
發明者俊 劉, 曹明明, 李利君 申請人:中興通訊股份有限公司