一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法
2023-05-13 16:47:16 2
專利名稱:一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法
技術領域:
本發明涉及一種實現按短消息頻次與內容識別垃圾簡訊用戶的方法,尤其涉及一 種當號碼發送內容符合關鍵字規則,並且號碼發送符合規則的簡訊數量超過事先設定的閾 值時,列為垃圾簡訊號碼的方法。
背景技術:
簡訊息服務作為移動通信網絡的一種基本業務,在為用戶提供便捷消息通信服務 的同時,也為信息垃圾的傳播提供了渠道。而垃圾簡訊息有著愈演愈烈的趨勢,垃圾簡訊不 但帶來用戶投訴的不良影響,還存在惡意欠費問題,因此需要對垃圾簡訊進行實時監控攔 截。垃圾簡訊的發送特徵有1、發送頻次比較高,2、內容重複,多為詐騙或者廣告,符 合關鍵字特徵。現有方法單純從垃圾簡訊的頻次角度,能夠及時發現垃圾簡訊號碼。但是只是通 過頻次統計攔截,易造成誤攔率太大。只通過關鍵字攔截,容易造成誤攔。
發明內容
本發明的目的在於克服現有技術的缺陷而提供一種分析簡訊消息頻次與內容識 別垃圾短消息用戶的方法,該方法根據垃圾簡訊的發送特徵,即正常號碼不會大量發送違 反關鍵字規則的內容,採用分析簡訊消息頻次與內容相結合識別垃圾短消息用戶的方法, 並列入垃圾簡訊號碼,限制此號碼發送簡訊,該方法是一種有效的攔截垃圾簡訊的方法。實現上述目的的技術方案是一種分析簡訊消息頻次與內容識別垃圾短消息用戶 的方法,設定某關鍵字的判定為垃圾簡訊號碼的頻次;在設定的時間範圍內,記錄主叫號碼發送內容違反關鍵字的簡訊;當設定的時間範圍內的主叫號碼發送的違反關鍵字的簡訊數量超出閾值時,認為 此主叫號碼是垃圾簡訊號碼;當未達到頻次時,繼續監控,當號碼違反指定關鍵字的頻次超出設定的頻次,則判 定為垃圾簡訊號碼。上述的分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,其中,它包括以下 步驟首先,記錄主叫號碼發送違反關鍵字的簡訊的時間,檢查主叫號碼發送的每一條 違反關鍵字的簡訊是否達到了指定時間段內的流量閾值,根據不同的狀態作相應的處理;若不違反關鍵字規則,則不列入監控;若違反關鍵字規則但不超過流量閾值,則清除此主叫號碼的過期簡訊,保留指定 時間段內的簡訊,記錄每條簡訊的時間,繼續監控;若違反關鍵字規則且超出流量閾值,則清除此主叫號碼的過期簡訊,保留指定時間段內的簡訊,記錄每條簡訊的時間,列入垃圾簡訊號碼中作為垃圾簡訊號碼。上述的分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,其中,還包括設定某關鍵字的頻次,當號碼違反指定關鍵字的頻次超出設定的關鍵字的頻次, 則判定為垃圾簡訊號碼。本發明的有益效果是本發明通過分析簡訊消息頻次與內容識別垃圾短消息用戶 的方法,當號碼的發送的簡訊內容違反關鍵字並且超出流量設定的閾值時,才列入垃圾短 信號碼,排除正常簡訊號碼簡訊偶爾違反關鍵字的情況,減少垃圾簡訊攔截誤攔率。
圖1是本發明的分析簡訊消息頻次與內容識別垃圾短消息用戶的方法的一實施 例的流程圖;圖2是本發明的一實施例的按照主叫和關鍵字的統計隊列的示意圖。
具體實施例方式一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,實現方法為設定某 關鍵字的判定為垃圾簡訊號碼的頻次;在設定的時間範圍內,記錄主叫號碼發送內容違反 關鍵字的簡訊;當設定的時間範圍內的主叫號碼發送的違反關鍵字的簡訊數量超出閾值 時,認為此主叫號碼是垃圾簡訊號碼;當未達到頻次時,繼續監控,當號碼違反指定關鍵字 的頻次超出設定的頻次,則判定為垃圾簡訊號碼。該方法包括以下步驟首先,記錄主叫號碼發送違反關鍵字的簡訊的時間,檢查主叫號碼發送的每一條 違反關鍵字的簡訊是否達到了指定時間段內的流量閾值,根據不同的狀態作相應的處理;若不違反關鍵字規則,則不列入監控;若違反關鍵字規則但不超過流量閾值,則清除此主叫號碼的過期簡訊,保留指定 時間段內的簡訊,記錄每條簡訊的時間,繼續監控;若違反關鍵字規則且超出流量閾值,則清除此主叫號碼的過期簡訊,保留指定時 間段內的簡訊,記錄每條簡訊的時間,列入垃圾簡訊號碼中作為垃圾簡訊號碼;設定某關鍵字的頻次,當號碼違反指定關鍵字的頻次超出設定的關鍵字的頻次, 則判定為垃圾簡訊號碼。下面將結合一實施例對本發明作進一步說明。請參閱圖1,該實施例中包括以下步驟步驟Si,接受簡訊步驟;步驟S2,判斷接受到的簡訊是否違反關鍵字規則,若是,則進入步驟S3;若不是,則返回步驟Si;步驟S3,存入簡訊隊列步驟,即存入按照主叫號碼和關鍵字的簡訊隊列中;步驟S4,判斷該主叫號碼是否超出該關鍵字的流量閾值,若是,則進入步驟S5;若不是,則返回步驟Si;
步驟S5,確認步驟,即確認該主叫號碼為垃圾簡訊號碼。請參閱圖2,圖2是步驟S 3中的按照主叫號碼和關鍵字的簡訊隊列示意圖。綜上所述,本發明是一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法, 它以違反關鍵字和頻次聯合計算。根據監控時段內違反關鍵字的簡訊的頻率,對超出設定 閾值的號碼,列入垃圾簡訊號碼;在監控時段時,對主叫號碼按照內容違反關鍵字的簡訊統 計頻次,超頻後進入垃圾簡訊號碼。採用了該方法,當違反關鍵字的號碼流量超頻時,減少 了錯誤的把正常號碼列入垃圾簡訊號碼。對於簡訊優化系統採用了這種方法,能夠減少了垃圾簡訊的誤攔率,提高了垃圾 簡訊識別的命中度。以上結合附圖實施例對本發明進行了詳細說明,本領域中普通技術人員可根據上 述說明對本發明做出種種變化例。因而,實施例中的某些細節不應構成對本發明的限定,本 發明將以所附權利要求書界定的範圍作為本發明的保護範圍。
權利要求
1.一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,其特徵在於,設定某關鍵字的判定為垃圾簡訊號碼的頻次;在設定的時間範圍內,記錄主叫號碼發送內容違反關鍵字的簡訊;當設定的時間範圍內的主叫號碼發送的違反關鍵字的簡訊數量超出閾值時,認為此主 叫號碼是垃圾簡訊號碼;當未達到頻次時,繼續監控,當號碼違反指定關鍵字的頻次超出設定的頻次,則判定為 垃圾簡訊號碼。
2.根據權利要求1所述的分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,其特 徵在於,它包括以下步驟首先,記錄主叫號碼發送違反關鍵字的簡訊的時間,檢查主叫號碼發送的每一條違反 關鍵字的簡訊是否達到了指定時間段內的流量閾值,根據不同的狀態作相應的處理;若不違反關鍵字規則,則不列入監控;若違反關鍵字規則但不超過流量閾值,則清除此主叫號碼的過期簡訊,保留指定時間 段內的簡訊,記錄每條簡訊的時間,繼續監控;若違反關鍵字規則且超出流量閾值,則清除此主叫號碼的過期簡訊,保留指定時間段 內的簡訊,記錄每條簡訊的時間,列入垃圾簡訊號碼中作為垃圾簡訊號碼。
3.根據權利要求2所述的分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,其特 徵在於,還包括設定某關鍵字的頻次,當號碼違反指定關鍵字的頻次超出設定的關鍵字的頻次,則判 定為垃圾簡訊號碼。
全文摘要
本發明一種分析簡訊消息頻次與內容識別垃圾短消息用戶的方法,它包括設定某關鍵字的頻次;在設定的時間範圍內,記錄號碼發送內容違反關鍵字的簡訊;當設定的時間範圍內的號碼發送的違反關鍵字的簡訊數量超出閾值時,認為此主叫號碼是垃圾簡訊號碼;當未達到頻次時,繼續監控,當號碼違反指定關鍵字的頻次超出設定的頻次,則判定為垃圾簡訊號碼。本發明的方法根據垃圾簡訊的發送特徵,即正常號碼不會大量發送違反關鍵字規則的內容,採用分析簡訊消息頻次與內容相結合識別垃圾短消息用戶的方法,並列入垃圾簡訊號碼,限制此號碼發送簡訊,該方法是一種有效的攔截垃圾簡訊的方法。
文檔編號H04W12/00GK102111723SQ20091020065
公開日2011年6月29日 申請日期2009年12月24日 優先權日2009年12月24日
發明者肖克華 申請人:上海粱江通信系統股份有限公司