新四季網

一種信息過濾的方法及裝置的製作方法

2023-08-07 07:57:56

專利名稱:一種信息過濾的方法及裝置的製作方法
技術領域:
本發明涉及網際網路技術,尤指一種信息過濾的方法及裝置。
背景技術:
在目前的聊天室廣告過濾方法中,通常採用的是關鍵字過濾的方法,對發送到聊天室的聊天信息進行過濾。關鍵字過濾的方法通過收集在廣告信息中經常出現的關鍵字語,針對發送到聊天室中的每一條聊天信息進行判斷,判斷聊天信息中是否存在收集的關鍵字,如果存在,則過濾掉該聊天信息,不發送至聊天室;如果不存在,則將該聊天信息發送至聊天室。
通常情況下,廣告信息發送者通過觀察、分析被過濾的廣告信息,對廣告信息的內容進行適當修改,則能夠比較容易繞過聊天室中根據關鍵字過濾廣告的方法。例如,通過將被過濾掉的「視頻聊天」改為「視屏聊天」,就可以比較容易的繞過關鍵字過濾方法。廣告信息發送者通過發送「視屏聊天」同樣能夠達到邀請聊天室中其他用戶「視頻聊天」的目的。
因此,通過關鍵字過濾的方法,並不能成功的阻止各種類型的廣告信息發送到聊天室,如垃圾廣告、色情廣告等,並且存在很大的漏判率和誤判率。

發明內容
有鑑於此,本發明的主要目的在於提供一種信息過濾的方法;同時,對應於本發明提供的方法,本發明還提供一種信息過濾的裝置。
為達到上述目的,本發明的技術方案是這樣實現的一種信息過濾的方法,設置垃圾聯繫方式資料庫,該方法包括以下步驟A、判斷待發送信息中是否攜帶聯繫方式,如果攜帶,則執行步驟B;否則,執行步驟D;B、提取所述待發送信息中攜帶的聯繫方式,判斷垃圾聯繫方式資料庫中是否存在相同的聯繫方式,如果存在,則執行步驟C;否則,執行步驟D;C、拒絕發送所述待發送信息;結束當前處理流程;D、發送所述待發送信息。
其中,所述設置垃圾聯繫方式資料庫為預先將各垃圾聯繫方式記錄於垃圾聯繫方式資料庫中。
優選的,設置出現閾值;在步驟B判斷得到垃圾聯繫方式資料庫中不存在與所述待發送信息相同的聯繫方式,進行下一步操作之前,該方法進一步包括BD1、將步驟B中提取的聯繫方式的出現次數上加1,並判斷所述聯繫方式的出現次數是否大於等於出現閾值,如果是,則將步驟B中提取的聯繫方式記錄至垃圾聯繫方式資料庫中,執行步驟C;否則,執行步驟D。
優選的,在步驟D之前,該方法進一步包括BD2、對所述待發送信息進行信息過濾,判斷是否為廣告信息,如果是,則執行步驟C;否則,執行步驟D。
同時作為本發明的一個優選實施方式,在步驟A之前,進一步包括a、對所述待發送信息進行信息過濾,判斷是否為廣告信息,如果是,則執行步驟b;否則,執行所述步驟A;b、提取所述待發送信息中的聯繫方法,將提取出的聯繫方式記錄至垃圾聯繫方式資料庫,執行步驟C。
優選的,設置出現閾值;在步驟B判斷得到垃圾聯繫方式資料庫中不存在與所述待發送信息相同的聯繫方式,進行下一步操作之前,該方法進一步包括BD2、將步驟B中提取的聯繫方式的出現次數上加1,並判斷所述聯繫方式的出現次數是否大於等於出現閾值,如果是,則將步驟B中提取的聯繫方式記錄至垃圾聯繫方式資料庫中,執行步驟C;否則,執行步驟D。
其中,使用正則表達式執行所述判斷的操作。
其中,使用特徵抽取技術提取待發送信息中的聯繫方式。
另外,本發明還提供了一種信息過濾的裝置,該裝置包括聯繫方式過濾單元和垃圾聯繫方式存儲單元;其中,聯繫方式過濾單元,用於判斷待發送信息中是否攜帶聯繫方式,發送沒有攜帶聯繫方式的待發送信息;提取待發送信息中的聯繫方式,並根據垃圾聯繫方式存儲單元中存儲的垃圾聯繫方式,判斷所述待發送信息中是否存在相同的聯繫方式,發送不存在相同聯繫方式的待發送信息,拒絕發送存在相同聯繫方式的待發送信息;垃圾聯繫方式存儲單元,用於存儲垃圾聯繫方式。
另外,該裝置進一步包括信息過濾單元;信息過濾單元與聯繫方式過濾單元相連;所述信息過濾單元位於聯繫方式過濾單元的輸入端,用於預先判斷待發送信息是否為廣告信息,發送不為廣告信息的待發送信息至聯繫方式過濾單元;拒絕發送為廣告信息的待發送信息,並指示聯繫方式過濾單元將該待發送信息中的聯繫方式記錄為垃圾聯繫方式;相應的,聯繫方式過濾單元,進一步用於根據信息過濾單元的指示,提取為廣告信息的待發送信息中的聯繫方式,並記錄至垃圾聯繫方式存儲單元;或,所述信息過濾單元位於聯繫方式過濾單元的輸出端,用於接收聯繫方式過濾單元發送的待發送信息,並判斷聯繫方式過濾單元發送來的待發送信息是否為廣告信息,發送不是廣告信息的待發送信息;拒絕發送是廣告信息的待發送信息。
其中,聯繫方式過濾單元,進一步用於記錄垃圾聯繫方式存儲單元中不存在的聯繫方式的出現次數,並在聯繫方式的出現次數大於等於出現閾值時,將該聯繫方式記錄至垃圾聯繫方式存儲單元。
本發明所提供的一種信息過濾的方法,通過設置垃圾聯繫方式資料庫,在發送待發送信息時,判斷待發送信息中是否存在聯繫方式,提取存在聯繫方式的待發送信息中的聯繫方式,並判斷提取出的聯繫方式是否存在與垃圾聯繫方式資料庫中,如果存在,則拒絕發送當前待發送信息;否則,發送當前待發送信息。另外,本發明還提供了一種信息過濾的裝置。本發明所提供的方法及裝置,由於利用廣告信息所必需傳達的、並且不會經常變更的聯繫方式對信息進行過濾,因此能夠成功並有效的過濾廣告信息,阻止廣告信息在聊天室中傳播、降低了廣告信息的漏判率和誤判率。


圖1為本發明實施例一方法的流程圖;圖2為本發明實施例一裝置的結構圖;圖3為本發明實施例二方法的流程圖;圖4為本發明實施例三方法的流程圖;圖5為本發明實施例三裝置的結構圖;圖6為本發明實施例四方法的流程圖;圖7為本發明實施例四裝置的結構圖;圖8為本發明實施例五方法的流程圖。
具體實施例方式
通過分析發送至聊天室的廣告信息的特徵,發現由於發送廣告信息的目的在於宣傳產品,因此廣告信息中均會攜帶聯繫方式,用於告知需要該產品的用戶如何獲得該產品。在廣告信息中通常攜帶的聯繫方式是某個網站的網址、電話號碼、電子郵箱等。
因此,在本發明中,將具有廣告特徵的聯繫方式稱為垃圾聯繫方式。具有廣告特徵的聯繫方式是指,出現在廣告信息中的聯繫和/或多次出現在聊天室中的聯繫方式。本發明通過判斷待發送信息中是否攜帶垃圾聯繫方式,來判斷待發送信息是否為廣告信息,進而拒絕發送攜帶垃圾聯繫方式的信息,來阻止廣告信息在聊天室中傳播。
為使本發明的目的、技術方案及優點更加清楚明白,以下參照附圖並舉實施例,對本發明做進一步的詳細說明。
實施例一實施例一方法的流程如圖1所示。在執行圖1所示的流程之前,需要設置垃圾聯繫方式資料庫,用來保存垃圾聯繫方式。垃圾聯繫方式資料庫中的垃圾聯繫方式可以是聊天室管理員通過觀察聊天室中發送的信息,預先配置到垃圾聯繫方式資料庫中,並且在聊天室不斷工作的過程中向垃圾聯繫方式資料庫中加入新的垃圾聯繫方式。
圖1所示的流程具體為步驟101聊天系統收到待發送到聊天室中的信息;在本發明中,將步驟101中所描述的信息稱為待發送信息。
步驟102聊天系統判斷當前收到的待發送信息中,是否攜帶聯繫方式,如果攜帶,則執行步驟103;否則,執行步驟106。
這裡,判斷待發送信息中是否攜帶聯繫方式,可以通過正則表達式的方式進行判斷。正則表達式是一種通過抽象的表達方式來幫助聊天系統從信息中提取出聯繫方式。例如,針對電話號碼可以用正則表達式來匹配連續的6個以上、12個以下的不包含間隔符的數字。這樣不管電話號碼是什麼,都可以提取出來。
步驟103聊天系統從待發送信息中提取攜帶的聯繫方式。
較佳的,聊天系統採用特徵抽取技術從待發送信息中提取攜帶的聯繫方式。
特徵抽取技術的目的是為了從表現形式不同的聯繫方式中提取真實的聯繫方式。例如,從1-2-3-4-5-6-7-8這樣的號碼形式中提取真實有效的電話號碼12345678。這種提取技術包括兩種除噪技術和轉換技術。除噪技術的主要目的是將在聯繫方式中插入的一些為迷惑過濾裝置的字符去掉,例如「-」、「.」等。轉換技術,就是把聯繫方式中的不同表現形式轉化成同一種表現形式。例如,將中文數字、GB碼的阿拉伯數字等統一轉換為ASC碼的阿拉伯數字;將網址裡面可能採用的包括簡體或繁體中文轉換成ASC碼的字符形式,比如把「www點xxx點com」裡面的「點」,其中的「點」也可能表現為「。」或者「點」,均轉換成「.」的形式。
利用特徵抽取技術可以真實的反映信息中攜帶的聯繫方式,與之相應的,在垃圾聯繫方式資料庫中需要根據所採用的特徵抽取技術配置垃圾聯繫方式,以免產生提取出來的聯繫方式的格式與配置的垃圾聯繫方式不符的情況,影響過濾效果。
當然,從待發送信息中提取攜帶的聯繫方式的方法,也可以採用普通的抽取技術,例如,從信息中抽取的電話號碼為1-2-3-4-5-6-7-8。由於普通抽取技術不從提取的聯繫方式中,再次提取真實的聯繫方法,因此會被聯繫方式的不同表現形式繞過,進而採用普通抽取技術的過濾效果不如採用特徵抽取技術的過濾效果好。
步驟104判斷垃圾聯繫方式資料庫中是否存在與步驟103中提取的聯繫方式匹配的垃圾聯繫方式,如果存在,則執行步驟105;否則,執行步驟106。
在垃圾聯繫方式資料庫中保存的垃圾聯繫方式可以就是聯繫方式本身,也可以是根據聯繫方式轉換的另外一種表現形式。
步驟105當前待發送信息為廣告信息,拒絕發送當前待發送信息。
也就是,不將當前待發送信息發送至聊天室,可以將該待發送信息丟棄,也可以進行其他處理,同時結束當前處理流程。
步驟106將當前待發送信息發送至聊天室。
圖2是與實施例一所述方法對應的信息過濾裝置的結構示意圖。
該信息過濾的裝置包括聯繫方式過濾單元21和垃圾聯繫方式存儲單元22。該信息過濾裝置位於聊天系統內。
其中,聯繫方式過濾單元21,用於判斷待發送信息中是否攜帶聯繫方式,發送沒有攜帶聯繫方式的待發送信息;提取待發送信息中的聯繫方式,並根據垃圾聯繫方式存儲單元22中存儲的垃圾聯繫方式,判斷所述待發送信息是否存在相同的聯繫方式,發送不存在相同聯繫方式的待發送信息,拒絕發送存在相同聯繫方式的待發送信息。
垃圾聯繫方式存儲單元22,用於存儲垃圾聯繫方式,垃圾聯繫方式資料庫位於垃圾聯繫方式存儲單元22內。
實施例二本實施例中描述的信息過濾方法與實施例一中描述的信息過濾方法的區別在於,在實施例一中,垃圾聯繫方式資料庫中的垃圾聯繫方式是依靠管理員配置的,而在本實施例中,是通過聊天系統對信息的分析,將符合垃圾聯繫方式要求的聯繫方式配置到垃圾聯繫方式資料庫。
為了實現實施例二的信息過濾方法,除了需要與實施例一相同,設置垃圾聯繫方式資料庫;還需要設置出現閾值。出現閾值用於當某聯繫方式的出現次數超過出現閾值時,將該聯繫方式作為垃圾聯繫方式記錄於垃圾聯繫方式資料庫中。其中,出現閾值的單位是次數,具體出現閾值的設置可以根據網絡環境的需要、以及經驗進行設置。
實施例二中的信息過濾方法的流程如圖3所示,具體步驟如下步驟301聊天系統收到待發送到聊天室中的信息。
步驟302聊天系統判斷當前收到的待發送信息中,是否攜帶聯繫方式,如果攜帶,則執行步驟303;否則,執行步驟309。
這裡,具體的判斷方法與實施例一中的步驟102所述相同,在此不再詳述。
步驟303聊天系統從待發送信息中提取攜帶的聯繫方式。
本步驟的具體實現方式與實施例一中的步驟103相同,在此不再詳述。
步驟304判斷垃圾聯繫方式資料庫中是否存在與步驟303中提取的聯繫方式匹配的垃圾聯繫方式,如果存在,則執行步驟308;否則,執行步驟305。
步驟305判斷該聯繫方式是否第一次出現在聊天系統中,如果是,則記錄該聯繫方式,並在該聯繫方式的出現次數上加1;否則,如果聊天系統已經記錄了該聯繫方式,則不需要重複記錄該聯繫方式,只需在該聯繫方式的出現次數上加1即可。這裡,每個聯繫方式的初始出現次數設置為0。
步驟306判斷當前聯繫方式的當前出現次數是否大於等於出現閾值,如果是,則執行步驟307;否則,執行步驟309。
步驟307將當前聯繫方式作為垃圾聯繫方式記錄於垃圾聯繫方式資料庫中。
步驟308當前待發送信息為廣告信息,拒絕發送當前待發送信息。結束當前處理流程。
步驟309將當前待發送信息發送至聊天室。
另外,與實施例二所述方法對應的信息過濾裝置的結構與實施例一中描述的裝置結構大致上相同,區別在於,聯繫方式過濾單元21進一步用於記錄垃圾聯繫方式存儲單元22中不存在的聯繫方式的出現次數,並在聯繫方式的出現次數大於等於出現閾值時,將該聯繫方式記錄至垃圾聯繫方式存儲單元22,即將該聯繫方式記錄至垃圾聯繫方式資料庫中。
實施例三在發明中除了可以僅依靠垃圾聯繫方式對待發送信息進行過濾,還可以在用垃圾聯繫方式對待發送信息進行過濾之後,還利用常用的信息過濾方法對待發送的信息進行進一步的過濾。在本發明中,將常用的信息過濾方法統稱為信息過濾方法,而將本發明中用到的基於垃圾聯繫方式的過濾方法稱為垃圾聯繫方式過濾方法。具體為在實施例一和實施例二所述方法中,發送待發送信息之前,進一步用信息過濾方法對通過垃圾聯繫方式過濾的信息進行預先過濾,判斷是否為廣告信息,如果是,則過濾該信息;否則,發送當前通過信息過濾的信息。
圖4是本發明實施例三方法流程圖步驟401~407的具體實現過程與步驟301~307的具體實現過程相同,只是在步驟402中,當待發送信息中沒有攜帶聯繫方式時,執行步驟408;以及在步驟406中,當待發送信息中攜帶的聯繫方式的出現次數小於出現閾值,執行步驟408。
步驟408對當前待發送信息進行信息過濾,判斷當前待發送信息是否為廣告信息,如果是,則執行步驟409;否則,執行步驟410。
步驟409拒絕發送當前待發送信息,結束當前處理流程。
步驟410發送當前待發送信息。
圖5是與本發明實施例三方法對應的信息過濾裝置示意圖,所述信息過濾裝置包括聯繫方式過濾單元21、垃圾聯繫方式存儲單元22和信息過濾單元53。
其中,聯繫方式過濾單元21用於判斷待發送信息中是否攜帶聯繫方式,發送沒有攜帶聯繫方式的待發送信息;提取待發送信息中的聯繫方式,並根據垃圾聯繫方式存儲單元22中存儲的垃圾聯繫方式,判斷所述待發送信息是否存在相同的聯繫方式,發送不存在相同聯繫方式的待發送信息至信息過濾單元53,拒絕發送存在相同聯繫方式的待發送信息。
聯繫方式過濾單元21進一步用於記錄垃圾聯繫方式存儲單元22中不存在的聯繫方式的出現次數,並在聯繫方式的出現次數大於等於出現閾值時,將該聯繫方式記錄至垃圾聯繫方式存儲單元22。
垃圾聯繫方式存儲單元22,用於存儲垃圾聯繫方式,所述垃圾聯繫方式資料庫位於垃圾聯繫方式存儲單元22內。
所述信息過濾單元53位於聯繫方式過濾單元21的輸出端,用於判斷聯繫方式過濾單元21發送來的待發送信息是否為廣告信息,發送不是廣告信息的待發送信息;拒絕發送是廣告信息的待發送信息。
實施例四在實施例二和實施例三中描述的記錄垃圾聯繫方式的方法是,利用出現閾值,將出現次數大於等於出現閾值的聯繫方式記錄為垃圾聯繫方式。在實施例四中,不採用這種垃圾聯繫方式記錄的方法,而是利用常用的信息過濾方法先對信息進行過濾,從過濾得到的廣告信息中獲取聯繫方式並記錄垃圾聯繫方式。具體的實現方法如圖6所示,詳細介紹如下步驟601聊天系統收到待發送到聊天室中的信息。
步驟602利用常用的信息過濾方法對當前待發送信息進行過濾,判斷當前待發送信息是否為廣告信息,如果是,則執行步驟606;否則,執行步驟603。
步驟603聊天系統判斷當前收到的待發送信息中,是否攜帶聯繫方式,如果攜帶,則執行步驟604;否則,執行步驟609。
這裡,具體的判斷方法與實施例一中的步驟102所述相同,在此不再詳述。
步驟604聊天系統從待發送信息中提取攜帶的聯繫方式。
本步驟的具體實現方式與實施例一中的步驟103相同,在此不再詳述。
步驟605判斷垃圾聯繫方式資料庫中是否存在與步驟604中提取的聯繫方式匹配的垃圾聯繫方式,如果存在,則執行步驟608;否則,執行步驟609。
步驟606~607聊天系統從待發送信息中提取攜帶的聯繫方式,並將提取出的聯繫方式作為垃圾聯繫方式記錄到垃圾聯繫方式資料庫中。
在本發明中,假設的是廣告信息均會攜帶聯繫方式,因此在從步驟602執行到步驟606時,不用判斷當前待發送信息中是否攜帶聯繫方式,只要是廣告信息其中則必定會攜帶聯繫方式。因此,為了使本發明的技術方案適用於更為廣泛的應用場合,也就是在廣告信息中不一定攜帶聯繫方式的場合,則可以在步驟602和步驟606之間,進一步包括判斷當前待發送信息中是否攜帶聯繫方式,如果攜帶聯繫方式,則執行步驟606~607;否則,不執行步驟606~607,直接執行步驟608。
步驟608拒絕發送當前待發送信息,結束當前處理流程。
步驟609發送當前待發送信息。
圖7是與本發明實施例四所述方法對應的信息過濾裝置示意圖,該信息過濾裝置包括聯繫方式過濾單元21、垃圾聯繫方式存儲單元22和信息過濾單元73。
其中,信息過濾單元73位於聯繫方式過濾單元21的輸入端,用於判斷待發送信息是否為廣告信息,發送不為廣告信息的待發送信息至聯繫方式過濾單元21;拒絕發送為廣告信息的待發送信息,並指示聯繫方式過濾單元21將為廣告信息的待發送信息中的聯繫方式記錄為垃圾聯繫方式。
聯繫方式過濾單元21,用於判斷不為廣告信息的待發送信息中是否攜帶聯繫方式,發送沒有攜帶聯繫方式的待發送信息;提取待發送信息中的聯繫方式,並根據垃圾聯繫方式存儲單元22中存儲的垃圾聯繫方式,判斷所述待發送信息是否存在相同的聯繫方式,發送不存在相同聯繫方式的待發送信息,拒絕發送存在相同聯繫方式的待發送信息。
聯繫方式過濾單元21,進一步用於根據信息過濾單元75的指示,提取為廣告信息的待發送信息中的聯繫方式,並將該聯繫方式記錄至垃圾聯繫方式存儲單元22。
垃圾聯繫方式存儲單元22,用於存儲垃圾聯繫方式。即垃圾聯繫方式資料庫位於垃圾聯繫方式存儲單元22內。
實施例五實施例五描述的信息過濾方法,同時利用了實施例二基於出現閾值記錄垃圾聯繫方式的方法、以及實施例四中基於廣告信息記錄垃圾聯繫方式的方法,現對本實施例的信息過濾方法具體描述如下,實施例五所述方法的流程如圖8所示。
步驟801聊天系統收到待發送到聊天室中的信息。
步驟802利用常用的信息過濾方法對當前待發送信息進行過濾,判斷當前待發送信息是否為廣告信息,如果是,則執行步驟809;否則,執行步驟803。
步驟803聊天系統判斷當前收到的待發送信息中,是否攜帶聯繫方式,如果攜帶,則執行步驟804;否則,執行步驟812。
這裡,具體的判斷方法與實施例一中的步驟102所述相同,在此不再詳述。
步驟804聊天系統從待發送信息中提取攜帶的聯繫方式。
本步驟的具體實現方式與實施例一中的步驟103相同,在此不再詳述。
步驟805判斷垃圾聯繫方式資料庫中是否存在與步驟804中提取的聯繫方式匹配的垃圾聯繫方式,如果存在,則執行步驟811;否則,執行步驟806。
步驟806判斷該聯繫方式是否第一次出現在聊天系統中,如果是,則記錄該聯繫方式,並在該聯繫方式的出現次數上加1;否則,則聊天系統已經記錄了該聯繫方式,本次則不需要重複記錄該聯繫方式,只需在該聯繫方式的出現次數上加1即可。
步驟807判斷當前聯繫方式的當前出現次數是否大於等於出現閾值,如果是,執行步驟808;否則,執行步驟812。
步驟808將當前聯繫方式作為垃圾聯繫方式記錄於垃圾聯繫方式資料庫中,執行步驟811。
步驟809~810聊天系統從待發送信息中提取攜帶的聯繫方式,並將提取出的聯繫方式作為垃圾聯繫方式記錄到垃圾聯繫方式資料庫中。
在步驟809~810之前,也可以與實施例四中步驟606~607的處理方式相同,在步驟809之前,進一步包括判斷當前待發送信息中是否攜帶聯繫方式,如果攜帶聯繫方式,則執行步驟809~810;否則,不執行步驟809~810,直接執行步驟811。
步驟811當前待發送信息為廣告信息,拒絕發送當前待發送信息。結束當前處理流程。
步驟812將當前待發送信息發送至聊天室。
與實施例五所述方法對應的信息過濾裝置示意圖與實施例四中描述的裝置結構大致上相同,區別在於,聯繫方式過濾單元21進一步用於記錄垃圾聯繫方式存儲單元22中不存在的聯繫方式的出現次數,並在聯繫方式的出現次數大於等於出現閾值時,將該聯繫方式記錄至垃圾聯繫方式存儲單元22,即將該聯繫方式記錄至垃圾聯繫方式資料庫中。
通過應用本發明所提供信息過濾方法以及裝置,利用廣告信息所攜帶的聯繫方式對待發送信息進行過濾,有效的阻止了廣告信息在聊天室中的傳送,提高了聊天系統過濾廣告的能力,降低了漏判率和誤判率。
本發明所描述過濾廣告信息的方法及裝置,還可以應用到任何其他希望過濾掉攜帶聯繫方式的信息的場合中。
以上所述,僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。
權利要求
1.一種信息過濾的方法,其特徵在於,設置垃圾聯繫方式資料庫,該方法包括以下步驟A、判斷待發送信息中是否攜帶聯繫方式,如果攜帶,則執行步驟B;否則,執行步驟D;B、提取所述待發送信息中攜帶的聯繫方式,判斷垃圾聯繫方式資料庫中是否存在相同的聯繫方式,如果存在,則執行步驟C;否則,執行步驟D;C、拒絕發送所述待發送信息;結束當前處理流程;D、發送所述待發送信息。
2.根據權利要求1所述的方法,其特徵在於,所述設置垃圾聯繫方式資料庫為預先將各垃圾聯繫方式記錄於垃圾聯繫方式資料庫中。
3.根據權利要求1所述的方法,其特徵在於,設置出現閾值;在步驟B判斷得到垃圾聯繫方式資料庫中不存在與所述待發送信息相同的聯繫方式,進行下一步操作之前,該方法進一步包括BD1、將步驟B中提取的聯繫方式的出現次數上加1,並判斷所述聯繫方式的出現次數是否大於等於出現閾值,如果是,則將步驟B中提取的聯繫方式記錄至垃圾聯繫方式資料庫中,執行步驟C;否則,執行步驟D。
4.根據權利要求1、2或3所述的方法,其特徵在於,在步驟D之前,該方法進一步包括BD2、對所述待發送信息進行信息過濾,判斷是否為廣告信息,如果是,則執行步驟C;否則,執行步驟D。
5.根據權利要求1所述的方法,其特徵在於,步驟A之前進一步包括a、對所述待發送信息進行信息過濾,判斷是否為廣告信息,如果是,則執行步驟b;否則,執行所述步驟A;b、提取所述待發送信息中的聯繫方法,將提取出的聯繫方式記錄至垃圾聯繫方式資料庫,執行步驟C。
6.根據權利要求5所述的方法,其特徵在於,設置出現閾值;在步驟B判斷得到垃圾聯繫方式資料庫中不存在與所述待發送信息相同的聯繫方式,進行下一步操作之前,該方法進一步包括BD2、將步驟B中提取的聯繫方式的出現次數上加1,並判斷所述聯繫方式的出現次數是否大於等於出現閾值,如果是,則將步驟B中提取的聯繫方式記錄至垃圾聯繫方式資料庫中,執行步驟C;否則,執行步驟D。
7.根據權利要求1、2、3、5或6所述的方法,其特徵在於,使用正則表達式執行所述判斷操作;使用特徵抽取技術提取待發送信息中的聯繫方式。
8.一種信息過濾的裝置,其特徵在於,該裝置包括聯繫方式過濾單元和垃圾聯繫方式存儲單元;其中,聯繫方式過濾單元,用於判斷待發送信息中是否攜帶聯繫方式,發送沒有攜帶聯繫方式的待發送信息;提取待發送信息中的聯繫方式,並根據垃圾聯繫方式存儲單元中存儲的垃圾聯繫方式,判斷所述待發送信息中是否存在相同的聯繫方式,發送不存在相同聯繫方式的待發送信息,拒絕發送存在相同聯繫方式的待發送信息;垃圾聯繫方式存儲單元,用於存儲垃圾聯繫方式。
9.根據權利要求8所述的裝置,其特徵在於,該裝置進一步包括信息過濾單元;信息過濾單元與聯繫方式過濾單元相連;所述信息過濾單元位於聯繫方式過濾單元的輸入端,用於預先判斷待發送信息是否為廣告信息,發送不為廣告信息的待發送信息至聯繫方式過濾單元;拒絕發送為廣告信息的待發送信息,並指示聯繫方式過濾單元將該待發送信息中的聯繫方式記錄為垃圾聯繫方式;相應的,聯繫方式過濾單元,進一步用於根據信息過濾單元的指示,提取為廣告信息的待發送信息中的聯繫方式,並記錄至垃圾聯繫方式存儲單元;或,所述信息過濾單元位於聯繫方式過濾單元的輸出端,用於接收聯繫方式過濾單元發送的待發送信息,並判斷聯繫方式過濾單元發送來的待發送信息是否為廣告信息,發送不是廣告信息的待發送信息;拒絕發送是廣告信息的待發送信息。
10.根據權利要求8或9所述的裝置,其特徵在於,聯繫方式過濾單元,進一步用於記錄垃圾聯繫方式存儲單元中不存在的聯繫方式的出現次數,並在聯繫方式的出現次數大於等於出現閾值時,將該聯繫方式記錄至垃圾聯繫方式存儲單元。
全文摘要
本發明公開了一種信息過濾的方法,設置垃圾聯繫方式資料庫,該方法包括以下步驟A.判斷待發送信息中是否攜帶聯繫方式,如果攜帶,則執行步驟B;否則,執行步驟D;B.提取所述待發送信息中攜帶的聯繫方式,判斷垃圾聯繫方式資料庫中是否存在相同的聯繫方式,如果存在,則執行步驟C;否則,執行步驟D;C.拒絕發送所述待發送信息;結束當前處理流程;D.發送所述待發送信息。另外,本發明還提供了一種信息過濾的裝置。本發明所提供的方法及裝置,由於利用廣告信息所必需要傳達的、並且不會經常變更的聯繫方式對信息進行過濾,因此能夠成功對信息進行過濾,阻止廣告信息在聊天室中傳播、降低了廣告信息的漏判率和誤判率。
文檔編號H04L29/06GK101075981SQ20061010985
公開日2007年11月21日 申請日期2006年8月18日 優先權日2006年8月18日
發明者王欣磊 申請人:騰訊科技(深圳)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀