基於內容理解的不良信息過濾方法
2023-05-31 07:28:16 2
專利名稱:基於內容理解的不良信息過濾方法
技術領域:
本發明涉及一種信息過濾方法,尤其涉及一種基於內容理解的不良信息過濾方法。
背景技術:
近年來隨著網際網路技術的發展,各種良莠不齊的信息數量急劇膨脹,網絡信息安全問題日益突出,嚴重的敗壞了社會的風氣,因此社會和個人對信息的過濾需求日益強烈。 然而結合目前正在使用的不良信息過濾軟體和系統來看,存在著漏報、錯報的現象,並且過濾速度較慢,而本發明提出的基於內容分析的方法,不僅能夠精確有效的過濾不良信息,為用戶提供乾淨的網絡環境,而且過濾速度較快,應用前景非常廣闊。
發明內容
本發明的目的就是為了解決現有技術中存在的上述問題,提供一種基於內容理解的不良信息過濾方法。本發明的目的通過以下技術方案來實現基於內容理解的不良信息過濾方法,其包括以下步驟步驟①,對網絡信息源中的內容進行數據預處理,從中提取出能夠反映或是有助判別內容的顯性和隱性特徵,令不良信息內容通過特徵項有效的表達;步驟②,根據匹配規則和方法,將不良信息模板與待處理的不良信息內容進行匹配;步驟③,根據匹配結果對信息源進行相應的過濾處理;步驟④,將處理後的結果返回給Web頁的用戶。上述的基於內容理解的不良信息過濾方法,其中所述的網絡信息源包括文本內容信息和圖像內容信息。進一步地,上述的基於內容理解的不良信息過濾方法,其中所述的文本信息的過濾是根據文本內容的上下文語境、文本要素,通過分析和理解文本內容的語義,發現不良信息。
更進一步地,上述的基於內容理解的不良信息過濾方法,其中所述圖像內容的過濾是根據圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關係特徵和語義作為索引,通過圖像之間的相似程度的匹配而進行過濾。更進一步地,上述的基於內容理解的不良信息過濾方法,其中步驟②所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。再進一步地,上述的基於內容理解的不良信息過濾方法,其中所述的預處理是清除網絡信息源中的無關信息,保留有用的信息並將其描述特徵分離出來進行量化,然後將能反映或有助於辨別內容性質的顯性和隱性信息提取出來,使不良信息能通過特徵項有效表達。
本發明技術方案的優點主要體現在能夠根據文本信息內容的上下文語境以及圖像信息的各種特徵,精確有效的過濾網絡信息中的不良信息,為用戶提供一個乾淨的的網絡環境,其應用前景非常廣闊。本發明的目的、優點和特點,將通過下面優選實施例的非限制性說明進行解釋。這些實施例僅是應用本發明技術方案的典型範例,凡採取等同替換或者等效變換而形成的技術方案,均落在本發明要求保護的範圍之內。
具體實施例方式基於內容理解的不良信息過濾方法,其與眾不同之處在於包括以下步驟首先,對網絡信息源中的內容進行數據預處理,從中提取出能夠反映或是有助判別內容的顯性和隱性特徵,令不良信息內容通過特徵項有效的表達。具體來說,所述的網絡信息源包括文本內容信息和圖像內容信息。之後,根據匹配規則和方法,將不良信息模板與待處理的不良信息內容進行匹配。 具體來說,所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。接著,根據匹配結果對信息源進行相應的過濾處理。最後,將處理後的結果返回給 Web頁的用戶。結合本發明的實際實施過程來看,採用文本信息的過濾是根據文本內容的上下文語境、文本要素,通過分析和理解文本內容的語義,發現不良信息。同時,所述圖像內容的過濾是根據圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關係特徵和語義作為索引,通過圖像之間的相似程度的匹配而進行過濾。並且,為了起到較佳的過濾效果,採用的預處理是清除網絡信息源中的無關信息,保留有用的信息並將其描述特徵分離出來進行量化,然後將能反映或有助於辨別內容性質的顯性和隱性信息提取出來,使不良信息能通過特徵項有效表達。通過上述的文字表述可以看出,採用本發明後,能夠根據文本信息內容的上下文語境以及圖像信息的各種特徵,精確有效的過濾網絡信息中的不良信息,為用戶提供一個乾淨的的網絡環境,其應用前景非常廣闊。
權利要求
1.基於內容理解的不良信息過濾方法,其特徵在於包括以下步驟步驟①,對網絡信息源中的內容進行數據預處理,從中提取出能夠反映或是有助判別內容的顯性和隱性特徵,令不良信息內容通過特徵項有效的表達;步驟②,根據匹配規則和方法,將不良信息模板與待處理的不良信息內容進行匹配;步驟③,根據匹配結果對信息源進行相應的過濾處理;步驟④,將處理後的結果返回給Web頁的用戶。
2.根據權利要求I所述的基於內容理解的不良信息過濾方法,其特徵在於所述的網絡信息源包括文本內容信息和圖像內容信息。
3.根據權利要求2所述的基於內容理解的不良信息過濾方法,其特徵在於所述的文本信息的過濾是根據文本內容的上下文語境、文本要素,通過分析和理解文本內容的語義, 發現不良信息。
4.根據權利要求2所述的基於內容理解的不良信息過濾方法,其特徵在於所述圖像內容的過濾是根據圖像的色彩、紋理、形狀、輪廓以及色彩、紋理、形狀、輪廓之間的空間關係特徵和語義作為索引,通過圖像之間的相似程度的匹配而進行過濾。
5.根據權利要求I所述的基於內容理解的不良信息過濾方法,其特徵在於步驟②所述的不良信息包括,淫穢色情、反動暴力以及垃圾信息。
6.根據權利要求I所述的基於內容理解的不良信息過濾方法,其特徵在於所述的預處理是清除網絡信息源中的無關信息,保留有用的信息並將其描述特徵分離出來進行量化,然後將能反映或有助於辨別內容性質的顯性和隱性信息提取出來,使不良信息能通過特徵項有效表達。
全文摘要
本發明涉及一種基於內容理解的不良信息過濾方法,其包括以下步驟首先對網絡信息源中的內容進行數據預處理,從中提取出能夠反映或是有助判別內容的顯性和隱性特徵,令不良信息內容通過特徵項有效的表達。之後,根據匹配規則和方法,將不良信息模板與待處理的不良信息內容進行匹配。接著,根據匹配結果對信息源進行相應的過濾處理。最後,將處理後的結果返回給Web頁的用戶。由此,能夠根據文本信息內容的上下文語境以及圖像信息的各種特徵,精確有效的過濾網絡信息中的不良信息,為用戶提供一個乾淨的的網絡環境,其應用前景非常廣闊。
文檔編號G06F17/30GK102609516SQ20121002704
公開日2012年7月25日 申請日期2012年2月8日 優先權日2012年2月8日
發明者周軍 申請人:蘇州中聯互通信息科技有限公司