頁面篡改檢測方法及黑鏈資料庫生成方法
2023-05-23 09:59:06
\,].+?["\,]\s*style=["\,][\w+\-]+:-[0_9]+.*?["\,].*?>.*?。[0106]當然,上述生成黑鏈規則的方法僅僅用作示例,本領域技術人員根據實際情況採用任一種黑鏈規則的生成方式都是可行的,本申請對此無需加以限制。[0107]採用黑鏈規則在其它特徵頁面中進行匹配,可以提取更多的黑鏈特徵數據,訓練更多黑鏈規則,最終可形成針對全網黑鏈的黑鏈特徵資料庫。[0108]由於掛黑鏈如今已形成一個產業鏈,所以相同的篡改關鍵詞和/或黑鏈URL會大量出現在其它被篡改的頁面中。採用正則表達式作為黑鏈規則在頁面中進行匹配,以提取更多的黑鏈特徵數據,訓練更多黑鏈規則,更適用於當前黑鏈產業化的情形,能更快更多地發現被篡改的頁面,有效提高檢測頁面篡改的效率。[0109]為適用所需檢測頁面數量眾多,並且,所需匹配的黑鏈特徵數據較多的情形,在本申請實施例中,需要將所生成的黑鏈特徵資料庫部署到多臺伺服器中,如部署到後臺的10臺伺服器中,每臺伺服器中所部署的黑鏈特徵資料庫內容相同。[0110]在具體實現中,由於黑鏈特徵數據具有一定的時效性,可以按預設時間間隔發起對所述黑鏈特徵資料庫的更新,具體可以通過重複上述子步驟Slll—S114完成黑鏈特徵資料庫的更新。[0111]步驟12、獲取當前檢測頁面的特徵信息;[0112]步驟13、依據所述頁面的特徵信息確定對應的目標伺服器;[0113]在具體實現中,對於黑鏈特徵庫所部署的伺服器,可以分別設置伺服器標識,所述標識可以採用任一種規則和形式設置,比如,數字排序,字符排序等,本申請對此不作限制。[0114]作為本申請實施例具體應用的一種示例,所述特徵信息可以包括頁面分類信息,在這種情況下,所述步驟103具體可以包括如下子步驟:[0115]子步驟S311、按照預置的頁面分類信息與伺服器標識的對應關係,提取當前頁面分類信息對應的伺服器標識;[0116]子步驟S312、將所述伺服器標識對應的伺服器確定為目標伺服器。[0117]在具體實現中,所述頁面分類信息可以為頁面的內容分類信息,例如,根據頁面內容將頁面分為遊戲類、電影類、小說類、視頻類、音樂類、購物類、郵箱類、生活類、銀行類、旅遊類等;預置上述各類頁面內容分別與伺服器標識的對應如下表所示:【權利要求】1.一種頁面篡改檢測方法,其包括:獲取當前檢測頁面的特徵信息;依據所獲取的特徵信息確定對應的目標伺服器;採用所述目標伺服器中的黑鏈特徵資料庫與當前檢測頁面進行匹配以判斷當前檢測頁面中是否包含所述黑鏈特徵資料庫中的黑鏈特徵數據;如果包含,則判定當前頁面為被篡改頁面。2.如權利要求1所述的方法,其中,所述黑鏈特徵資料庫部署在多臺伺服器上。3.如權利要求1或2所述的方法,其中,所述伺服器具有伺服器標識,所述特徵信息包括頁面分類信息,所述依據頁面的特徵信息確定對應的目標伺服器的步驟包括:按照預置的頁面分類信息與伺服器標識的對應關係,提取當前頁面分類信息對應的伺服器標識;將所述伺服器標識對應的伺服器確定為目標伺服器。4.如權利要求3所述的方法,其中,所述頁面分類信息包括頁面的內容分類信息、頁面的類型分類信息、頁面的標籤分類信息和/或頁面的屬性分類信息。5.如權利要求1或2所述的方法,其中,所述特徵信息包括頁面的URL,所述伺服器具有數值標識,所述依據頁面的特徵信息確定對應的伺服器標識的步驟包括:採用預設算法將當前檢測頁面的URL轉換為數值;按所述數值提取對應數值標識的伺服器並將其作為目標伺服器。6.如權利要求1至5中任一項所述的方法,其中,所述黑鏈特徵資料庫按照下面步驟生成:採用已有的黑鏈特徵數據搜索包含所述黑鏈特徵數據的頁面為特徵頁面;分析所述黑鏈特徵數據在特徵頁面中的布局,當發現布局異常時,從該特徵頁面中提取包含所述黑鏈特徵數據的頁面元素;根據所述頁面元素生成黑鏈規則,採用所述黑鏈規則在其它特徵頁面中進行匹配,並在匹配的特徵頁面中提取新的黑鏈特徵數據;保存所述黑鏈特徵數據形成黑鏈特徵資料庫。7.如權利要求6所述的方法,其中,所述黑鏈特徵數據包括篡改關鍵詞和黑鏈URL。8.如權利要求6所述的方法,其中,所述分析所述黑鏈特徵數據在特徵頁面中的布局進一步包括:判斷所述黑鏈特徵數據的頁面元素位置是否在預設閾值範圍內,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為不可見屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為對瀏覽器隱藏的屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常。9.如權利要求7所述的方法,其中,所述根據頁面元素生成黑鏈規則的步驟為:從包含所述篡改關鍵詞和/或黑鏈URL的頁面元素中,抽象出正則表達式作為黑鏈規則。10.如權利要求7所述的方法,其中,還包括:按預設時間間隔更新所述黑鏈特徵資料庫。11.一種黑鏈資料庫生成方法,其包括:採用已有的黑鏈特徵數據搜索包含所述黑鏈特徵數據的頁面為特徵頁面;分析所述黑鏈特徵數據在特徵頁面中的布局,當發現布局異常時,從該特徵頁面中提取包含所述黑鏈特徵數據的頁面元素;根據所述頁面元素生成黑鏈規則,採用所述黑鏈規則在其它特徵頁面中進行匹配,並在匹配的特徵頁面中提取新的黑鏈特徵數據;保存所述黑鏈特徵數據形成黑鏈特徵資料庫。12.如權利要求11所述的方法,其中,所述黑鏈特徵數據包括篡改關鍵詞和黑鏈URL。13.如權利要求12所述的方法,其中,所述分析所述黑鏈特徵數據在特徵頁面中的布局進一步包括:判斷所述黑鏈特徵數據的頁面元素位置是否在預設閾值範圍內,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為不可見屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為對瀏覽器隱藏的屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常。14.如權利要求13所述的方法,其中,所述根據頁面元素生成黑鏈規則的步驟為:從包含所述篡改關鍵詞和/或黑鏈URL的頁面元素中,抽象出正則表達式作為黑鏈規則。15.如權利要求11至14中任一項所述的方法,其中,還包括:按預設時間間隔更新所述黑鏈特徵資料庫。16.一種頁面篡改檢測方法,其包括:獲取當前檢測頁面的URL;採用預設算法將當前檢測頁面的URL轉換為數值;按所述數值提取具有對應數值標識的伺服器並將其作為目標伺服器;採用所述目標伺服器中的黑鏈特徵資料庫與當前檢測頁面進行匹配以判斷當前檢測頁面中是否包含所述黑鏈特徵資料庫中的黑鏈特徵數據;如果包含,則判定當前頁面為被篡改頁面。17.如權利要求16所述的方法,其中,所述黑鏈特徵資料庫部署在多臺伺服器上。18.如權利要求16或17所述的方法,其中,所述黑鏈特徵資料庫按照下面步驟生成:採用已有的黑鏈特徵數據搜索包含所述黑鏈特徵數據的頁面為特徵頁面;分析所述黑鏈特徵數據在特徵頁面中的布局,當發現布局異常時,從該特徵頁面中提取包含所述黑鏈特徵數據的頁面元素;根據所述頁面元素生成黑鏈規則,採用所述黑鏈規則在其它特徵頁面中進行匹配,並在匹配的特徵頁面中提取新的黑鏈特徵數據;保存所述黑鏈特徵數據形成黑鏈特徵資料庫。19.如權利要求18所述的方法,其中,所述黑鏈特徵數據包括篡改關鍵詞和黑鏈URL。20.如權利要求18所述的方法,其中,所述分析所述黑鏈特徵數據在特徵頁面中的布局進一步包括:判斷所述黑鏈特徵數據的頁面元素位置是否在預設閾值範圍內,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為不可見屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常;和/或,判斷所述黑鏈特徵數據的頁面元素屬性是否為對瀏覽器隱藏的屬性,若是,則判定所述黑鏈特徵數據在特徵頁面中的布局異常。21.如權利要求18所述的方法,其中,所述根據頁面元素生成黑鏈規則的步驟為:從包含所述篡改關鍵詞和/或黑鏈URL的頁面元素中,抽象出正則表達式作為黑鏈規則。22.如權利要求16至21中任一項所述的方法,還包括:按預設時間間隔更新所述黑鏈特徵資料庫。【文檔編號】G06F17/30GK104036189SQ201410208997【公開日】2014年9月10日申請日期:2014年5月16日優先權日:2014年5月16日【發明者】劉起,郭峰申請人:北京奇虎科技有限公司,奇智軟體(北京)有限公司