文件的處理方法及裝置製造方法
2023-10-17 14:22:44 2
文件的處理方法及裝置製造方法【專利摘要】本發明實施例提供一種文件的處理方法及裝置。本發明實施例通過獲取待掃描的目標文件,進而利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,所述識別結果包括所述目標文件為可刪除文件、所述目標文件為不可刪除文件或所述目標文件為未知文件,使得能夠根據所述識別結果,對所述可刪除文件進行刪除處理,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠降低所佔用的終端的系統資源,從而提高了終端的處理性能。【專利說明】文件的處理方法及裝置【【
技術領域:
】】[0001]本發明涉及計算機技術,尤其涉及一種文件的處理方法及裝置。【【
背景技術:
】】[0002]病毒是編制或者在應用程式中插入的破壞終端功能的數據,其會影響應用程式的正常使用並且能夠自我複製,通常以一組指令或者程序代碼的形式呈現。病毒具有破壞性,複製性和傳染性的特點。終端可以利用殺毒引擎對文件進行病毒掃描處理,以便即使發現病毒文件。所謂的病毒文件,是指包含病毒的文件。若殺毒引擎發現病毒文件,則可以彈出相應的告警提示,以提醒用戶將病毒文件刪除。在接收到用戶觸發的刪除指令之後,殺毒引擎則可以將病毒文件刪除。[0003]然而,由於病毒的複製性,可能會複製很多個病毒文件,採用現有技術中的方法,對每個文件進行病毒掃描處理,進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,會佔用終端較多的系統資源,從而導致了終端的處理性能的降低。【【
發明內容】】[0004]本發明的多個方面提供一種文件的處理方法及裝置,用以提高終端的處理性能。[0005]本發明的一方面,提供一種文件的處理方法,包括:[0006]獲取待掃描的目標文件;[0007]利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件;[0008]根據所述識別結果,對所述可刪除文件進行刪除處理。[0009]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之後,還包括:[0010]根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。[0011]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之前,還包括:[0012]獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件;[0013]根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。[0014]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,包括:[0015]獲取所述目標文件的大小;[0016]若所述目標文件的大小與所述識別數據中文件的大小匹配成功,獲取所述目標文件的指定部分內容的特徵數據;[0017]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據;[0018]若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,獲得所述目標文件為可刪除文件的識別結果。[0019]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,還包括:[0020]若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者[0021]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者[0022]若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果。[0023]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之前,還包括:[0024]根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。[0025]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述若所述目標文件的大小與所述識別數據中文件的大小匹配成功,包括:[0026]若所述目標文件的大小與所述識別數據中文件的大小匹配成功,利用第一哈希算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。[0027]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據,包括:[0028]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,利用第二哈希算法,獲取所述目標文件的全部內容的特徵數據。[0029]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述目標文件包括可執行文件或非可執行文件。[0030]本發明的另一方面,提供一種文件的處理裝置,包括:[0031]獲取單元,用於獲取待掃描的目標文件;[0032]識別單元,用於利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件;[0033]掃描單元,用於根據所述識別結果,對所述可刪除文件進行刪除處理。[0034]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述掃描單元,還用於[0035]根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。[0036]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,還用於[0037]獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件;以及[0038]根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。[0039]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,具體用於[0040]獲取所述目標文件的大小;[0041]若所述目標文件的大小與所述識別數據中文件的大小匹配成功,獲取所述目標文件的指定部分內容的特徵數據;[0042]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據;[0043]若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,獲得所述目標文件為可刪除文件的識別結果。[0044]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,還用於[0045]若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者[0046]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者[0047]若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果。[0048]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,還用於[0049]根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。[0050]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,具體用於[0051]若所述目標文件的大小與所述識別數據中文件的大小匹配成功,利用第一哈希算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。[0052]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述識別單元,具體用於[0053]若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,利用第二哈希算法,獲取所述目標文件的全部內容的特徵數據。[0054]如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述目標文件包括可執行文件或非可執行文件。[0055]由上述技術方案可知,本發明實施例通過獲取待掃描的目標文件,進而利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,所述識別結果包括所述目標文件為可刪除文件、所述目標文件為不可刪除文件或所述目標文件為未知文件,使得能夠根據所述識別結果,對所述可刪除文件進行刪除處理,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠降低所佔用的終端的系統資源,從而提高了終端的處理性能。[0056]另外,採用本發明提供的技術方案,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠避免頻繁彈出相同的告警提示。[0057]另外,採用本發明提供的技術方案,由於只需要對所識別出的不可刪除文件進行病毒掃描處理,並不是對任何文件都進行病毒掃描處理,能夠有效提高病毒識別的效率。[0058]另外,採用本發明提供的技術方案,通過根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除,以避免後續繼續對所述任一文件直接進行刪除處理,能夠有效提高病毒識別的可靠性。【【專利附圖】【附圖說明】】[0059]為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。[0060]圖1為本發明一實施例提供的文件的處理方法的流程示意圖;[0061]圖2為本發明另一實施例提供的文件的處理裝置的結構示意圖。【【具體實施方式】】[0062]為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。[0063]需要說明的是,本發明實施例中所涉及的終端可以包括但不限於手機、個人數字助理(PersonalDigitalAssistant,PDA)、無線手持裝置、無線上網本、個人電腦、便攜電腦、MP3播放器、MP4播放器等。[0064]另外,本文中術語"和/或",僅僅是一種描述關聯對象的關聯關係,表示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符"/",一般表示前後關聯對象是一種"或"的關係。[0065]圖1為本發明一實施例提供的文件的處理方法的流程示意圖,如圖1所示。[0066]101、獲取待掃描的目標文件。[0067]102、利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件。[0068]103、根據所述識別結果,對所述可刪除文件進行刪除處理。[0069]可以理解的是,在103中,進行刪除處理的所述可刪除文件,就是所述目標文件為可刪除文件這一識別結果所對應的目標文件。[0070]其中,病毒,又稱為計算機病毒,可以包括但不限於木馬、後門、區域網蠕蟲、郵件懦蟲、間謀軟體、感染型病毒或Rootkits/Bootkits。[0071]需要說明的是,101?103的執行主體可以為位於本地終端的應用,或者還可以為設置在位於本地終端的應用中的插件或軟體開發工具包(SoftwareDevelopmentKit,SDK)等功能單元,或者還可以為位於網絡側伺服器中的處理引擎,本實施例對此不進行特別限定。[0072]可以理解的是,所述應用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個網頁程序(webApp),本實施例對此不進行特別限定。[0073]這樣,通過獲取待掃描的目標文件,進而利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,所述識別結果包括所述目標文件為可刪除文件、所述目標文件為不可刪除文件或所述目標文件為未知文件,使得能夠根據所述識別結果,對所述可刪除文件進行刪除處理,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠降低所佔用的終端的系統資源,從而提高了終端的處理性能。[0074]可選地,在本實施例的一個可能的實現方式中,在101中,所述待掃描的目標文件,可以是指根據掃描範圍,所確定的終端的存儲設備內所存儲的文件中的一個文件。具體地,所述待掃描的目標文件,具體可以為在終端的存儲設備所存儲的全部文件中,按照一定的掃描順序依次獲取的文件,或者還可以為在終端的存儲設備的指定路徑下所存儲的全部文件中,按照一定的掃描順序依次獲取的文件,本實施例對此不進行特別限定。[0075]在一個具體的實現過程中,所述終端的存儲設備可以慢速存儲設備,具體可以為計算機系統的硬碟,或者還可以為手機的非運行內存即物理內存,例如,只讀存儲器(Read-OnlyMemory,ROM)和內存卡等,本實施例對此不進行特別限定。[0076]在另一個具體的實現過程中,所述終端的存儲設備還可以為快速存儲設備,具體可以為計算機系統的內存,或者還可以為手機的運行內存即系統內存,例如,隨機存儲器(RandomAccessMemory,RAM)等,本實施例對此不進行特別限定。[0077]可選地,在本實施例的一個可能的實現方式中,所述目標文件可以為可執行文件(executablefile)。具體地,可執行文件,是可移植可執行(PE)文件格式的文件,它可以加載到內存中,並由作業系統加載程序執行。可執行文件的擴展名可以包括但不限於.exe、.sys和·scr,等。[0078]可選地,在本實施例的一個可能的實現方式中,所述目標文件可以為非可執行文件。具體地,非可執行文件,是除了可執行文件之外的其他文件。[0079]可選地,在本實施例的一個可能的實現方式中,在102之後,還可以進一步根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。[0080]可以理解的是,在這個實現方式中,進行病毒掃描處理的所述不可刪除文件,就是所述目標文件為不可刪除文件這一識別結果所對應的目標文件。[0081]這樣,通過對不可刪除文件進行病毒掃描處理,則可以獲得掃描結果,進而根據該掃描結果進行相關的病毒防禦處理,例如,對識別為病毒文件所進行的告警處理,或者,再例如,對識別為沒有病毒文件所進行的放行處理等,本實施例對此不進行特別限定[0082]可以理解的是,進行刪除處理的所述可刪除文件,就是所述目標文件為可刪除文件這一識別結果所對應的目標文件。由於已經能夠確認該目標文件為可刪除文件,因此,無需再對這些可刪除文件進行病毒掃描處理,直接進行刪除處理即可,繼續執行101,以獲取下一個待掃描的目標文件。這樣,由於只需要對不可刪除文件進行病毒掃描處理,使得不再對可刪除文件進行病毒掃描處理,而是直接進行刪除處理,能夠有效提高病毒識別的效率。[0083]可選地,在本實施例的一個可能的實現方式中,在102之前,還可以進一步獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件,進而則可以根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。[0084]具體地,具體可以利用一些現有的文件識別算法例如,特徵匹配等,將一些文件,識別出病毒文件,本實施例對此不進行特別限定。若發現病毒文件,殺毒引擎則可以彈出相應的告警提示,以提醒用戶將病毒文件刪除。在接收到用戶觸發的刪除指令之後,殺毒引擎則可以將病毒文件刪除。[0085]由於所述刪除指令是用戶觸發的,因此,能夠將病毒文件看成是用戶已經確認的可以直接刪除的文件,進而將該病毒文件的大小和該病毒文件的特徵數據,作為可刪除文件的識別數據。[0086]在一個具體的實現過程中,根據一些可刪除文件的識別數據,建立一個資料庫。該資料庫中具體可以包括但不限於如下內容:[0087]文件的大小;[0088]文件的指定部分內容的特徵數據;以及[0089]文件的全部內容的特徵數據。[0090]所述文件的大小,用以指示文件的內容實際具有的字節數,其取值具體可以根據文件的大小的最大限制,設置不同長度的位數表示,通常可以用32位表示。[0091]所述文件的指定部分內容的特徵數據,用以能夠反映出一個文件的指定部分內容不同於其它文件的特點,其取值具體可以根據第一哈希算法的類型,設置不同長度的位數來表示,通常可以用32位表示循環冗餘碼校驗32(CyclicalRedundancyCheck,CRC32)算法所計算出來的哈希值。[0092]一般來說,具體可以根據文件的數據讀取順序,以及文件的數據讀取單位,預先定義所述指定部分內容。例如,若文件的數據讀取單位為簇,一簇的默認大小是4K字節,那麼,所述目標文件的指定部分內容則可以定義為文件的開始4K字節。[0093]所述文件的全部內容的特徵數據,用以能夠反映出一個文件的全部內容不同於其它文件的特點,可以作為文件的唯一標識,其取值具體可以根據第二哈希算法的類型,設置不同長度的位數來表示,通常可以用128位表示消息摘要算法第五版(MessageDigestAlgorithm5,MD5)所計算出來的哈希值。[0094]進一步地,如果文件的類型為可刪除文件,該資料庫中還需要進一步包括病毒名稱信息,例如,病毒名稱長度和病毒名稱。[0095]在另一個具體的實現過程中,在102中,具體可以獲取所述目標文件的大小。若所述目標文件的大小與所述識別數據中文件的大小匹配成功,則可以進一步獲取所述目標文件的指定部分內容的特徵數據。若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,則可以進一步獲取所述目標文件的全部內容的特徵數據。若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,則可以獲得所述目標文件為可刪除文件的識別結果。[0096]其中,所述目標文件的指定部分內容的特徵數據,以及所述目標文件的全部內容的特徵數據,具體可以為靜態特徵,所謂靜態特徵,可以理解為基於未執行的文件作為識別依據,或者還可以為動態特徵,所謂動態特徵,可以理解為基於執行的文件作為識別依據,本實施例對此不進行特別限定。[0097]具體地,具體可以利用第一哈希算法,例如,循環冗餘碼校驗32(CyclicalRedundancyCheck,CRC32)算法、Adler32或消息摘要算法第四版(MessageDigestAlgorithm4,MD4)等算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。[0098]具體地,具體可以利用第二哈希算法,例如,消息摘要算法第五版(MessageDigestAlgorithm5,MD5)或安全散列算法256(SecureHashAlgorithm,SHA256)等算法,獲取所述目標文件的全部內容的特徵數據。[0099]進一步地,若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0100]進一步地,若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0101]進一步地,若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0102]可以理解的是,所謂的匹配成功,具體可以根據匹配的需求,進行定義。具體地,可以為待匹配的數據完全一致,即完全匹配或精確匹配,或者還可以為待匹配的數據基本一致,即不完全匹配或模糊匹配,本實施例對此不進行特別限定。[0103]由於一些原因,例如,病毒掃描處理的邏輯出現問題,或者,再例如,文件自身的編譯問題,等等,會將一些並不是病毒文件的文件,錯誤地識別為病毒文件,進而對該文件進行告警處理。也就是說,對這個文件所進行的告警處理所產生的告警信息,是一個錯誤的告警信息即誤告警信息。具體可以通過多種途徑採集所謂的誤告警信息,例如,操作人員在告警記錄中進行人工排查,或者,再例如,用戶的主動反饋,等等。針對這種情況,在本實施例的一個可能的實現方式中,在102之前,還可以進一步根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。[0104]具體地,具體可以將所述任一文件的大小和所述任一文件的特徵數據,在所述識別數據中,進行匹配,如果匹配成功,說明該任一文件的相關信息被錯誤地作為了可刪除文件的識別數據,則可以將所述任一文件的大小和所述任一文件的特徵數據,從所述可刪除文件的識別數據中刪除。[0105]這樣,通過根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除,以避免後續繼續對所述任一文件進行直接的刪除處理,能夠有效提高病毒識別的可靠性。[0106]本實施例中,通過獲取待掃描的目標文件,進而利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,所述識別結果包括所述目標文件為可刪除文件、所述目標文件為不可刪除文件或所述目標文件為未知文件,使得能夠根據所述識別結果,對所述可刪除文件進行刪除處理,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠降低所佔用的終端的系統資源,從而提高了終端的處理性能。[0107]另外,採用本發明提供的技術方案,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠避免頻繁彈出相同的告警提示。[0108]另外,採用本發明提供的技術方案,由於只需要對所識別出的不可刪除文件進行病毒掃描處理,並不是對任何文件都進行病毒掃描處理,能夠有效提高病毒識別的效率。[0109]另外,採用本發明提供的技術方案,通過根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除,以避免後續繼續對所述任一文件直接進行刪除處理,能夠有效提高病毒識別的可靠性。[0110]需要說明的是,對於前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發明並不受所描述的動作順序的限制,因為依據本發明,某些步驟可以採用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作和模塊並不一定是本發明所必須的。[0111]在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。[0112]圖2為本發明另一實施例提供的文件的處理裝置的結構示意圖,如圖2所示。本實施例的文件的處理裝置可以包括獲取單元21、識別單元22和掃描單元23。其中,獲取單元21,用於獲取待掃描的目標文件;識別單元22,用於利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件;掃描單元23,用於根據所述識別結果,對所述可刪除文件進行刪除處理。[0113]需要說明的是,本實施例所提供的文件的處理裝置可以為位於本地終端的應用,或者還可以為設置在位於本地終端的應用中的插件或軟體開發工具包(SoftwareDevelopmentKit,SDK)等功能單元,或者還可以為位於網絡側伺服器中的處理引擎,本實施例對此不進行特別限定。[0114]可以理解的是,所述應用可以是安裝在終端上的本地程序(nativeApp),或者還可以是終端上的瀏覽器的一個網頁程序(webApp),只要能夠實現文件的病毒掃描,以提供安全的系統環境的客觀存在形式都可以,本實施例對此不進行特別限定。[0115]可選地,在本實施例的一個可能的實現方式中,所述獲取單元21所獲取的所述目標文件可以為可執行文件(executablefile)。具體地,可執行文件,是可移植可執行(PE)文件格式的文件,它可以加載到內存中,並由作業系統加載程序執行。可執行文件的擴展名可以包括但不限於·exe、·sys和·scr,等。[0116]可選地,在本實施例的一個可能的實現方式中,所述獲取單元21所獲取的所述目標文件可以為非可執行文件。具體地,非可執行文件,是除了可執行文件之外的其他文件。[0117]可選地,在本實施例的一個可能的實現方式中,所述掃描單元23,還可以進一步用於根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。[0118]可選地,在本實施例的一個可能的實現方式中,所述識別單元22,還可以進一步用於獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件;以及根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。[0119]可選地,在本實施例的一個可能的實現方式中,所述識別單元22,具體可以用於獲取所述目標文件的大小;若所述目標文件的大小與所述識別數據中文件的大小匹配成功,獲取所述目標文件的指定部分內容的特徵數據;若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據;若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,獲得所述目標文件為可刪除文件的識別結果。[0120]具體地,所述識別單元22,具體可以用於利用第一哈希算法,例如,循環冗餘碼校驗32(CyclicalRedundancyCheck,CRC32)算法、Adler32或消息摘要算法第四版(MessageDigestAlgorithm4,MD4)等算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。[0121]具體地,所述識別單元22,具體可以用於利用第二哈希算法,例如,消息摘要算法第五版(MessageDigestAlgorithm5,MD5)或安全散列算法256(SecureHashAlgorithm,SHA256)等算法,獲取所述目標文件的全部內容的特徵數據。[0122]進一步地,所述識別單元22,還可以進一步用於若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0123]進一步地,所述識別單元22,還可以進一步用於若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0124]進一步地,所述識別單元22,還可以進一步用於若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,則可以獲得所述目標文件為不可刪除文件的識別結果。[0125]可選地,在本實施例的一個可能的實現方式中,所述識別單元22,還可以進一步用於根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。這樣,通過根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除,以避免後續繼續對所述任一文件進行直接的刪除處理,能夠有效提高病毒識別的可靠性。[0126]需要說明的是,圖1對應的實施例中方法,可以由本實施例提供的文件的處理裝置實現。詳細描述可以參見圖1對應的實施例中的相關內容,此處不再贅述。[0127]本實施例中,通過獲取單元獲取待掃描的目標文件,進而由識別單元利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,所述識別結果包括所述目標文件為可刪除文件、所述目標文件為不可刪除文件或所述目標文件為未知文件,使得掃描單元能夠根據所述識別結果,對所述可刪除文件進行刪除處理,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠降低所佔用的終端的系統資源,從而提高了終端的處理性能。[0128]另外,採用本發明提供的技術方案,由於能夠對所識別出的可刪除文件直接進行刪除處理,而無需對其進行病毒掃描處理進而對確認為病毒文件彈出相應的告警提示,以提醒用戶將病毒文件刪除,因此,能夠避免頻繁彈出相同的告警提示。[0129]另外,採用本發明提供的技術方案,由於只需要對所識別出的不可刪除文件進行病毒掃描處理,並不是對任何文件都進行病毒掃描處理,能夠有效提高病毒識別的效率。[0130]另外,採用本發明提供的技術方案,通過根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除,以避免後續繼續對所述任一文件直接進行刪除處理,能夠有效提高病毒識別的可靠性。[0131]所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統,設備和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。[0132]在本發明所提供的幾個實施例中,應該理解到,所揭露的系統,設備和方法,可以通過其它的方式實現。例如,以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,設備或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。[0133]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。[0134]另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。[0135]上述以軟體功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存儲介質中。上述軟體功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,伺服器,或者網絡設備等)或處理器(processor)執行本發明各個實施例所述方法的部分步驟。而前述的存儲介質包括:U盤、移動硬碟、只讀存儲器(Read-OnlyMemory,ROM)、隨機存取存儲器(RandomAccessMemory,RAM)、磁碟或者光碟等各種可以存儲程序代碼的介質。[0136]最後應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。【權利要求】1.一種文件的處理方法,其特徵在於,包括:獲取待掃描的目標文件;利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件;根據所述識別結果,對所述可刪除文件進行刪除處理。2.根據權利要求1所述的方法,其特徵在於,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之後,還包括:根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。3.根據權利要求1所述的方法,其特徵在於,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之前,還包括:獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件;根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。4.根據權利要求3所述的方法,其特徵在於,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,包括:獲取所述目標文件的大小;若所述目標文件的大小與所述識別數據中文件的大小匹配成功,獲取所述目標文件的指定部分內容的特徵數據;若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據;若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,獲得所述目標文件為可刪除文件的識別結果。5.根據權利要求4所述的方法,其特徵在於,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果,還包括:若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果。6.根據權利要求4所述的方法,其特徵在於,所述利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果之前,還包括:根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。7.根據權利要求4所述的方法,其特徵在於,所述若所述目標文件的大小與所述識別數據中文件的大小匹配成功,包括:若所述目標文件的大小與所述識別數據中文件的大小匹配成功,利用第一哈希算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。8.根據權利要求4所述的方法,其特徵在於,所述若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據,包括:若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,利用第二哈希算法,獲取所述目標文件的全部內容的特徵數據。9.根據權利要求1?8任一權利要求所述的方法,其特徵在於,所述目標文件包括可執行文件或非可執行文件。10.-種文件的處理裝置,其特徵在於,包括:獲取單元,用於獲取待掃描的目標文件;識別單元,用於利用可刪除文件的識別數據,對所述目標文件進行識別,以獲得識別結果;所述識別結果包括所述目標文件為可刪除文件或所述目標文件為不可刪除文件;掃描單元,用於根據所述識別結果,對所述可刪除文件進行刪除處理。11.根據權利要求10所述的裝置,其特徵在於,所述掃描單元,還用於根據所述識別結果,對所述不可刪除文件進行病毒掃描處理。12.根據權利要求10所述的裝置,其特徵在於,所述識別單元,還用於獲取用戶觸發的刪除指令,所述刪除指令用於指示刪除病毒文件;以及根據所述病毒文件,獲得所述病毒文件的大小和所述病毒文件的特徵數據,以作為所述可刪除文件的識別數據。13.根據權利要求12所述的裝置,其特徵在於,所述識別單元,具體用於獲取所述目標文件的大小;若所述目標文件的大小與所述識別數據中文件的大小匹配成功,獲取所述目標文件的指定部分內容的特徵數據;若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,獲取所述目標文件的全部內容的特徵數據;若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配成功,獲得所述目標文件為可刪除文件的識別結果。14.根據權利要求13所述的裝置,其特徵在於,所述識別單元,還用於若所述目標文件的大小與所述識別數據中文件的大小匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果;或者若所述目標文件的全部內容的特徵數據與所述識別數據中文件的全部內容的特徵數據匹配失敗,獲得所述目標文件為不可刪除文件的識別結果。15.根據權利要求13所述的裝置,其特徵在於,所述識別單元,還用於根據任一文件的誤告警信息,將所述任一文件的大小和所述任一文件的特徵數據,從所述識別數據中刪除。16.根據權利要求13所述的裝置,其特徵在於,所述識別單元,具體用於若所述目標文件的大小與所述識別數據中文件的大小匹配成功,利用第一哈希算法,獲取所述目標文件的開始Μ個字節的特徵數據,Μ為大於或等於1的整數。17.根據權利要求13所述的裝置,其特徵在於,所述識別單元,具體用於若所述目標文件的指定部分內容的特徵數據與所述識別數據中文件的指定部分內容的特徵數據匹配成功,利用第二哈希算法,獲取所述目標文件的全部內容的特徵數據。18.根據權利要求10?17任一權利要求所述的裝置,其特徵在於,所述目標文件包括可執行文件或非可執行文件。【文檔編號】G06F21/56GK104217165SQ201410471868【公開日】2014年12月17日申請日期:2014年9月16日優先權日:2014年9月16日【發明者】郭明強,張永成申請人:百度在線網絡技術(北京)有限公司