一種簡化電子郵件操作的方法及裝置的製作方法
2023-05-20 04:42:01 1
專利名稱:一種簡化電子郵件操作的方法及裝置的製作方法
技術領域:
本發明涉及電子郵件技術,具體地說涉及一種簡化電子郵件操作的方法。本發明同時提供一種簡化電子郵件操作的裝置。
背景技術:
電子郵件已經成為辦公、通信的重要工具,獲得了廣泛的應用。隨著電子郵件量的增加,使用者耗費在電子郵件處理上的時間不斷增加。用戶對電子郵件的處理包括多種方式,主要包括將電子郵件在郵箱的各個文件夾之間進行移動;刪除電子郵件;改變電子郵件的屬性(例如改變電子郵件的重要性等級,保存電子郵件到郵箱之外的指定文件夾中等)。為了節省使用者的操作時間,如何在上述電子郵件處理過程中簡化使用者的操作,成為一個重要的研究課題。
在目前的處理電子郵件的操作中,對垃圾郵件的處理是其中首要的問題。所謂垃圾郵件,是指未經用戶請求,強行發到用戶信箱中的任何廣告、宣傳資料、病毒等內容的電子郵件,一般具有批量發送的特徵。伴隨著電子郵件的廣泛使用,垃圾郵件日益增多,使用者往往需要花費大量時間處理毫無意義的垃圾郵件,嚴重幹擾用戶對正常郵件的使用。更為嚴重的是,垃圾郵件還可能作為計算機病毒的載體,對計算機的運行造成損害。
現有技術下,對於垃圾郵件採取了許多措施。首先是避免郵箱成為垃圾郵件的發送對象,在這種措施未能成功的情況下,就需要對電子郵件採取過濾措施,將接收到的屬於垃圾郵件的電子郵件存放到特定的郵箱中,避免其影響正常郵件的使用,這是目前針對已經接收到的垃圾郵件的主要處理辦法。
目前,收發郵件有兩種方式,一種是通過Outlook Express、Foxmail等郵件客戶端軟體收發電子郵件;另外一種是登陸服務商的站點收發郵件,稱為Webmail方式。在兩種方式下,都可以建立過濾垃圾郵件的規則,由垃圾郵件過濾模塊根據這些規則判定接收的郵件是否是垃圾郵件,並將判定為垃圾郵件的郵件存放到垃圾郵件箱文件夾。
由於現在反垃圾技術還不是很成熟,所以總有一些垃圾郵件被漏判為好郵件,或是好郵件被誤判為垃圾郵件。對於誤判和漏判的郵件,需要用戶人工去將其分撿出來移動到正確的文件夾。在foxmail等郵件客戶端軟體中,以及一些Webmail中,帶有垃圾郵件學習模塊,這些模塊能夠將已經被判斷為垃圾郵件的郵件特徵用於以後的判斷中,這種情況下,為了避免學習錯誤,更需要用戶去將這部分誤判和漏判的郵件分揀出來,否則將會造成更多的誤判和漏判。
由於需要用戶進行手工分揀垃圾郵件,對於漏判的郵件,用戶需要手工一封一封選擇,然後移動到垃圾郵件箱中;而對於誤判的郵件,用戶要一封封選擇後,再移動到收件箱中。在這兩個過程中,用戶需要對每封郵件都進行選擇,耗費大量時間。例如,如果一個用戶一天內受到300封郵件,那麼可能會有20封好郵件會被誤判為垃圾郵件,50封垃圾郵件被漏判。用戶就需要進行70次的操作來分揀出這20封誤判和50封漏判的郵件。當然,用戶可以一次選中多封垃圾郵件,但是這個過程仍然需要人工確認,即用戶需要確認每封選中的郵件是否屬於垃圾郵件,然後才能對該郵件進行處理,尤其是由於正常郵件有可能被埋沒在大量垃圾郵件中,用戶就更需要小心謹慎,防止將重要郵件錯判而造成損失,這一過程會消耗用戶的大量時間。
與上述處理垃圾郵件相似,現有技術下進行其他類型的郵件處理也需要用戶對每一封郵件進行選擇和處理,耗費大量時間。
發明內容
針對上述缺陷,本發明解決的技術問題在於,提供一種電子郵件操作方法,該方法可簡化用戶對電子郵件的移動、刪除、分類等各類操作,尤其是簡化用戶對垃圾郵件進行處理的過程。本發明同時提供的一種對電子郵件進行操作的裝置。
本發明提供的一種簡化電子郵件操作的方法,包括11)對某個用戶郵箱分類郵件夾的所有郵件進行相似性分類,即將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件進行的操作;13)根據用戶請求,對該分類郵件夾中與所述被操作的郵件屬於同一相似類的其他郵件進行同樣的操作處理。
優選地,所述步驟11)與12)之間包括21)用戶郵箱接收發送到本郵箱的新郵件,並將該郵件放入相應的分類郵件夾;22)將所接收的郵件與相應的分類郵件夾中已經存放的郵件比較,根據比較結果進行相似性歸類,即將該郵件歸入與其相似的相似類;若該郵件無法歸入任何已存在的相似類,則為該郵件設置新的相似類。
優選地,所述步驟11)中對已存在的郵件進行相似性分類後,對屬於一個相似類的郵件計數;所述步驟22)之後,若對於進入該分類郵件夾的所述新郵件判定為屬於某個已經存在的相似類,則將該類的計數值加1;若該新郵件不屬於任何一個該郵件夾中已存在的相似類,則為該郵件設置新的相似類的同時,為該新設置的相似類計數。
優選地,所述的相似性分類和相似性歸類中,對於相似的判定,是根據郵件文本進行相似匹配計算,根據計算結果判定文本是否相似;所述相似匹配計算可以採用編輯距離算法、覆蓋率計算、餘弦距離算法、詞頻、反向文本頻率類方法。
優選地,所述步驟13)包括51)詢問是否需要對該郵件夾中的相似郵件作相同的操作,接收用戶的選擇;若選擇是,則進入步驟52);若選擇否,則結束操作;52)選定屬於同一相似類的其他郵件;53)對上述選定的郵件進行所述相同的操作。
優選地,若所述步驟12)中的用戶對該郵件夾的郵件的操作為刪除,則步驟51)詢問是否要刪除該郵件夾中的同類郵件,若是,則步驟53)所述的操作為刪除操作;若所述步驟12)中的用戶對該郵件夾的郵件的操作為移動操作,則步驟51)詢問是否要對該郵件夾中的同類郵件進行相同的移動,若是,則步驟53)中所述的操作為移動操作,並且在移動後的文件夾中,所有被移動的電子郵件在新的分類郵件夾中以時間順序排序。
優選地,所述步驟13)後還包括,若所述操作為將郵件從垃圾郵件夾移動到其他郵件夾,則將所有被操作郵件的發件人加入白名單;若所述操作為將郵件移入垃圾郵件夾或直接刪除,則將所有被操作郵件的發件人加入黑名單。
本發明同時提供一種簡化電子郵件操作的裝置,包括相似性分類單元,用於讀取電子郵件樣本,並根據一定的相似性判斷策略進行相似性分類,將相似的郵件分為一個相似類;所述電子郵件樣本為用戶郵箱的某一分類文件夾中的所有文件;執行單元,用於接收用戶輸入的操作內容,以及用戶選擇的作為操作對象的初始電子郵件,並據此進行操作;若所述操作對象具有相似電子郵件時,根據用戶的選擇,對相似的電子郵件進行相同的操作。
優選地,該簡化電子郵件操作的裝置還包括相似性歸類單元,用於將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類;如果未發現與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類。
優選地,該裝置中,對應於每一個相似類設置有相似郵件計數器,用於記錄該相似類的郵件數。
優選地,所述的相似性分類單元和相似性歸類單元,對於相似的判定,是根據郵件文本進行相似匹配計算,根據計算結果判定文本是否相似;所述相似匹配計算可以採用編輯距離算法、覆蓋率計算、餘弦距離算法、詞頻.反向文本頻率類方法。
優選地,該裝置還包括查詢單元,用於接收用戶選擇的初始電子郵件,並據此查詢對應於該電子郵件的相似郵件計數器,獲得該初始電子郵件是否存在相似電子郵件的信息,並輸出該信息;問詢單元,用於接收所述查詢單元輸出的初始電子郵件是否存在相似郵件的信息,若該信息為存在相似電子郵件,則向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,並接收用戶的選擇,以及將用戶的選擇結果輸出到所述執行單元;選擇單元,接收所述問詢單元輸出的用戶的選擇結果,若用戶選擇對相似電子郵件進行相同的操作,則選定與該郵件屬於同一相似類的所有郵件;所述執行單元,接收上述問詢單元的輸出結果,以及所述選擇單元的選擇結果,並根據用戶初始選擇的操作內容,對所述被選擇的所有同一相似類的電子郵件進行該操作。
優選地,若所述執行單元進行的操作為刪除操作,則所述問詢單元詢問用戶是否刪除該分類郵件夾中的所有同類郵件,並接收用戶的選擇,若用戶選擇是,則執行單元刪除所述選擇單元選擇的所有屬於同一相似類的郵件;若所述執行單元接收的操作選擇是對該分類文件夾中的被選擇郵件進行移動操作,並且所述問詢單元輸出的用戶選擇結果為需要對相似電子郵件進行相同的操作,則所述執行單元對所述選擇單元選擇的屬於同一相似類的郵件進行移動操作,並且將被移動的電子郵件在新的分類郵件夾中以時間順序排序。
優選地,該裝置還包括學習單元;若所述執行單元的操作為將郵件從垃圾郵件夾移動到其他郵件夾,則該學習單元將所有被移動郵件的發件人加入白名單;若所述執行單元的操作為將郵件移入垃圾郵件夾或刪除,則該學習單元將所有被刪除郵件的發件人加入黑名單。
本發明的基本思路是,利用相似性分析技術,根據電子郵件的相似性,將郵箱的各分類電子郵件夾中的郵件分為若干相似類,當用戶對某一個電子郵件進行操作時,則自動提示用戶是否對於該電子郵件的相似郵件作同樣的操作。當用戶選擇「是」時,可以將用戶對一個初始郵件的操作加之於該電子郵件的相似郵件。
由於電子郵件,特別是垃圾電子郵件具有重複發送以及內容重複的特點,用戶往往需要進行同樣的操作處理,本發明提供的方法和裝置提供的處理機制,根據郵件之間的相似性,自動提取需要進行相同操作的電子郵件,用戶無需自己進行判斷,從而達到簡化用戶操作,為用戶節省時間。
圖1是本發明第一實施例的流程圖;圖2是本發明第二實施例的結構框圖。
具體實施例方式
請參看圖1,為本發明第一實施例的流程圖。
步驟101,分別對用戶郵箱中各個分類郵件夾的郵件進行相似性分類。
用戶郵箱一般具有多個分類郵件夾,每個分類郵件夾用於存放一種類型的郵件。對於本發明而言,較重要的是垃圾郵件夾和收件夾。大多數郵箱都首先將接收的郵件放入收件夾,垃圾郵件夾則用於存放垃圾郵件。所述的垃圾郵件可以由用戶從其他郵件夾中進行刪除操作後進入垃圾郵件夾,或者用戶將其他郵件夾的郵件直接移動到垃圾郵件夾;也可以是該用戶郵箱根據所設置的過濾條件,在接收郵件時直接放入垃圾郵件夾的郵件。
對於上述各個分類郵件夾中的郵件,首先進行相似性分類。對於相似性分類這一過程而言,每個分類郵件夾的郵件組成一個郵件樣本庫。在一個分類郵件夾中,被判定為相似的郵件組成一類,成為相似類。進行上述分類後,郵件夾中的郵件將以相似性為標準分為若干相似類,每一類的文件相互之間為相似的文件。為了便於識別相似類,本實施例為每一個電子郵件設置相似屬性標誌,同一相似類的電子郵件具有相同的相似屬性標誌。當然,也可以通過設置專用的相似類列表並結合指針,進行相似類的標示。現有技術下也存在許多其他的方法,對相似的郵件進行標記以便識別,不論採用何種方法,只要便於後續的相似性歸類即可。
為了便於後續操作,本實施例還對每個相似類的郵件數進行計數。
進行上述相似性分類,實際是根據文本進行相似匹配,通常是全文匹配,具體的匹配部分包括發件人,收件人,郵件主題,郵件正文等內容。現有技術已經提供了多種比較成熟的相似度分析算法。主要包括編輯距離(Edit distance)算法。編輯距離來源於英文字之間的相似度計算,比如在計算「abcd」和「aecd」時,按照經典的編輯距離計算editDist(abcd,aecd)=1。此時,相似度可以按照如下方法計算simedit(x,y)=11+editDist(x,y)]]>由於漢字的特點並不能直接利用編輯距離,但如果我們把漢字當作字母看待,把文本當作一串漢字看待的時候則可以利用編輯距離計算相似度。該種算法的優點是計算簡單,帶入了字之間的順序信息;缺點是計算數值容易受到某些因素幹擾,如偶然插入的幹擾詞彙。
覆蓋率計算方法。如果我們簡單的將一個詞在某個文本中出現標記為1,未出現標記為0,則兩個文本之間的距離可以用覆蓋率來表示。此時用兩個文本之間共享的詞的個數除以共有的詞的個數就可以獲得一個最基本的覆蓋率信息。同樣,我們也可以很容易的將將詞頻信息帶入覆蓋率計算,這就是大量衍生的覆蓋率算法。該方法的優點是計算方法簡單,一般>0.5級就可認為相似。
餘弦(COSINE)距離算法。此種方法採用的不再是具體出現次數,而是詞在文本內的權重信息等,比如,出現概率,TF/IDF等等以及大量衍生的計算公式。此方法需要計算兩個文本向量之間的餘弦角。角度越小則表示這兩個文本越接近。該種方法的優點是計算簡單,缺點是由於計算過程中一般要求全部文本集合固定,這樣勢必要隨時更新某些數值。對於頻繁出現新文本的郵件環境來說,需要考慮如何有效地更新這些信息。
詞頻.反向文本頻率(TF.IDF)類方法。TF(Term frequency)tfi,j為wi在文本dj中出現的次數;DF(Document frequency)dfi為包含wi的所有文本個數;CF(Collection frequency)cfi為wi在所有文本中出現的總數;IDF(Inversedocument frequency);採用上述定義後,採用某種方法將TF/DF/CF值組織成某種權重公式,就是TF.IDF方法。這類方法計算公式變化多端,包含有數量眾多的衍生公式,其優點是簡單有效,應用廣泛;其缺點是需要大量文本來獲得較好的效果,但這種缺點剛好和垃圾郵件的特點吻合。
採用上述算法的一種或幾種,都可以較好的實現對每個分類郵件夾中的郵件的分類。
步驟S102,用戶郵箱接收發送到本郵箱的郵件,若有新郵件,則將該郵件放入相應的分類郵件夾。
所述郵箱具體可以是郵件客戶端軟體郵箱,如採用Outlook Express或者Foxmail等郵件客戶端軟體設置的電子郵箱,也可以是採用網頁郵箱(Webmail)方式的電子郵箱。不論何種郵箱,一般都為用戶提供了防範垃圾郵件的功能。用戶可以利用這些功能進行相應的設置,例如設置過濾條件,對所接收的郵件進行過濾,根據過濾條件將一些接收的郵件判斷為垃圾郵件,並直接存入垃圾郵件夾,其他正常郵件則存放入收件夾。
伴隨著垃圾郵件的迅速增加,現有技術提供了多種過濾垃圾郵件的技術措施。目前,至少有8-10種以上基本的郵件過濾方法,用於單獨或被組合過濾垃圾郵件。其中,一些垃圾郵件過濾技術簡單地使用是或否來明確定義垃圾郵件,而另一些過濾技術使用打分規則來評判一個郵件接近於垃圾郵件的程度。現有技術下,無論採用何種垃圾郵件過濾技術,都不可避免的存在對垃圾郵件的誤判或漏判,需要採取進一步的措施將誤判或漏判的郵件放入合適的郵件夾。
步驟S103,將所接收的郵件與相應郵件夾中已經存放的郵件進行比較,進行相似性歸類。
由於收件夾或者垃圾郵件夾中的郵件,已經進行了相似性分類,所有的郵件中被判定為相似的郵件屬於同一相似類。對於新接收的郵件,可以與已經存在的各類的郵件中的典型郵件進行相似性比較,以便快速判斷其所屬的相似性類別。如果該郵件與一相似性分類的郵件相似,則將該郵件歸入該類,同時該相似類的計數值加1;如果該新郵件與任何已經存在的相似性分類都不相似,則該郵件可以作為一個單獨的相似性分類,並將相似性分類的計數值設為1;上述過程成為相似性歸類。經過相似性歸類,使郵件夾的每一個郵件都和與其相似的郵件屬於一類,也就是使相似的郵件產生了關聯。
步驟S104,接收用戶對某個文件夾中的文件的操作。
所述用戶對某個文件夾中的文件進行操作,包括將電子郵件在郵箱的各個文件夾之間進行移動;刪除電子郵件;改變電子郵件的屬性等等。
步驟S105,判斷被操作的電子郵件的相似郵件計數值是否為1。若是,則進入步驟S109;若否,則進入步驟S106由於為每相似郵件類的電子郵件均進行了計數,因此,讀取該計數值可以判斷與被操作的電子郵件屬於同類的相似郵件的數量,並根據該數量進行相應的選擇。若所述計數值為1,則不存在與該被操作的電子郵件同類的郵件,因此無需向用戶詢問是否需要對相似郵件進行同樣的操作,若所述計數值不為1,則說明存在與該郵件相似的郵件,需要向用戶詢問是否需要對與該被操作郵件相似郵件進行同樣的操作。
步驟S106,自動選擇所有與被操作郵件相似的郵件。
上述選擇的過程,具體而言,就是選中所有與該郵件屬於同一相似類的郵件。由於本實施例為屬於同一相似類的郵件設置了相同的相似屬性標誌,因此,實際只需尋找在該分類郵件夾中,與該郵件具有相同的相似屬性標誌的郵件。由於對每一個相似類的郵件數設置了計數,因此,可以使用該計數值校核是否選中了所有相似郵件。
步驟S107,詢問是否對該分類郵件夾中的所有相似郵件執行相同的操作。接收用戶的選擇,並判斷選擇內容。若用戶選擇是,則進入步驟S108;若用戶選擇否,則進入步驟S109。
步驟S108,對所有與所述被操作郵件相似的郵件進行相同的操作。
該步驟的內容具體而言,就是將步驟S104中用戶對選定郵件進行的操作,對步驟S106中選擇的所有郵件進行。由於目前的許多電子郵件具有重複性、相似性,對於相似的電子郵件自動進行相同的操作,可以節約用戶大量時間。尤其是對於大量不斷重發和複製的垃圾郵件,該步驟可以使用戶快速的進行刪除,不需要將所有郵件打開進行判斷。
步驟S109,判斷所進行的操作是否為刪除郵件(或者向垃圾郵件箱移動)。若是,則進入步驟S110;若否,則進入步驟S112。
在目前的各類電子郵箱中,對於需要刪除的郵件,一般設有垃圾郵件箱,在其他分類郵件箱中刪除郵件,實際上是將郵件移入垃圾郵件箱。也可以直接將其他郵件箱的郵件移入垃圾郵件箱,與刪除郵件的效果相同。如果在垃圾郵件箱中刪除郵件,則是將郵件徹底刪除。當然,也可以直接將郵件從普通的分類郵件夾中徹底刪除。為了應對垃圾郵件的侵擾,可以利用已經確定的垃圾郵件的信息,為以後過濾垃圾郵件提供信息。目前,為垃圾郵件設立黑名單是一種常用的手段。所謂黑名單,實質上是記錄用戶過濾垃圾郵件的攔截列表,郵件客戶端或者webmail會自動攔截進入黑名單的發件人發出的信件。在本實施例中,由於前述操作為刪除操作,則應當考慮被刪除郵件的發件人是否屬於需要用戶希望阻止的發件人,並將此信息反映到黑名單中,以便郵箱在以後接收郵件時直接過濾該發信人的郵件。
步驟S110,詢問用戶是否將該郵件的發件人加入黑名單,並接收用戶的選擇;若用戶選擇否,則進入步驟S115;若用戶選擇是,則進入步驟S111。
步驟S111,將該操作所針對的郵件的發件人添加到黑名單中,然後跳轉到步驟S115。
所述概操作所針對的郵件,具體是指用戶最初操作針對的郵件,以及步驟S108中,進行相同操作的所有相似郵件步驟S112,判斷所進行的操作是否為恢復被刪除的郵件;若是,則進入步驟S113;若否,則進入步驟S115。
為了避免用戶郵箱的自動過濾功能出現錯誤,還設置有白名單,該名單記錄用戶可信任發件人列表,郵件客戶端或者webmail會自動放行白名單中發件人發出的郵件。如果上述操作是從垃圾郵件箱恢復被刪除的郵件,則說明用戶郵箱的自動過濾功能錯誤的將可信任的發件人的郵件作為垃圾郵件處理,為避免以後出現此種情況,應當根據該操作,將郵件的發件人加入白名單,避免以後再次出現錯誤。
步驟S113,詢問用戶是否將郵件的發件人加入白名單,並接收用戶的選擇。若是,則進入步驟S114;若否,則進入步驟S115。
所述的郵件包括用戶最初操作的郵件,也包括步驟S108中進行了相同操作的其他相似郵件。
步驟S114,將該郵件的發件人加入白名單。
步驟S115,操作結束。
以上實施例說明了一種對電子郵件進行操作的方法。該方法可以根據郵件的相似性,將用戶對某個分類郵件夾中某個郵件的操作實施於所有與其相似的郵件上,從而簡化用戶對電子郵件的操作,為用戶節省時間。該實施例提供的方法,尤其適用於用戶針對垃圾郵件的處理。這是由於垃圾郵件之間具有很多相似的特點,易於被歸為相似類,從而通過本實施例的方法簡化操作。
以下第二實施例說明一種對電子郵件進行簡化操作的裝置,該裝置能夠完成上述第一實施例所述的操作方法。
該第二實施例提供的裝置包括相似性分類單元201、相似性歸類單元202、相似郵件計數器203、執行單元204、查詢單元205、問詢單元206、選擇單元207、學習單元208。
該裝置應用於至少具有垃圾郵件夾和其他至少一個分類郵件夾的郵箱環境中,並且本實施例中,該郵件項具有白名單和黑名單。所謂白名單,是記錄用戶可信任發件人的列表,,郵件客戶端或者webmail會自動放行白名單中發件人發出的郵件,避免將該郵件過濾到垃圾郵件。所謂黑名單,是記錄用戶過濾的垃圾郵件的發件人的攔截列表,郵件客戶端或者webmail會自動攔截進入黑名單的發件人發出的信件。
請參看圖2,該圖示出本發明第二實施例的結構框圖。
所述相似性分類單元201,用於讀取電子郵件樣本,並根據一定的相似性判斷策略進行相似性分類,對於屬於同一相似類的電子郵件,設置同樣的電子郵件的相似屬性標記。在本實施例中,所述電子郵件樣本為用戶郵箱的某一分類郵件夾中的所有文件。該相似性分類單元讀取一個分類郵件夾的電子郵件後,將各個電子郵件的文本互相之間作比較,將判定為相似的郵件加上相同的相似屬性標記,從而使一組相互之間具有相似性的郵件形成一個相似類。也可以採用為各相似類建立列表,記錄各個相似類的所有的相似電子郵件。通過上述過程,該分類郵件夾中的所有郵件將被分為若干個相似類。對於存在多封郵件的一個相似類,可以選擇其中一個郵件作為該類的典型郵件。以所述的分類郵件夾為垃圾郵件夾為例,該相似性分類單元將垃圾郵件夾的所有郵件作為垃圾郵件的樣本進行讀取並分類,通過這一分類將有助於對垃圾郵件的識別篩選。所述的相似性判斷的具體計算方法可以採用現有技術下進行文本分析的各種方法,例如第一實施例所提及的幾種方法中的一種或幾種。
所述相似郵件計數器203,對應於所述相似性分類單元201分類後獲得的相似類,用於記錄每個相似類包括的電子郵件數。
所述執行單元204,用於接收用戶輸入的操作內容,以及用戶選擇作為操作對象的初始電子郵件,並據此進行操作。該執行單元204還用於接收所述問詢單元206輸出的用戶對是否將該操作加之於相似電子郵件的選擇結果(圖2中的用戶選擇1),當該選擇結果為「是」時,則進一步接收選擇單元207選擇的與所述初始電子郵件相似的所有電子郵件,將其作為操作對象,並進行與所述初始電子郵件相同的操作。該執行單元204接收的用戶操作內容主要包括對文件的刪除、移動以及改變文件的屬性等。
所述查詢單元205,用於接收用戶選擇的初始電子郵件,並根據該電子郵件的相似屬性標記以及與該電子郵件對應的相似類的相似郵件計數器203,判斷是否存在與該電子郵件相似的其他電子郵件,並將查詢結果輸出。
所述問詢單元206,用於接收所述查詢單元輸出的是否存在相似電子郵件的信息,若為存在相似的電子郵件,則通過產生對話窗口等方式,向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,並接收用戶的選擇信息,以及將用戶的選擇輸出到所述選擇單元和執行單元。若不存在相似電子郵件,則不進行所述詢問。所述問詢單元206還用於接收學習單元208輸出的詢問是否要將電子郵件的發件人加入黑名單或白名單的詢問請求,並向用戶進行詢問;該單元接收用戶的選擇,並將選擇內容(圖2中用戶選擇2)輸出到所述學習單元208。
所述選擇單元207,用於接收所述問詢單元206輸出的用戶的選擇結果(圖2中示為用戶選擇1),若用戶選擇對相似電子郵件進行相同的操作,則選定與該郵件屬於同一相似類的所有郵件,並將選擇結果輸出到執行單元204和學習單元208。具體的選擇標準,可以根據所述用戶初始操作涉及的電子郵件的相似屬性標記,查詢該分類郵件夾中其他具有相同相似屬性標記的郵件。當然,如果相似郵件根據相似類建立了列表,則可以直接查詢列表,獲得所有的相似電子郵件。
所述學習單元208,用於獲取所述執行單元204的操作內容,若操作內容為刪除電子郵件,則向所述問詢單元206發出是否將該電子郵件的發件人加入黑名單的問詢請求,並接收所述問詢單元輸出的用戶選擇內容(圖2中用戶選擇2);若用戶選擇是,則學習單元將所有被操作電子郵件的發件人加入黑名單。與其相似,若操作內容為從垃圾郵件夾移動電子郵件到其他郵件夾,則向所述問詢單元發出是否將該電子郵件的發件人加入白名單的問詢請求,並接收所述問詢單元輸出的用戶選擇內容(圖2中用戶選擇2);若用戶選擇是,則學習單元將所有被操作電子郵件的發件人加入白名單。當用戶選擇將郵件發件人添加到黑名單或白名單時,該單元同樣對所有相似電子郵件做同樣的處理。
所述相似性歸類單元202,用於將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類,同時將該相似類對應的相似郵件計數器加1;如果未發現與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類,並設置相應的相似郵件計數器,並設該計數器的初始值為1。
以下說明使用上述裝置簡化電子郵件操作的過程。
例如,若所述執行單元204進行的操作為對某個初始郵件的刪除操作,並且所述查詢單元205查詢獲知該初始郵件具有相似電子郵件時,則所述問詢單元205詢問用戶是否刪除該分類郵件夾中的所有同類郵件,並接受用戶的選擇;若用戶選擇是,則執行單元204刪除所述選擇單元207選擇的所有屬於同一相似類的郵件,並進一步詢問是否將被刪除郵件的發件人加入黑名單。由於垃圾郵件具有內容重複性的特點,上述操作可以一次性刪除所有重複的郵件,避免人工檢核。
再如,若所述執行單元204接收的操作選擇是對該分類文件夾中的被選擇郵件進行移動操作,並且所述問詢單元206輸出的用戶選擇結果為需要對相似電子郵件進行相同的操作,則所述執行單元204對所述選擇單元207選擇的相似電子郵件進行移動操作,並且被移動的電子郵件在新的分類郵件夾中以時間順序排序。
本實施例提供的裝置,能夠在相似性分析基礎上,簡化用戶的操作,達到為用戶節省時間的目的,特別適用於處理垃圾郵件。
以上所述僅是本發明的優選實施方式,應當指出,對於本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護範圍。
權利要求
1.一種簡化電子郵件操作的方法,其特徵在於,包括11)對某個用戶郵箱分類郵件夾的所有郵件進行相似性分類,即將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件進行的操作;13)根據用戶請求,對該分類郵件夾中與所述被操作的郵件屬於同一相似類的其他郵件進行同樣的操作處理。
2.根據權利要求1所述的簡化電子郵件操作的方法,其特徵在於,所述步驟11)與12)之間包括21)用戶郵箱接收發送到本郵箱的新郵件,並將該郵件放入相應的分類郵件夾;22)將所接收的郵件與相應的分類郵件夾中已經存放的郵件比較,根據比較結果進行相似性歸類,即將該郵件歸入與其相似的相似類;若該郵件無法歸入任何已存在的相似類,則為該郵件設置新的相似類。
3.根據權利要求2所述的簡化電子郵件操作的方法,其特徵在於,所述步驟11)中對已存在的郵件進行相似性分類後,對屬於一個相似類的郵件計數;所述步驟22)之後,若對於進入該分類郵件夾的所述新郵件判定為屬於某個已經存在的相似類,則將該類的計數值加1;若該新郵件不屬於任何一個該郵件夾中已存在的相似類,則為該郵件設置新的相似類的同時,為該新設置的相似類計數。
4.根據權利要求1或2所述的簡化電子郵件操作方法,其特徵在於,所述的相似性分類和相似性歸類中,對於相似的判定,是根據郵件文本進行相似匹配計算,根據計算結果判定文本是否相似;所述相似匹配計算可以採用編輯距離算法、覆蓋率計算、餘弦距離算法、詞頻、反向文本頻率類方法。
5.根據權利要求1所述的簡化電子郵件操作方法,其特徵在於,所述步驟13)包括;51)詢問是否需要對該郵件夾中的相似郵件作相同的操作,接收用戶的選擇;若選擇是,則進入步驟52);若選擇否,則結束操作;52)選定屬於同一相似類的其他郵件;53)對上述選定的郵件進行所述相同的操作。
6.根據權利要求5所述的簡化電子郵件操作方法,其特徵在於,若所述步驟12)中的用戶對該郵件夾的郵件的操作為刪除,則步驟51)詢問是否要刪除該郵件夾中的同類郵件,若是,則步驟53)所述的操作為刪除操作;若所述步驟12)中的用戶對該郵件夾的郵件的操作為移動操作,則步驟51)詢問是否要對該郵件夾中的同類郵件進行相同的移動,若是,則步驟53)中所述的操作為移動操作,並且在移動後的文件夾中,所有被移動的電子郵件在新的分類郵件夾中以時間順序排序。
7.根據權利要求1所述的簡化電子郵件操作的方法,其特徵在於,所述步驟13)後還包括,若所述操作為將郵件從垃圾郵件夾移動到其他郵件夾,則將所有被操作郵件的發件人加入白名單;若所述操作為將郵件移入垃圾郵件夾或直接刪除,則將所有被操作郵件的發件人加入黑名單。
8.一種簡化電子郵件操作的裝置,其特徵在於,包括相似性分類單元,用於讀取電子郵件樣本,並根據一定的相似性判斷策略進行相似性分類,將相似的郵件分為一個相似類;所述電子郵件樣本為用戶郵箱的某一分類文件夾中的所有文件;執行單元,用於接收用戶輸入的操作內容,以及用戶選擇的作為操作對象的初始電子郵件,並據此進行操作;若所述操作對象具有相似電子郵件時,根據用戶的選擇,對相似的電子郵件進行相同的操作。
9.根據權利要求8所述的簡化電子郵件操作的裝置,其特徵在於,包括相似性歸類單元,用於將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類;如果未發現與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類。
10.根據權利要求8或9所述的簡化電子郵件操作的裝置,其特徵在於,對應於每一個相似類設置有相似郵件計數器,用於記錄該相似類的郵件數。
11.根據權利要求8或9所述的簡化電子郵件操作的裝置,其特徵在於,所述的相似性分類單元和相似性歸類單元,對於相似的判定,是根據郵件文本進行相似匹配計算,根據計算結果判定文本是否相似;所述相似匹配計算可以採用編輯距離算法、覆蓋率計算、餘弦距離算法、詞頻.反向文本頻率類方法。
12.根據權利要求8或9所述的簡化電子郵件操作的裝置,其特徵在於,還包括查詢單元,用於接收用戶選擇的初始電子郵件,並據此查詢對應於該電子郵件的相似郵件計數器,獲得該初始電子郵件是否存在相似電子郵件的信息,並輸出該信息;問詢單元,用於接收所述查詢單元輸出的初始電子郵件是否存在相似郵件的信息,若該信息為存在相似電子郵件,則向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,並接收用戶的選擇,以及將用戶的選擇結果輸出到所述執行單元;選擇單元,接收所述問詢單元輸出的用戶的選擇結果,若用戶選擇對相似電子郵件進行相同的操作,則選定與該郵件屬於同一相似類的所有郵件;所述執行單元,接收上述問詢單元的輸出結果,以及所述選擇單元的選擇結果,並根據用戶初始選擇的操作內容,對所述被選擇的所有同一相似類的電子郵件進行該操作。
13.根據權利要求12所述的簡化電子郵件操作的裝置,其特徵在於,若所述執行單元進行的操作為刪除操作,則所述問詢單元詢問用戶是否刪除該分類郵件夾中的所有同類郵件,並接收用戶的選擇,若用戶選擇是,則執行單元刪除所述選擇單元選擇的所有屬於同一相似類的郵件;若所述執行單元接收的操作選擇是對該分類文件夾中的被選擇郵件進行移動操作,並且所述問詢單元輸出的用戶選擇結果為需要對相似電子郵件進行相同的操作,則所述執行單元對所述選擇單元選擇的屬於同一相似類的郵件進行移動操作,並且將被移動的電子郵件在新的分類郵件夾中以時間順序排序。
14.根據權利要求8所述的簡化電子郵件操作的裝置,其特徵在於,還包括學習單元;若所述執行單元的操作為將郵件從垃圾郵件夾移動到其他郵件夾,則該學習單元將所有被移動郵件的發件人加入白名單;若所述執行單元的操作為將郵件移入垃圾郵件夾或刪除,則該學習單元將所有被刪除郵件的發件人加入黑名單。
全文摘要
本發明公開一種簡化電子郵件操作的方法,包括11)對某個用戶郵箱分類郵件夾的所有郵件進行相似性分類,將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件的操作;13)根據用戶請求,對該分類郵件夾中與所述被操作的郵件屬於同一相似類的其他郵件進行同樣的操作。本發明同時公開一種簡化電子郵件操作的裝置,包括相似性分類單元,用於進行相似性分類,將相似的郵件分為一個相似類;執行單元,用於接收用戶輸入的操作內容,以及用戶選擇的作為操作對象的初始電子郵件,並據此進行操作;若所述操作對象具有相似電子郵件時,根據用戶的選擇,對相似的電子郵件進行相同的操作。本發明以相似性歸類的方法,簡化電子郵件操作過程。
文檔編號H04L12/54GK101068217SQ20061008708
公開日2007年11月7日 申請日期2006年6月16日 優先權日2006年6月16日
發明者母天石 申請人:騰訊科技(深圳)有限公司