對內容分類的方法及系統的製作方法
2023-07-21 02:05:06 1
專利名稱:對內容分類的方法及系統的製作方法
技術領域:
本發明涉及網絡及通信領域,特別是涉及對內容分類的方法及系統。
背景技術:
隨著網絡技術和各項信息技術的飛速發展,用戶所能接觸到的內容逐漸脫 離時間和空間的限制,用戶暴露在色情、暴力、病毒等一系列不健康和對客戶 端有威脅的內容面前的機率大大增加,於是對通信內容過濾的需求越來越強
烈。現有的過濾技術包括名單過濾技術、關鍵詞過濾技術、模板過濾技術、 分類過濾技術等,其中基於分類的內容過濾技術由於其使用靈活和適應性廣泛 而成為研究的熱點。另一方面,自動文摘技術已經發展了 50年左右,與其相 關的基礎技術(如自動分詞)也經歷了長期的發展並形成了一些實用系統, 尤其是西文自動文摘發展已經比較成熟。同時視頻摘要技術的研究和成果也日 新月異,越來越成熟。
參見圖l所示,目前基於分類的內容過濾框架從結構上主要分為2個部分 內容過濾單元和內容分類單元。內容分類單元提供一個接口 CBCS-l,內容分 類請求方(包括框架內部的內容過濾單元,以及外部的其他請求者)均可以 通過此接口獲取待分類內容的內容類別。內容分類請求方可輸入的參數包括 內容本身或內容標識(如URI)和/或其他與內容相關信息(如內容所有者)。
參見圖2所示,目前內容分類請求方獲取待分類內容的內容類別的過程, 包括下列步驟
1.內容分類請求方確定使用內容本身去請求內容類別,如情況一,內 容分類請求方為內容過濾單元,其收到的內容過濾請求中只帶有內容本身,而 沒有其他內容標識和預分類信息;情況二,內容分類請求方為內容過濾單元,其收到的內容過濾請求中的內容為預分類內容,^f旦其預分類信息不可信^f壬且沒
有其他內容標識;情況三,內容分類請求方為內容過濾單元,其收到的內容過 濾請求中帶有內容本身和內容標識,但是內容分類提供方(內容分類單元)無 法提供其內容標識對應的類別信息;情況四,內容提供商作為內容分類請求方 僅僅是為了請求類別,以生成預分類內容,供其提供的內容在以後被請求時使 用該類別信息;情況五,內容分類請求方為內容過濾單元,其收到的內容過濾 請求中帶有內容本身和內容標識,由於內容過濾單元設置成不支持以內容標識 去獲取類別的模式,從而直接使用內容本身去請求內容類別。
2. 內容分類請求方構造內容類別請求消息,並向內容分類提供方發送該 消息,其中攜帶了內容本身。
3. 內容分類提供方從內容類別請求消息中提取出內容本身,並對內容本 身採用適當的算法進行分類。
4. 內容分類提供方構造響應消息,向內容分類請求方返回內容類別。 在輸入l^t中,直接體現該內容的只有內容本身和內容對應的URI。 URI
不一定總是能獲取,同時對於該URI對應的內容類別,內容分類提供方不一定 能提供(如未保存在內容分類單元中或者內容分類單元未能從外部獲取得到 對應的內容類別),這時內容分類請求方只能直接向內容分類提供方提供內容 本身,而內容本身可能很大,需要承載在一個內容類別請求消息拆分成的多個 數據包中,這時不僅需要內容分類提供方從該請求消息中解析出待分類的內 容,而且需要大量緩存、重組內容,最後再根據分類算法進行分類處理。
發明人在發明過程中發現,現有技術中,內容分類請求方在請求內容類別 時提供給內容分類提供方的信息中,直接體現該信息的輸入參數只有內容本身 和URI兩種。在向內容分類提供方提供內容本身時,缺乏一個高效的處理方式, 不僅加重內容分類提供方分類處理的負荷,同時加大網絡傳輸流量,特別是對 於外部實體通過CBCS-1接口請求內容類別的情況。
發明內容
本發明實施例提供了 一種請求內容分類的方法,以減小網絡傳輸流量。 本發明實施例還提供了 一種內容分類的方法,以減小內容分類處理的負荷。
本發明實施例還提供了對內容分類的方法及系統,以減小內容分類處理的 負荷和網絡傳輸流量。
本發明實施例的一種請求內容分類的方法,包括以下步驟內容分類請求 方獲得待分類內容的內容摘要,生成內容類別請求消息,並在所述的內容類別 請求消息中攜帶所述的內容摘要;內容分類請求方將攜帶有所述內容摘要的內
容類別請求消息發出,請求內容類別。
本發明實施例的一種內容分類的方法,包括以下步驟內容分類提供方收 到內容類別請求消息,所述的內容類別請求消息中攜帶有待分類內容的內容摘
本發明實施例的對內容分類的方法包括內容分類請求方發送待分類內容 的內容摘要給內容分類提供方;內容分類提供方根據所述內容摘要進行內容分 類。
本發明實施例的內容分類請求系統,包括摘要操作判斷單元,用於判斷 是否需要獲得待分類內容的內容摘要;摘要獲得單元,用於在摘要操作判斷單 元判定需要獲得待分類內容的內容摘要時,獲得該待分類內容的內容摘要;第 一發送單元,用於將摘要獲得單元獲得的內容摘要發出。
本發明實施例的內容分類的系統,包括內容分類請求方一側和內容分類 提供方一側;所述內容分類請求方一側包括內容分類請求裝置,其中進一步 包括摘要操作判斷單元,用於判斷是否需要獲得待分類內容的內容摘要;摘 要獲得單元,用於在摘要操作判斷單元判定需要獲得待分類內容的內容摘要 時,獲得該待分類內容的內容摘要;第一發送單元,用於將摘要獲得單元獲得 的內容摘要發出;所述內容分類提供方一側包括內容分類提供裝置,用於根據內容分類請求裝置發來的所述內容摘要進行內容分類。
本發明實施例中,內容分類請求方發送待分類內容的內容摘要給內容分類
提供方;內容分類提供方根據所述內容摘要進行內容分類。
由於本發明實施例以待分類內容的內容摘要向內容分類提供方請求內容 類別,而所述內容摘要又遠遠小於內容本身,所以減小了內容分類處理的負荷 和網絡傳輸流量。
圖1為現有基於分類的內容過濾框架示意圖2為現有內容分類請求方獲取待分類內容的內容類別的流程圖3為本發明實施例的方法步驟流程圖4為本發明實施例的內容分類請求系統結構示意圖5為本發明實施例1的應用場景示意圖6為本發明實施例2的應用場景示意圖7為本發明實施例3的應用場景示意圖8為本發明實施例3的流程圖9為本發明實施例4的應用場景示意圖10為本發明實施例4的流程圖。
具體實施例方式
為了減小網絡傳輸流量,本發明實施例提供了 一種請求內容分類的方法, 包括下列步驟內容分類請求方獲得待分類內容的內容摘要,生成內容類別請 求消息,並在所述的內容類別請求消息中攜帶所述的內容摘要;內容分類請求 方將攜帶有所述內容摘要的內容類別請求消息發出,請求內容類別。
其中,內容分類請求方在確定需以待分類內容的內容本身請求內容類別 時,再判斷是否需要獲得待分類內容的內容摘要。並且內容分類請求方判定需要獲得所述待分類內容的內容摘要時,再獲得內容摘要。
為了減小內容分類處理的負荷,本發明實施例提供了 一種內容分類的方
法,包括以下步驟內容分類提供方收到內容類別請求消息,所述的內容類別 請求消息中攜帶有待分類內容的內容摘要;內容分類提供方根據所述的內容摘 要對所述的待分類內容進行內容分類。
為了減小內容分類處理的負荷和網絡傳輸流量。
本發明實施例提供了一種對內容分類的方法,參見圖3所示,包括下列步
驟
51. 內容分類請求方確定使用待分類內容的內容本身去請求內容類別。(可 選步驟)
52. 內容分類請求方判斷是否需要獲得待分類內容的內容摘要。
內容分類請求方可判斷待分類內容的數據大小是否大於閾值,和/或待分類 內容的數據格式是否為預設數據格式之一,和/或用戶是否指定。這裡闊值、預 設數據格式和用戶指定為是否獲得內容摘要並且在後續的內容類別請求消息 中攜帶內容摘要的判斷依據。對於不同的數據格式(所述數據格式是指文本、 圖片、音頻、視頻、多媒體甚至具體的格式(如視頻的rm、 avi、 mpeg等格式)) 均可以設置不同的閾值,也可採用相同的閾值。
如果判斷結果為是,則轉入步驟S3;否則轉入步驟S6。
53. 內容分類請求方獲得該待分類內容的內容摘要。
內容摘要準確全面地反映待分類內容的主要信息,且遠遠小於待分類內容 的數據大小。所述獲得該待分類內容的內容摘要可以包括從其他實體中獲取所 述待分類內容的內容摘要,例如內容分類請求方將待分類內容發送給獨立其外 的摘要處理伺服器,由摘要處理伺服器進行摘要操作判斷,並生成滿足摘要獲 得條件的待分類內容的內容摘要,以及將該內容摘要返回給內容分類請求方; 此外,也可以由內容類別請求方自身生成待分類內容的內容摘要,所述生成內 容摘要的過程,例如文本的摘要可以是現有的自動文摘技術的輸出,圖片的摘要可以是經轉換釆用其他格式、整體尺寸縮小但呈現畫面相同的圖片(如
1024*768 2.4M的BMP格式圖片可以轉換成133*100 13k的GIF格式圖片), 視頻的摘要是現有的視頻摘要技術的輸出。
54. 內容分類請求方構造內容類別請求消息,並向內容分類提供方發送該 消息。該消息中攜帶了上述步驟獲得的內容摘要。
在另外的實施例中,內容分類請求方還可以指示內容分類提供方,以內容 摘要對應的算法對所述內容摘要進行內容分類。具體可以為通過在內容類別請 求消息中攜帶類型信息,或者進一步攜帶摘要相關信息(如摘要獲得單元標 識、數據大小、獲得時間、使用的摘要生成算法等)、以及內容本身相關信息 (內容提供者(這裡是外部的內容過濾單元)標識、數據大小、創建時間等), 以告知內容分類提供方本消息中攜帶的內容為內容摘要。
55. 內容分類提供方從內容類別請求消息中提取出內容摘要,並對內容摘 要進行分類。之後,轉入步驟S8。
在上述另外的實施例中,當內容分類請求方發送的內容類別請求消息中攜 帶類型信息時,內容分類提供方根據所述的類型信息確定內容分類請求方發送 的是內容摘要時,採取內容摘要相應的算法對所述的內容摘要進行內容分類。
56. 內容分類請求方以該待分類內容的內容本身構造內容類別請求消息, 並向內容分類提供方發送該消息。該消息中攜帶了待分類內容的內容本身。
在實際應用中,內容分類請求方還可以指示內容分類提供方,以內容本身 對應的算法對所述內容本身進行內容分類。具體可以為通過在內容類別請求消 息中攜帶類型信息,以告知內容分類提供方本消息中攜帶的內容為內容本身。
57. 內容分類提供方從內容類別請求消息中提取出內容本身,並對內容本 身進行分類。
當內容分類請求方發送的內容類別請求消息中攜帶類型信息時,內容分類 提供方根據所述的類型信息確定內容分類請求方發送的是內容本身時,採取內 容本身相應的算法對所述的內容摘要進行內容分類。S8.內容分類提供方構造響應消息,向內容分類請求方返回內容類別。 需要說明的是,現有技術中,在內容分類請求方為CBCS的內容過濾單元
時,實際處理中可以先緩存收到的內容,待接收完成後再將其以CBCS-1接
口內容分類請求的格式進行組包並發送,也可以接收、緩存的同時組包、發送。
本發明實施例中,若需要生成內容摘要,則需要全部接收、緩存內容本身再依
據緩存的內容生成內容摘要。
本發明實施例還提供了一種內容分類請求系統,參見圖4所示,包括摘
要操作判斷單元、摘要獲得單元和第一發送單元;進一步還包括第二發送單
元、第一指示單元和第二指示單元。
摘要操作判斷單元,用於判斷是否需要獲得待分類內容的內容摘要。 摘要獲得單元,用於在摘要操作判斷單元判定需要獲得待分類內容的內容
摘要時,獲得該待分類內容的內容摘要。
第一發送單元,用於將摘要獲得單元獲得的內容摘要發出。 第一指示單元,用於通過第一發送單元指示內容分類提供方,以內容摘要
對應的算法對所述內容摘要進行內容分類。
第二發送單元,用於在摘要操作判斷單元判定不需要獲得待分類內容的內 容摘要時,將待分類內容的內容本身發出。
第二指示單元,用於通過第二發送單元指示內容分類提供方,以內容本身 對應的算法對所述內容本身進行內容分類。
本發明實施例還提了一種內容分類系統,包括內容分類請求方一側和內 容分類提供方一側。
內容分類請求方一側又包括內容分類請求裝置(即本發明實施例的內容 分類請求裝置);進一步還包括內容提供裝置。
內容提供裝置,其中進一步包括內容提供單元,用於提供待分類內容; 確定單元,用於判斷內容提供單元是否需提供待分類內容的內容本身,當確定 需提供待分類內容的內容本身時,觸發所述內容分類請求裝置;第三發送單元,用於在獲知摘要操作判斷單元判定不需要獲得待分類內容的內容摘要時,將待
分類內容的內容本身發到內容分類提供裝置;第三指示單元,用於通過第三發 送單元指示內容分類提供裝置,以內容本身對應的算法對所述內容本身進行內 容分類。
內容分類請求裝置,其中進一步包括摘要操作判斷單元,用於判斷是否 需要獲得待分類內容的內容摘要;摘要獲得單元,用於在摘要操作判斷單元判 定需要荻得待分類內容的內容摘要時,獲得該待分類內容的內容摘要;第一發 送單元,用於將摘要獲得單元荻得的內容摘要發出;第一指示單元,用於通過 第 一發送單元指示內容分類提供裝置,以內容摘要對應的算法對所述內容摘要 進行內容分類;第二發送單元(與內容提供裝置中的第三發送單元不同時存 在),用於在摘要操作判斷單元判定不需要獲得待分類內容的內容摘要時,將 待分類內容的內容本身發到內容分類提供裝置;第二指示單元(與內容提供裝 置中的第三指示單元不同時存在),用於通過第二發送單元指示內容分類提供 裝置,以內容本身對應的算法對所述內容本身進行內容分類。
所述內容分類提供方一側包括內容分類提供裝置,用於根據內容分類請 求裝置發來的所述內容摘要進行內容分類。
以下通過4個實施例具體描述。
實施例l:對待過濾的內容進行內容分類並過濾。
參見圖5所示,本實施例應用場景由內容分類單元(即內容分類提供裝置) 和內容過濾單元(其內含有內容提供裝置和內容分類請求裝置)構成。
本實施例具體處理流程如下內容過濾單元收到來自外部內容過濾請求者 的內容過濾請求,其內容是photo.jpg。內容過濾單元通過確定單元判定該內容 過濾請求中攜帶的只有內容本身,沒有類別信息,於是確定需要使用內容本身 去請求內容類別。內容過濾單元通過其中的內容提供單元將內容本身提供給摘 要操作判斷單元。摘要操作判斷單元預設的圖片內容的摘要生成閾值為 500KB,內容過濾單元通過其中的摘要操作判斷單元檢測到photo.jpg的大小為2.71MB,大於該閾值,於是內容過濾單元中的摘要獲得單元依據內容的類型和 大小,採用直接全圖整體縮小為原圖10%的算法生成摘要photol.jpg,其大小 為26KB。內容過濾單元通過其中的第一發送單元將photol.jpg封裝在內容類 別請求消息中,並通過CBCS-1接口發送給內容分類單元,該消息中還可以通 過第一指示單元攜帶類型信息,以告知內容分類單元本消息中攜帶的內容為摘 要,以及摘要相關信息(如摘要獲得單元標識、數據大小、生成時間、使用 的摘要生成算法等)、以及內容本身相關信息(內容提供者(這裡是外部的內 容過濾單元)標識、數據大小、創建時間等)。
類型信息的攜帶具體依賴於CBCS-1接口的實現,例如可以作為一個參數 攜帶
Abstract <!—用於指示內容類型,其值為image see original document page 14
又例如直接從內容格式上體現image see original document page 14 內容分類單元根據告知的類型信息,對photol.jpg採用針對數據格式為 JPG且類型為內容摘要的圖像分類算法進行分類處理後,將得到的內容類別返 回給內容過濾單元。
本實施例在實際部署時,可能有多種情況,如1)內容分類單元和內容 過濾單元作為一個伺服器部署;2)內容過濾單元作為一個單獨的伺服器A, 內容分類單元和其它內容過濾單元一起作為伺服器B, A通過CBCS-1接口向 B的內容分類單元獲取內容類別;3)單個內容過濾單元作為伺服器C,單個 內容分類單元作為伺服器D,根據實際情況一個C對應多個D、 一個D對應多個C或多個C對應多個D。
實施例2:對待過濾的內容進行內容分類並過濾。
參見圖6所示,本實施例應用場景由內容分類單元(即內容分類提供裝置) 和內容過濾單元(其內含有內容提供裝置和內容分類請求裝置)構成。.
本實施例具體處理流程如下內容過濾單元收到來自外部內容過濾請求者 的內容過濾請求,其內容是novel.txt。內容過濾單元通過確定單元判定內容過 濾請求中攜帶有預分類信息,於是對該預分類信息進行信任驗證,結果被確認 為分類信息不可信,據此確定需要使用內容本身去請求內容類別。內容過濾單 元通過其中的內容提供單元將內容本身提供給摘要操作判斷單元。摘要操作判 斷單元預設的文本內容的摘要生成閾值為500KB,內容過濾單元通過其中的摘 要操作判斷子單元檢測到novd.txt的大小為783KB,大於該閾值,於是內容過 濾單元中的摘要獲得單元使用自動文摘技術生成6KB的摘要。內容過濾單元 通過其中的第一發送單元將6KB的摘要封裝在內容類別請求消息中,並通過 CBCS-1接口發送給內容分類單元。內容分類單元對上述摘要採用適當的算法 進行分類處理後,將得到的內容類別返回給內容過濾單元。
本實施例在實際部署時,可能有多種情況,如1)內容分類單元和內容 過濾單元作為一個伺服器部署;2)內容過濾單元作為一個單獨的伺服器A, 內容分類單元和其它內容過濾單元一起作為伺服器B, A通過CBCS-1接口向 B的內容分類單元請求內容類別;3)單個內容過濾單元作為伺服器C,單個 內容分類單元作為伺服器D,根據實際情況一個C對應多個D、 一個D對應 多個C或多個C對應多個D。
實施例3:內容提供單元向終端用戶提供內容,為了使其提供的內容能夠 在內容過濾單元快速過濾,內容提供單元事先(無實時性)獲取內容類別,並 以元數據或水印的形式將其附加在內容中,從而生成預分類內容供用戶下載, 這樣在實時性要求較高時,內容過濾單元可以直接依據預分類內容中預置的內 容類別進行快速過濾。參見圖7所示,本實施例的應用場景由內容分類請求方一側的內容分類請 求裝置和內容提供裝置,內容分類提供方一側的內容分類單元(內容分類提供 裝置),以及在內容分類完成之後,直接根據預分類內容的內容類別進行過濾 的內容過濾單元組成。
參見圖8所示,本實施例具體處理流程如下
1、 內容提供裝置對於自身提供的未分類的內容需要獲取內容類別,以生 成預分類內容,於是內容提供裝置通過其中的內容提供單元將內容本身(可能 還帶有數據大小、數據類型、內容提供單元地址等其它信息)提供給內容分類 請求裝置中的摘要操作判斷單元。
2、 摘要操作判斷單元根據其收到內容的數據大小進行判斷,若其大小大 於預先設定的閾值,則轉入步驟3;否則轉入步驟6。
3、 摘要操作判斷單元將該內容本身發送給摘要獲得單元。
4、 摘要獲得單元根據收到的內容生成摘要,將摘要(可攜帶數據大小、 數據類型、內容提供單元地址)發送給第一發送單元。
5、 第一發送單元將該摘要封裝在內容類別請求消息中,還可通過第一指 示單元在該消息中攜帶類型信息,以告知內容分類單元本消息中攜帶的內容為 摘要;之後將該內容類別請求消息發送給內容分類單元。並轉入步驟8。
6、 摘要操作判斷單元將該內容本身發送給通過第二發送單元。
7、 第二發送單元將內容本身封裝在內容類別請求消息中,還可通過第二 指示單元在該消息中攜帶類型信息,以告知內容分類單元本消息中攜帶有內容 本身;之後將該內容類別請求消息發送給內容分類單元。
8、 內容分類單元從收到的內容類別請求消息中提取摘要或內容本身,並 根據告知的類型信息以相應的算法進行分類處理。
9、 內容分類單元將得到的內容類別返回給內容提供裝置中的內容提供單元。
在具體實現中,例如內容提供裝置有時長為26: 26的一段視頻需要分類,於是將其數據大小、數據類型和存放內容的內存地址發送給物理上位於同 一實體的摘要操作判斷單元。摘要操作判斷單元將其數據大小和數據類型(視 頻)對應的閾值進行比較,因其大小大於預先設定的視頻類數據閾值,摘要操 作判斷單元根據收到的內存地址讀出內容,並將內容、內容提供裝置的地址、 數據類型、數據大小等信息發送給同位於一個機房的由運營商提供的摘要獲得
單元。摘要獲得單元選擇視頻適用的算法生成時長為6: 48(壓縮比達3.89: 1) 的摘要。摘要獲得單元將摘要、內容提供裝置的地址發送給內容分類單元處理 (可選的發送所"R交內容的類型信息為摘要)。內容分類單元分類完成後將內 容類別返回給內容提供裝置。
實際部署中,上述單元可以分屬兩大塊,即提供內容的內容提供商,以及 運營商或過濾服務提供商。作為運營商,提供網際網路M入、通信網^#入等 網絡接入服務,同時運營商自己經營內容過濾服務。另外還可以作為獨立的過 濾服務提供商為運營商提供內容過濾服務。考慮摘要的可信度,摘要獲得單元 只可能在運營商或過濾服務提供商。
可能實際使用模式i)內容提供裝置屬於內容提供商,其餘單元屬於運營 商或過濾服務提供商,其中摘要操作判斷單元和摘要獲得單元可以直接組成摘 要伺服器,並鄰近內容提供商同時享有高帶寬;ii)內容提供裝置和摘要操作 判斷單元均屬於內容提供商,其餘單元屬於運營商或過濾服務提供商,摘要獲 得單元鄰近內容提供裝置、同時享有高帶寬,內容提供商的摘要操作判斷單元 保存了和運營商/過濾服務提供商協商確定的閾值(可以由運營商/過濾服務提 供商提供說明閾值的腳本文件,供摘要操作判斷單元讀取、執行)。如果內容 提供裝置和摘要伺服器(摘要操作判斷單元和摘要獲得單元)/摘要獲得單元一 一對應,且內容分類單元保存有摘要伺服器/摘要獲得單元對應的內容提供裝置 的地址,則無需攜帶內容提供裝置的地址,否則需要在消息中攜帶內容提供裝 置的地址。
實施例4:內容提供單元向終端用戶提供內容,為了使其提供的內容能夠在內容過濾單元快速過濾,內容提供單元事先(無實時性)獲取內容類別,並 以元數據或水印的形式將其附加在內容中,從而生成預分類內容供用戶下載, 這樣在實時性要求較高時,內容過濾單元可以直接依據預分類內容中預置的內 容類別進行快速過濾。參見圖9所示,本實施例的應用場景由內容分類請求方一側的內容分類請 求裝置和內容提供裝置,內容分類提供方一側的內容分類單元(內容分類提供 裝置),以及在內容分類完成之後,直接根據預分類內容的內容類別進行過濾 的內容過濾單元組成。參見圖10所示,本實施例具體處理流程如下1、 內容提供裝置對於自身提供的未分類的內容需要獲取內容類別,以生 成預分類內容,於是內容提供裝置通過其中的內容提供單元將該未分類內容的 數據大小(可能還帶有數據類型、內容提供單元地址等其它信息)提供給內容 分類請求裝置中的摘要操作判斷單元。2、 摘要操作判斷單元將該未分類內容的數據大小與預先設定的闊值進行 比較,並將比較結果告知內容提供單元。比較結果為該未分類內容的數據大小 大於預先設定的閾值,則轉入步驟3;否則轉入步驟6。3、 內容提供單元將該未分類內容的內容本身發送給內容分類請求裝置中 的摘要獲得單元。4、 摘要獲得單元根據收到的內容生成摘要,將摘要(可攜帶數據大小、 數據類型、內容提供單元地址)發送給第一發送單元。5、 第一發送單元將該摘要封裝在內容類別請求消息中,還可通過第一指 示單元在該消息中攜帶類型信息,以告知內容分類單元本消息中攜帶的內容為 摘要以及內容摘要相關信息又及依據的內容本身相關信息;之後將該內容類別 請求消息發送給內容分類單元。並轉入步驟8。6、 內容提供單元將該未分類內容的內容本身發送給內容提供裝置中的第 三發送單元。7、 第三發送單元將內容本身封裝在內容類別請求消息中,還可通過內容 提供裝置中的第三指示單元在該消息中攜帶類型信息,以告知內容分類單元本 消息中攜帶有內容本身以及內容本身相關信息;之後將該內容類別請求消息發 送給內容分類單元。8、 內容分類單元從收到的內容類別請求消息中提取摘要或內容本身,並 才艮據告知的類型信息以相應的算法進行分類處理。9、 內容分類單元將得到的內容類別返回給內容提供裝置中的內容提供單元。在具體實現中,例如內容提供裝置有時長為26: 26的一段視頻需要分 類,於是將其數據大小、數據類型發送給運營商的摘要操作判斷單元,摘要操 作判斷單元將其數據大小和數據類型(視頻)對應的閾值進行比較,因其大小 大於預先設定的視頻類數據閾值,摘要操作判斷單元通知內容提供裝置將內容 發送到摘要獲得單元並帶有其地址。內容提供裝置將內容發送給同位於一個機 房的由運營商提供的摘要獲得單元,摘要獲得單元選擇4見頻適用的算法生成時 長為6: 48(壓縮比達3.89: 1)的摘要,摘要獲得單元將摘要和內容提供裝置 的地址發送給內容分類單元處理(可選的發送所提交分類的內容的類型為摘 要)。內容分類單元分類完成後將內容類別返回給內^4是供裝置。實際部署中,上述單元可以分屬兩大塊前者為內容提供商,提供內容; 後者為運營商或過濾服務提供商。作為運營商,提供網際網路接入、通信網絡 接入等網絡接入服務,同時運營商自己經營內容過濾服務。另外還可以作為獨 立的過濾服務提供商為運營商提供內容過濾服務。考慮摘要的可信度,摘要獲 得單元只可能在運營商或過濾服務提供商。可能實際使用模式i)內容提供裝置屬於內容提供商,其餘單元屬於運營 商或過濾服務提供商,其中摘要操作判斷單元和摘要獲得單元可以直接組成摘 要伺服器,並鄰近內容提供商同時享有高帶寬,也可以僅由摘要獲得單元組成 摘要伺服器,並鄰近內容提供商同時享有高帶寬;ii)內容提供裝置和摘要操作判斷單元均屬於內容提供商,其餘單元屬於運營商或過濾服務提供商,摘要 獲得單元鄰近內容提供裝置、同時享有高帶寬,內容提供商的摘要操作判斷單 元保存了和運營商/過濾服務提供商協商確定的閾值(可以由運營商/過濾服務 提供商提供說明閾值的腳本文件,供摘要操作判斷單元讀取、執行)。如果內一一對應,且內容分類單元保存有摘要伺服器/摘要獲得單元對應的內容提供裝 置的地址,則無需攜帶內容提供裝置的地址,否則需要在消息中攜帶內容提供 裝置的地址。綜上所述,本發明實施例中,內容分類請求方判定待分類內容的數據大小 大於閾值時(也可根據待分類內容的數據格式是否為預設數據格式之一,和/ 或用戶是否指定來判定),生成該待分類內容的內容摘要,並且以生成的內容 摘要向內容分類提供方請求內容類別。所以本發明實施例擴充了用於向內容分 類單元提供的直接體現該內容的輸入參數,通過大大減小供分類操作的內容數 據,為內敘艮大時提供了一個高效的處理方式,不僅能減輕內容分類單元處理 的負荷,同時能有效降低網絡傳輸流量,特別有利於外部實體請求類別信息的 情況。進一步,還可在將待分類內容的數據大小與閾值比較之前,先確定是否需以內容本身來獲取內容類別,這樣可以兼容現有的以其它輸入參數(如URI) 來獲取內容類別的方案,達到更好的效果。進一步,還可通過類型信息告知內容分類提供方,本次內容類別請求消息 中攜帶的是內容摘要還是內容本身,從而可以使內容分類提供方以最為匹配的 算法進行分類處理,達到更好的效果。進一步,對於流媒體等無法實時分類的業務,以及視頻、多媒體、聲音、 圖片、大文檔等實時分類困難的媒體的過濾特別有好處。明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明權利要求及20其等同技術的範圍之內,則本發明也意圖包含這些改動和變型在內。
權利要求
1、一種請求內容分類的方法,其特徵在於,包括下列步驟內容分類請求方獲得待分類內容的內容摘要,生成內容類別請求消息,並在所述的內容類別請求消息中攜帶所述的內容摘要;內容分類請求方將攜帶有所述內容摘要的內容類別請求消息發出,以該內容摘要請求內容類別。
2、 如權利要求1所述的方法,其特徵在於,內容分類請求方判定需要獲 得所述待分類內容的內容摘要時,再獲得內容摘要。
3、 如權利要求2所述的方法,其特徵在於,內容分類請求方在確定需以 待分類內容的內容本身請求內容類別時,再判斷是否需要獲得待分類內容的內 容摘要。
4、 一種內容分類的方法,其特徵在於,包括以下步驟內容分類提供方收到內容類別請求消息,所述的內容類別請求消息中攜帶 有待分類內容的內容摘要;內容分類提供方根據所述的內容摘要對所述的待分類內容進行內容分類。
5、 一種對內容分類的方法,其特徵在於,包括下列步驟內容分類請求方發送待分類內容的內容摘要給內容分類提供方; 內容分類提供方根據所述內容摘要進行內容分類。
6、 如權利要求5所述的方法,其特徵在於,內容分類請求方判定需要獲 得待分類內容的內容摘要時,獲得內容摘要,並將該內容摘要發送給內容分類 提供方。
7、 如權利要求6所述的方法,其特徵在於,內容分類請求方在確定需以 待分類內容的內容本身請求內容類別時,再判斷是否需要獲得待分類內容的內 容摘要。
8、 如權利要求6或7所述的方法,其特徵在於,所述待分類內容的數據 大小大於閾值時,和/或所述待分類內容的數據格式為預設數據格式之一,和/或用戶指定時,內容分類請求方判定需要獲得待分類內容的內容摘要。
9、 如權利要求8所述的方法,其特徵在於,內容分類請求方判定不需要 獲得待分類內容的內容摘要時,將該待分類內容的內容本身發送給內容分類提 供方;以及內容分類提供方根據所述內容本身進行內容分類。
10、 如權利要求5、 6或7所述的方法,其特徵在於,內容分類請求方還 指示內容分類提供方,以內容摘要對應的算法對所述內容摘要進行內容分類。
11、 如權利要求10所述的方法,其特徵在於,內容分類請求方通過向內 容分類提供方發送的內容類別請求消息攜帶待分類內容的內容摘要;該內容類別請求消息中還攜帶有與內容摘要對應的類型信息;以及 內容分類提供方根據所述內容類別請求消息中攜帶的所述類型信息,以相 應的算法對該消息中攜帶的內容摘要進行內容分類。
12、 如權利要求9所述的方法,其特徵在於,內容分類請求方還指示內容 分類提供方,以內容本身對應的算法對所述內容本身進行內容分類。
13、 如權利要求12所述的方法,其特徵在於,內容分類請求方通過向內 容分類提供方發送的內容類別請求消息攜帶待分類內容的內容本身;該內容類別請求消息中還攜帶有與內容本身對應的類型信息;以及 內容分類提供方根據所述內容類別請求消息中攜帶的所述類型信息,以相 應的算法對該消息中攜帶的內容本身進行內容分類。
14、 如權利要求8所述的方法,其特徵在於,對應所述待分類內容的不同 數據格式,設置各不相同的閾值;或者對應所述待分類內容的不同數據格式設 置相同的閾值。
15、 一種內容分類請求系統,其特徵在於,包括 摘要操作判斷單元,用於判斷是否需要獲得待分類內容的內容摘要; 摘要獲得單元,用於在摘要操作判斷單元判定需要獲得待分類內容的內容摘要時,獲得該待分類內容的內容摘要;第一發送單元,用於將摘要獲得單元獲得的內容摘要發出。
16、 如權利要求15所述的系統,其特徵在於,所述系統還包括 第二發送單元,用於在摘要操作判斷單元判定不需要獲得待分類內容的內容摘要時,將待分類內容的內容本身發出。
17、 如權利要求15所述的系統,其特徵在於,所述系統還包括 第一指示單元,用於通過第一發送單元指示內容分類提供方,以內容摘要對應的算法對所述內容摘要進行內容分類。
18、 如權利要求16所述的系統,其特徵在於,所述系統還包括 第二指示單元,用於通過第二發送單元指示內容分類提供方,以內容本身對應的算法對所述內容本身進行內容分類。
19、 一種內容分類的系統,其特徵在於,包括 內容分類請求方一側和內容分類^是供方一側; 所述內容分類請求方一側包括 內容分類請求裝置,其中進一步包括摘要操作判斷單元,用於判斷是否需要獲得待分類內容的內容摘要; 摘要獲得單元,用於在摘要操作判斷單元判定需要獲得待分類內容的內容摘要時,獲得該待分類內容的內容摘要;第一發送單元,用於將摘要獲得單元獲得的內容摘要發出; 所述內容分類提供方一側包括內容分類提供裝置,用於才艮據內容分類請求裝置發來的所述內容摘要進行內容分類。
20、 如權利要求19所述的系統,其特徵在於,所述內容分類請求方一側 還包括內M供裝置,其中進一步包括內容提供單元,用於提供待分類內 容。
21、 如權利要求20所述的系統,其特徵在於,所述內容提供裝置中還包括確定單元,用於判斷內容提供單元是否需提供待分類內容的內容本身,當 確定需提供待分類內容的內容本身時,觸發所述內容分類請求裝置。
22、 如權利要求19、 20或21所述的系統,其特徵在於,所述內容分類請 求裝置還包括第二發送單元,用於在摘要操作判斷單元判定不需要獲得待分 類內容的內容摘要時,將待分類內容的內容本身發到內容分類提供裝置。
23、 如權利要求19、 20或21所述的系統,其特徵在於,所述內容分類請 求裝置還包括第一指示單元,用於通過第一發送單元指示內容分類提供裝置, 以內容摘要對應的算法對所述內容摘要進行內容分類。
24、 如權利要求22所述的系統,其特徵在於,所述內容分類請求裝置還 包括第二指示單元,用於通過第二發送單元指示內容分類提供裝置,以內容本身對應的算法對所述內容本身進行內容分類。
25、 如權利要求19、 20或21所述的系統,其特徵在於,所述內容提供裝 置中還包括第三發送單元,用於在獲知摘要操作判斷單元判定不需要獲得待 分類內容的內容摘要時,將待分類內容的內容本身發到內容分類提供裝置。
26、 如權利要求25所述的系統,其特徵在於,所述內容提供裝置中還包 括第三指示單元,用於通過第三發送單元指示內容分類提供裝置,以內容本 身對應的算法對所述內容本身進行內容分類。
全文摘要
本發明公開了對內容分類的方法及系統,以減小內容分類處理的負荷和網絡傳輸流量。方法包括內容分類請求方發送待分類內容的內容摘要給內容分類提供方;內容分類提供方根據所述內容摘要進行內容分類。內容分類請求裝置,包括摘要操作判斷單元,用於判斷是否需要獲得待分類內容的內容摘要;摘要獲得單元,用於在摘要操作判斷單元判定需要獲得待分類內容的內容摘要時,獲得該待分類內容的內容摘要;第一發送單元,用於將摘要獲得單元獲得的內容摘要發出。
文檔編號G06F17/30GK101296155SQ20071009795
公開日2008年10月29日 申請日期2007年4月23日 優先權日2007年4月23日
發明者卓漢·祖依德維格, 錦 彭, 柴曉前 申請人:華為技術有限公司