一種網絡視頻的識別方法及其設備的製作方法
2023-10-11 10:31:59 1
專利名稱:一種網絡視頻的識別方法及其設備的製作方法
技術領域:
本發明涉及一種應用識別技術,尤其涉及一種網絡視頻的識別方法及其設備。
背景技術:
網絡視頻是指由網絡視頻服務商提供的,以流媒體為播放格式的、可以在線直播或點播的聲像文件。應用層網絡流控設備可以通過識別網絡視頻的類型,進行有選擇性的監控。然而, 現有技術中的網絡視頻識別技術只針對視頻所屬的網站進行識別,無法做到更深層次的識另IJ,例如對網絡視頻所屬類型,或者網絡視頻所屬的名稱進行識別。因此網絡流控設備對於網絡視頻的監控受到很大的限制
發明內容
本發明要解決的技術問題是,用一種識別精度高的方式識別網絡視頻連結,從而更深層次的提取網絡視頻的元信息,例如網絡視頻的類型或者名稱。解決上述技術問題,本發明一方面提供了一種網絡視頻的識別方法,該方法包括以下步驟接收HTTP請求報文;識別HTTP請求報文中的網絡視頻連結;如果識別成功,則解析HTTP請求報文,提取網絡視頻元信息。本發明第二方面提供了一種網絡視頻的識別設備。該設備包括接收單元,用於接收HTTP請求報文;識別單元,用於識別HTTP請求報文中的網絡視頻連結;解析單元,用於解析HTTP請求報文,提取網絡視頻元信息。本發明通過籤名對HTTP請求報文進行解析的方式,更深層次的獲取了網絡視頻的元信息,包括網絡視頻的類型或者名稱,根據所獲取的網絡視頻的元信息對其進行有選擇性的管控。本發明識別精細度高、可實現性強,可作為網絡流控設備功能實現,可用於策略中的網絡應用控制,並可進行網絡應用時監控。
圖1為本發明實施例網絡視頻的識別方法及其設備的應用場景;圖2為本發明實施例網絡視頻的識別方法流程圖;圖3為本發明實施例網絡視頻的識別設備結構圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明的一部分實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其他實施例,都就屬於本發明保護的範圍。圖1為本發明實施例網絡視頻的識別方法及其設備的應用場景。如圖1所示,客戶端11通過網絡流控設備12訪問遠程伺服器13。伺服器13不斷監聽TCP的埠 80,以便發現客戶端向它發出連接建立請求。一旦監聽到連接建立請求並建立TCP連接之後,瀏覽器就向伺服器發出瀏覽某個頁面的HTTP請求報文,伺服器接著就返回所請求的頁面作為響應。最後,TCP連接就被釋放。瀏覽器和伺服器之間的請求和響應通過超文本傳送協議HTTP進行交互。網絡流控設備12轉發並監控客戶端11和伺服器13交互的信息,通過客戶端11 向伺服器13下發的HTTP請求報文中識別出網絡視頻信息,例如,網絡視頻的類型和名稱, 並進行有選擇性的管控。圖2為本發明實施例網絡視頻的識別方法流程圖。該方法包括步驟201-204。在步驟201,接收HTTP請求報文。具體地,當用戶通過客戶端的瀏覽器點擊某個網絡視頻的連結時,客戶端會通過網絡流控設備向網絡視頻伺服器發送HTTP請求報文,此時,網絡流控設備接收HTTP請求報文中有關網絡視頻的連結信息。在一個例子中,用戶在56視頻網點擊了名稱為「地道戰」的網絡視頻連結。此時, 客戶端通過網絡流控設備向網絡視頻伺服器發送的HTTP請求報文如下GET/ac/ac_102. xml ? cid2 = 2002&version = 10,1,102,64&id = 47406343&channel = 35&tag =,,,,&subject = e5% 9c% b0% e9% 81 % 93% e6% 88% 98 HTTP/1. 1HOST :acs. 56. comConnection :keep_alive 其中,HTTP請求報文中開始行的「 GET 」為請求方式,代表請求讀取由URL所標誌的信息。「/ac」是存儲ac_102.Xml文件的文件夾,是一個相對路徑,後面帶的是參數,其中參數「channel = 35」代表該網絡視頻所屬類型,例如,在56視頻網中35代表「電視劇」。參數「&subject = e5% 9c% b0% e9% 81% 93% e6% 88% 98」代表該網絡視頻的名稱, 上述編碼「 % e5% 9c % b0% e9% 81% 93% e6% 88% 98」代表的中文名稱為「地道戰」。 HTTP請求報文中首部行的「HOST :acs. 56. com」代表該網絡視頻所屬的主機域名,即網絡視頻的所屬網站56. com。在步驟202,識別HTTP請求報文中的網絡視頻連結。具體地,網絡流控設備設置有一個特徵庫,該特徵庫包括多個特徵,每個特徵代表一個網絡視頻連結信息。通過特徵庫中的特徵可以對HTTP請求報文中的網絡視頻連結進行識別。在一個例子中,特徵庫中的一條特徵名稱為「W0le_http_datal」的特徵,其特徵信息如下group wole.http-datal {
Cmd ("GET")
Match ("GET", "/ac", O, 1) Match ("HOST, ""56. COM", O, 1) RET(0x4BDl)
}上述特徵信息中,欄位「W0le_http_datal」代表特徵名稱。欄位Cmd ( 「GET」 )中 「GET」代表請求方式。欄位Match ( 「GET」,」/ac」,0,l)代表從偏移為0的位置開始,匹配 「GET」中的/ac,其中1代表以搜索形式。欄位Match( 「HOST,」」56. COM」,0,1)代表從偏移為0的位置開始,匹配HOST中的56. com,其中1代表以搜索的形式。RET(0x4BDl)代表特徵庫中設置的一個標記值,該標記值「0x4BDl」用於標示56. com視頻網。在步驟203,如果識別成功,則執行步驟204,否則跳至步驟201。具體地,網絡流控設備通過特徵庫中的特徵對在步驟201中獲取的HTTP請求報文進行識別,則如匹配成功,則執行步驟204。在一個例子中,以特徵庫名稱為「wole_http_datal」的特徵對在步驟201中獲取的HTTP請求報文進行識別,通過「wole_http_datal」特徵中欄位Cmd( 「GET」)匹配HTTP 請求報文中的請求方式「GET」。通過欄位Match( 「GET」,」/ac」,0,l)匹配HTTP請求報文中的文件夾路徑「GET/ac」。通過欄位Match ( 「HOST,」 「56. COM」,0,1)匹配主機域名「56. COM」。當以上三個欄位都匹配成功時,則HTTP請求報文成功識別為網絡視頻連結。步驟204,解析HTTP請求報文,提取網絡視頻元信息。具體地,當網絡流控設備成功識別HTTP請求報文屬於網絡視頻連結時,則通過籤名庫中簽名對該HTTP請求報文進行解析,提取網絡視頻元信息。其中提取網絡視頻元信息包括提取網絡視頻的名稱和網絡視頻的類型,或者提取網絡視頻的名稱、提取網絡視頻的類型,其中簽名庫是各個籤名的集合,每個籤名解析一個視頻網。在一個例子中,56視頻網對應的籤名如下group 56-name—ppl {
FILTER=0x4BDl,OFFSET=+
FIELD= "name" &SC (4),SS=
FIELD= "type" &SC (5),SS=&tag=" }在上述籤名中,欄位『『group 56_name_ppl」中『『56_name_ppl」代表籤名的名稱。欄位「FILTER = 0x4BD 1,OFFSET = + 」中「 4BD1 」是一個標記值,用於標記56視頻網,對應名稱為「W0le_http_datal」特徵中的標記值,當網絡視頻連結被識別為該標記值時,該籤名就會對該網絡視頻連結的HTTP請求報文中的GET頭進行解析。欄位FIELD ="name"&SC(4), SS ="&Subject =,,,ES = 「 」中的FIELD&channel =,,, ES = "&tag =,,代表以"&channel =,,開始,以"&tag =,,結束,中間的信息為視頻類型。在一個例子中,通過特徵庫名稱為「W0le_http_datal」的特徵已經識別了 HTTP 請求報文中的網絡視頻,其中名稱為「wo 1 e_http_datal,,的特徵的標記值為0x4BD 1,根據該標記值使用籤名庫中名稱為56_name_ppl的籤名對該HTTP請求報文進行解析,並從 HTTP請求報文中提取該網絡視頻的元信息。例如,通過56_name_ppl籤名的欄位FIELD ="name" &SC (4),SS = "&Subject = 」,ES = 「 」 提取 HTTP 請求報文中的視頻名稱為 「 % e5% 9c% b0% e9% 81% 93% e6% 88% 98」,其中文名稱是「地道戰」。通過欄位FIELD = 「type」&SC(5),SS = "&channel =,,,ES = "&tag =,,提取 HTTP 請求報文中的網絡視頻類型為35,在56視頻網,35代表網絡視頻類型為「電視劇」。網絡流控設備除了通過籤名的方式對HTTP請求報文解析外,還可以通過正則表達式對HTTP請求報文進行解析。網絡流控設備在提取網絡視頻的元信息後,可以對其進行相應的操作,例如將提取的信息,以日誌的形式輸出到網絡流控設備的界面中,或者可以根據提取的網絡視頻類型和網絡視頻名稱,對後續的視頻連結進行相應的管控措施,例如針對娛樂類的視頻,需要進行封堵,教育類的視頻可以允許播放。圖3為本發明實施例網絡視頻的識別設備結構圖。所圖所示,該設備包括接收單元31、識別單元32、和解析單元33。接收單元31用於接收HTTP請求報文。當用戶通過客戶端的瀏覽器點擊某個網絡視頻的連結時,客戶端會通過網絡流控設備向網絡視頻伺服器發送HTTP請求報文,此時, 該網絡視頻流識別備中的接收單元31接收HTTP請求報文中有關網絡視頻的連結信息。識別單元32用於識別該HTTP請求報文中的網絡視頻連結。 具體地,識別單元32通過特徵庫中的特徵識別由接收單元31接收的HTTP請求報文的網絡視頻連結,其中特徵中有一個標記值屬性,用於標示該網絡視頻連結。解析單元33用於解析HTTP請求報文,提取網絡視頻元信息。具體地,當識別單元32成功識別HTTP請求報文的網絡視頻連結時,則由解析單元 33通過籤名庫中的籤名解析該HTTP請求報文,提取網絡視頻元信息,其中提取網絡視頻元信息包括提取網絡視頻名稱和提取網絡視頻類型,或者只提取網絡視頻名稱、提取網絡視頻類型。本發明實施例網絡視頻的識別設備的接收單元31、識別單元32和解析單元33分別為了實現圖2中各個方法的相應流程,在此不再贅述。儘管已經示出並描述了本發明的特殊實施例,然而在不背離本發明的示例性實施例及其更寬廣方面的前提下,本領域技術人員顯然可以基於此處的教學做出變化和修改。因此,所附的權利要求意在將所有這類不背離本發明的示例性實施例的真實精神和範圍的變化和更改包含在其範圍之內。
權利要求
1.一種網絡視頻的識別方法,其特徵在於包括以下步驟接收HTTP請求報文;識別所述HTTP請求報文中的網絡視頻連結;如果識別成功,則解析所述HTTP請求報文,提取網絡視頻元信息。
2.根據權利要求1所述的方法,其特徵在於所述識別所述HTTP請求報文中的網絡視頻連結步驟包括通過特徵庫中的特徵識別所述HTTP請求報文中的網絡視頻連結。
3.根據權利要求2所述的方法,其特徵在於所述特徵中有一個標記值屬性,用於標示網絡視頻連結。
4.根據權利要求1所述的方法,其特徵在於所述解析所述HTTP請求報文,提取網絡視頻元信息步驟包括通過籤名庫中的籤名解析所述HTTP請求報文,提取網絡視頻元信息。
5.根據權利要求1或4所述的方法,其特徵在於所述提取網絡視頻元信息包括提取網絡視頻名稱和/或提取網絡視頻類型。
6.一種網絡視頻的識別設備,其特徵在於包括接收單元,用於接收HTTP請求報文;識別單元,用於識別所述HTTP請求報文中的網絡視頻連結;解析單元,用於解析所述HTTP請求報文,提取網絡視頻元信息。
7.根據權利要求6所述的設備,其特徵在於所述識別單元通過特徵庫中的特徵識別所述HTTP請求報文中的網絡視頻連結。
8.根據權利要求7所述的設備,其特徵在於所述特徵中有一個標記值屬性,用於標示網絡視頻連結。
9.根據權利要求6所述的設備,其特徵在於所述解析單元通過籤名庫中的籤名解析所述HTTP請求報文,提取網絡視頻元信息。
10.根據權利要求6或9所述的設備,其特徵在於所述提取網絡視頻元信息包括提取網絡視頻名稱和/或提取網絡視頻類型。
全文摘要
本發明公開了一種網絡視頻的識別方法及其設備。所述方法包括以下步驟接收HTTP請求報文;識別HTTP請求報文中的網絡視頻連結;如果識別成功,則解析HTTP請求報文,提取網絡視頻元信息。所述設備包括接收單元,用於接收HTTP請求報文;識別單元,用於識別HTTP請求報文中的網絡視頻連結;解析單元,用於解析HTTP請求報文,提取網絡視頻元信息。本發明識別精細度高、可實現性強,可作為網絡流控設備功能實現,並可進行網絡應用時監控。
文檔編號H04N21/434GK102325270SQ201110269390
公開日2012年1月18日 申請日期2011年9月13日 優先權日2011年9月13日
發明者崔淵博, 洪婷婷, 陳振昌, 齊曉璐 申請人:北京網康科技有限公司