新四季網

近似匹配方法和相關設備及通信系統與流程

2023-07-21 02:56:16 2


本發明涉及通信技術領域,具體涉及近似匹配方法和相關設備及通信系統。

背景技術:
當前,寬帶業務給運營商帶來機遇的同時也帶來了挑戰,運營商需要面對例如帶寬管理、內容計費、信息安全等一系列新的課題。其中,面對日益增長的業務流,深層包檢測(DPI,DeepPacketInspection)技術被認為是應對網絡多業務所帶來的管理和控制挑戰的有效方法。區域流量覆蓋是衡量DPI能力的重要指標。而隨著智慧型手機等智能終端的普及,應用數量出現井噴式增長。並且越來越多的應用(如Skype、Vbuzzer等應用)經常通過自動改變自身的流量特徵來逃避DPI廠商的檢測,包括行為特徵變種、二進位變化、混合流量、隨機長度添加等流量特徵改變方式。面對新應用產生的未知流量的挑戰,業界目前普遍採取捕獲現網流量+人工分析的方式進行分析。在對現有技術的研究和實踐過程中,本發明的發明人發現現有技術通常存在如下一些缺點:現有人工分析方式效率較低、響應速度較慢,難以及時滿足運營商對現網覆蓋率的要求,難以支撐新應用流量的分析和識別;精準度也難以滿足精細化業務需求。

技術實現要素:
本發明實施例提供近似匹配方法和相關設備及通信系統,以期待提高流量分析的效率和準確性。本發明第一方面提供一種近似匹配方法,可包括:獲取未知流量;按照N個維度分別計算所述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。結合第一方面,在第一種可能的實施方式中,所述按照N個維度分別計算所述未知流量與樣本流量的相似度包括:當基於深層包檢測技術未能識別出所述未知流量時,按照所述N個維度分別計算所述未知流量與樣本流量的相似度。結合第一方面或第一方面的第一種可能的實施方式,在第二種可能的實施方式中,所述按照N個維度分別計算所述未知流量與樣本流量的相似度,包括:執行如下相似度計算操作中的至少兩種:計算所述未知流量與樣本流量的報文長度的相似度、計算所述未知流量與樣本流量的報文負載內容的相似度、計算所述未知流量與樣本流量的報文埠號的相似度、計算所述未知流量與樣本流量的發包速率的相似度、計算所述未知流量與樣本流量的上行包數量的相似度、計算所述未知流量與樣本流量的下行包數量的相似度、計算所述未知流量與樣本流量的上下行包數量比值的相似度、計算所述未知流量與樣本流量的上行流量值的相似度、計算所述未知流量與樣本流量的下行流量值的相似度、計算所述未知流量與樣本流量的上下行流量值的比值的相似度、計算所述未知流量與樣本流量的前M個包的流量值的相似度。結合第一方面的第二種可能的實施方式,在第三種可能的實施方式中,所述計算所述未知流量與樣本流量的報文負載內容的相似度,包括:計算所述未知流量與樣本流量的報文負載內容的字符相似度;計算所述未知流量與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量不相同的字符數,除以所述樣本流量的報文負載內容的總字符數。結合第一方面的第二種可能的實施方式或第一方面的第三種可能的實施方式,在第四種可能的實施方式中,所述計算所述未知流量與樣本流量的報文長度的相似度,包括:將所述未知流量的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量與樣本流量的報文長度的相似度;或者,確定所述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量與樣本流量的報文長度的相似度。本發明第二方面提供一種近似匹配裝置,包括:獲取單元,用於獲取未知流量;相似度計算單元,用於按照N個維度,分別計算樣本流量與所述獲取單元獲取的所述未知流量與的相似度;對計算得到的各維度對應的相似度進行加權調,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,所述n1、n2、n3為正整數。結合第二方面,在第一種可能的實施方式中,所述相似度計算單元,具體用於當基於深層包檢測技術未能識別出所述未知流量時,按照N個維度分別計算所述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,所述n1、n2、n3為正整數。結合第二方面或第二方面的第一種可能的實施方式,在第二種可能的實施方式中,在所述按照所述N個維度分別計算所述未知流量與樣本流量的相似度的方面,所述相似度計算單元具體用於,執行如下相似度計算操作中的至少兩種:計算所述未知流量與樣本流量的報文長度的相似度、計算所述未知流量與樣本流量的報文負載內容的相似度、計算所述未知流量與樣本流量的報文埠號的相似度、計算所述未知流量與樣本流量的發包速率的相似度、計算所述未知流量與樣本流量的上行包數量的相似度、計算所述未知流量與樣本流量的下行包數量的相似度、計算所述未知流量與樣本流量的上下行包數量比值的相似度、計算所述未知流量與樣本流量的上行流量值的相似度、計算所述未知流量與樣本流量的下行流量值的相似度、計算所述未知流量與樣本流量的上下行流量值的比值的相似度、計算所述未知流量與樣本流量的前M個包的流量值的相似度,對計算得到的至少兩種的相似度進行加權調,以得到所述未知流量與樣本流量的匹配相似度。結合第二方面的第二種可能的實施方式,在第三種可能的實施方式中,在所述計算所述未知流量與樣本流量的報文負載內容的相似度的方面,所述相似度計算單元具體用於,計算所述未知流量與樣本流量的報文負載內容的字符相似度;計算所述未知流量與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量不相同的字符數,除以所述樣本流量的報文負載內容的總字符數。結合第二方面的第二種可能的實施方式,在第四種可能的實施方式中,在所述計算所述未知流量與樣本流量的報文長度的相似度的方面,所述相似度計算單元具體用於,將所述未知流量的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量與樣本流量的報文長度的相似度;或者,確定所述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量與樣本流量的報文長度的相似度。本發明第三方面提供一種流量分析伺服器,可包括:深層包檢測識別系統,用於獲取未知流量,基於深層包檢測技術對所述未知流量進行識別;近似匹配系統,用於當所述深層包檢測識別系統基於深層包檢測技術未能識別出所述未知流量時,按照N個維度分別計算所述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,所述n1、n2、n3為正整數。結合第三方面,在第一種可能的實施方式中,在所述按照N個維度分別計算所述未知流量與樣本流量的相似度的方面,所述近似匹配系統具體用於,執行如下相似度計算操作中的至少兩種:計算所述未知流量與樣本流量的報文長度的相似度、計算所述未知流量與樣本流量的報文負載內容的相似度、計算所述未知流量與樣本流量的報文埠號的相似度、計算所述未知流量與樣本流量的發包速率的相似度、計算所述未知流量與樣本流量的上行包數量的相似度、計算所述未知流量與樣本流量的下行包數量的相似度、計算所述未知流量與樣本流量的上下行包數量比值的相似度、計算所述未知流量與樣本流量的上行流量值的相似度、計算所述未知流量與樣本流量的下行流量值的相似度、計算所述未知流量與樣本流量的上下行流量值的比值的相似度、計算所述未知流量與樣本流量的前M個包的流量值的相似度。結合第三方面的第二種可能的實施方式,在第三種可能的實施方式中,在所述計算所述未知流量與樣本流量的報文負載內容的相似度的方面,所述近似匹配系統具體用於:計算所述未知流量與樣本流量的報文負載內容的字符相似度;計算所述未知流量與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量不相同的字符數,除以所述樣本流量的報文負載內容的總字符數;和/或,在所述計算所述未知流量與樣本流量的報文長度的相似度的方面,所述近似匹配系統具體用於:將所述未知流量的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量與樣本流量的報文長度的相似度;或者,確定所述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中所述第一長度區域對應的相似度值為所述未知流量與樣本流量的報文長度的相似度。本發明第四方面提供一種通信系統,可包括:通信網元和流量分析伺服器,其中,所述通信網元用於接收未知流量;所述流量分析伺服器用於,獲取所述通信網元接收的未知流量或者獲取所述通信網元接收的未知流量的鏡像,基於深層包檢測技術對所述未知流量或者所述未知流量的鏡像進行識別;當基於深層包檢測技術未能識別出所述未知流量或未知流量的鏡像時,按照N個維度分別計算所述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。結合第四方面,在第一種可能的實施方式中,在所述按照N個維度分別計算所述未知流量或所述未知流量的鏡像與樣本流量的相似度的方面,所述流量分析伺服器具體用於:執行如下相似度計算操作中的至少兩種:計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。結合第四方面的第一種可能的實施方式,在第二種可能的實施方式中,在所述計算所述未知流量或所述未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,所述流量分析伺服器具體用於:計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量或未知流量的鏡像不相同的字符數,除以所述樣本流量的報文負載內容的總字符數;和/或,在所述計算所述未知流量或所述未知流量的鏡像與樣本流量的報文長度的相似度的方面,所述流量分析伺服器具體用於:將所述未知流量或未知流量的鏡像的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定所述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。本發明第五方面提供一種通信系統,包括:通信網元和近似匹配伺服器,其中,所述通信網元用於接收未知流量,基於深層包檢測技術對所述未知流量進行識別,若未能識別出所述未知流量,向所述近似匹配伺服器發送未能識別出的所述未知流量或者所述未能識別出的所述未知流量的鏡像;所述近似匹配伺服器用於,接收來自所述通信網元的所述未能識別出的所述未知流量或所述未知流量的鏡像,按照N個維度分別計算所述未知流量或所述未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量或所述未知流量的鏡像與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,所述n1、n2、n3為正整數。結合第五方面,在第一種可能的實施方式中,在所述按照N個維度分別計算所述未知流量或所述未知流量的鏡像與樣本流量的相似度的方面,所述近似匹配伺服器具體用於,執行如下相似度計算操作中的至少兩種:計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。結合第五方面的第一種可能的實施方式,在第二種可能的實施方式中,在所述計算所述未知流量或所述未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,所述近似匹配伺服器具體用於,計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量或未知流量的鏡像不相同的字符數,除以所述樣本流量的報文負載內容的總字符數;和/或,在所述計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,所述近似匹配伺服器具體用於,將所述未知流量或未知流量的鏡像的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定所述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。本發明第六方面提供一種通信系統,可包括:通信網元和深層包檢測識別伺服器,其中,所述通信網元,用於接收未知流量;所述深層包檢測識別伺服器,用於獲取所述通信網元接收的未知流量或者獲取所述通信網元接收的未知流量的鏡像;基於深層包檢測技術對來自所述通信網元的所述未知流量或未知流量的鏡像進行識別,若未能識別出所述未知流量或未知流量的鏡像,向所述通信網元發送未能識別出的所述未知流量或所述未能識別出的所述未知流量的鏡像;所述通信網元還用於,接收來自所述深層包檢測識別伺服器的所述未能識別出的所述未知流量或所述未能識別出的所述未知流量的鏡像,按照N個維度分別計算所述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。結合第六方面,在第一種可能的實施方式中,在所述按照N個維度分別計算所述未知流量或未知流量的鏡像與樣本流量的相似度的方面,所述通信網元具體用於:執行如下相似度計算操作中的至少兩種:計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。結合第六方面的第一種可能的實施方式,在第二種可能的實施方式中,在所述計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,所述通信網元具體用於:計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量或未知流量的鏡像不相同的字符數,除以所述樣本流量的報文負載內容的總字符數;和/或,在所述計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,所述通信網元具體用於:將所述未知流量或未知流量的鏡像的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定所述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。本發明第七方面提供一種通信系統,可包括:通信網元、深層包檢測識別伺服器和近似匹配伺服器,其中,所述通信網元,用於接收未知流量;所述深層包檢測識別伺服器,用於獲取所述通信網元接收的未知流量或者獲取所述通信網元接收的未知流量的鏡像;基於深層包檢測技術對所述通信網元接收的所述未知流量或未知流量的鏡像進行識別,若未能識別出所述未知流量或未知流量的鏡像,向所述近似匹配伺服器發送所述未能識別出的所述未知流量或所述未能識別出的所述未知流量的鏡像;所述近似匹配伺服器用於,接收來自所述深層包檢測識別伺服器的所述未能識別出的所述未知流量或者所述未能識別出的所述未知流量的鏡像,按照N個維度分別計算所述未知流量或者未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述N為大於或等於2的整數,所述n1、n2、n3為正整數。結合第七方面,在第一種可能的實施方式中,在所述按照N個維度分別計算所述未知流量或未知流量的鏡像與樣本流量的相似度的方面,所述近似匹配伺服器具體用於:執行如下相似度計算操作中的至少兩種:計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算所述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。結合第七方面的第一種可能的實施方式,在第二種可能的實施方式中,在所述計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,所述近似匹配伺服器具體用於,計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量或未知流量的鏡像不相同的字符數,除以所述樣本流量的報文負載內容的總字符數;和/或,在所述計算所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,所述近似匹配伺服器具體用於:將所述未知流量或未知流量的鏡像的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定所述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,所述第一長度區域對應的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。本發明第八方面提供一種流量分析伺服器,所述流量分析伺服器包括:用於接收未知流量或未知流量的鏡像的接收器,與所述接收器耦合的近似識別引擎,以及用於發送所述未知流量或未知流量的鏡像或所述近似識別引擎輸出的所述未知流量或未知流量的鏡像與樣本流量的匹配相似度的發送器,其中,所述近似識別引擎為如上述實施例所述的近似匹配裝置。本發明第九方面提供一種通信網元,包括收發信機和與所述收發信機耦合的用於進行網絡通信的處理器,其特徵在於,所述通信設備還包括:與所述收發信機耦合的近似識別引擎,其中,所述近似識別引擎為如上述實施例所述的近似匹配裝置。由上可見,本發明一個實施例的方案中,在獲取未知流量後按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於本發明一個實施例提供了一種可利用流量分析設備來進行近似流量分析的機制,有利於提高流量分析的效率;由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本發明實施例提供的一種近似匹配方法的流程示意圖;圖2-a是本發明實施例提供的一種流量分析設備所處的網絡架構示意圖;圖2-b是本發明實施例提供的一種近似匹配系統和DPI識別系統的部署示意圖;圖2-c是本發明實施例提供的另一種近似匹配系統和DPI識別系統的部署示意圖;圖2-d是本發明實施例提供的另一種近似匹配系統和DPI識別系統的部署示意圖;圖3是本發明實施例提供的另一種流量分析方法的流程示意圖;圖4-a是本發明實施例提供的一種樣本流量的埠號分布的示意圖;圖4-b是本發明實施例提供的一種樣本流量的報文長度的分布示意圖;圖4-c是本發明實施例提供的另一種樣本流量的報文長度的分布示意圖;圖4-d是本發明實施例提供的一種樣本流量的發包速率的分布示意圖;圖4-e是本發明實施例提供的另一種樣本流量的發包速率的分布示意圖;圖5是本發明實施例提供的一種近似匹配伺服器的示意圖;圖6是本發明實施例提供的另一種近似匹配伺服器的示意圖;圖7是本發明實施例提供的一種通信系統的示意圖;圖8是本發明實施例提供的一種流量分析伺服器的示意圖;圖9是本發明實施例提供的另一種通信系統的示意圖;圖10是本發明實施例提供的另一種通信系統的示意圖;圖11是本發明實施例提供的另一種通信系統的示意圖;圖12是本發明實施例提供的另一種通信系統的示意圖;圖13是本發明實施例提供的另一種近似匹配伺服器的示意圖;圖14-a是本發明實施例提供的一種通信網元的示意圖;圖14-b是本發明實施例提供的另一種通信網元的示意圖;圖15-a是本發明實施例提供的一種流量識別伺服器的示意圖;圖15-b是本發明實施例提供的另一種流量識別伺服器的示意圖。具體實施方式本發明實施例提供近似匹配方法和相關設備及通信系統,以期待提高流量分析的效率和準確性。為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分的實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。以下分別進行詳細說明。本發明的說明書和權利要求書及上述附圖中的術語「第一」、「第二」、「第三」「第四」等(如果存在)是用於區別類似的對象,而不必用於描述特定的順序或先後次序。應該理解這樣使用的數據在適當情況下可以互換,以便這裡描述的本發明的實施例例如能夠以除了在這裡圖示或描述的那些以外的順序實施。此外,術語「包括」和「具有」以及他們的任何變形,意圖在於覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於這些過程、方法、產品或設備固有的其它步驟或單元。本發明近似匹配方法的一個實施例,一種近似匹配方法可包括:獲取未知流量;按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。參見圖1,圖1是本發明的一個實施例提供的一種近似匹配方法的流程示意圖,如圖1所示,本發明的一個實施例提供的一種近似匹配方法可包括以下內容:101、獲取未知流量。其中,用於實現近似匹配的設備或系統可從DPI伺服器或網元(網元例如可為基站、基站控制器、網關、伺服器等)獲取未知流量。102、按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。可以理解,上述未知流量與樣本流量的匹配相似度,等於對計算得到的各維度對應的相似度進行加權調和而得到的值,也就是說,匹配相似度是綜合N個維度對應的相似度的結果,匹配相似度有利於更客觀準確的反映未知流量與樣本流量的相似度。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量與樣本流量的相似度之前,可先基於DPI技術對獲取的未知流量進行識別,若基於DPI技術識別出了上述未知流量,則可輸出DPI技術的識別結果;在基於上述DPI技術未能識別出上述未知流量之後,才執行上述按照N個維度分別計算上述未知流量與樣本流量的相似度的步驟。在本發明的一些實施例中,若得到的樣本流量與上述未知流量的匹配相似度大於設定的相似度閾值,則流量分析設備可輸出未知流量與樣本流量的匹配成功的流量識別結果(其中,該流量識別結果例如可指示出上述未知流量與樣本流量的業務類型相同等,此時可按照樣本流量的業務類型所對應的套餐計費方式對上述未知流量進行計費。例如存在Fk1套餐業務,針對用戶所有訪問Fk1的流量免費,Fk1的外掛視頻流量和廣告流量單獨計費,其它業務場景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小於設定的相似度閾值,則流量分析設備可輸出未知流量與樣本流量的匹配失敗的流量識別結果。其中,可根據實際需要來選著用於識別的維度,針對不同的應用場景不同的精度要求,選擇的維度可能不盡相同。舉例來說,可以從下面舉例的幾個維度中選擇至少兩個維度來計算上述未知流量與樣本流量的相似度:報文負載內容、報文長度、報文埠號、發包速率、上行包數量、下行包數量、上下行包數量比值、上行流量值、下行流量值、上下行流量值的比值、前M個包的流量值等。當然,本發明實施例並不限於上述舉例的相似度比較維度,其它維度亦可引入。在本發明的一些實施例中,上述按照N個維度分別計算上述未知流量與樣本流量的相似度,包括:執行如下相似度計算操作中的至少兩種:計算上述未知流量與樣本流量的報文長度的相似度、計算上述未知流量與樣本流量的報文負載內容的相似度、計算上述未知流量與樣本流量的報文埠號的相似度、計算上述未知流量與樣本流量的發包速率的相似度、計算上述未知流量與樣本流量的上行包數量的相似度、計算上述未知流量與樣本流量的下行包數量的相似度、計算上述未知流量與樣本流量的上下行包數量比值的相似度、計算上述未知流量與樣本流量的上行流量值的相似度、計算上述未知流量與樣本流量的下行流量值的相似度、計算上述未知流量與樣本流量的上下行流量值的比值的相似度、計算上述未知流量與樣本流量的前M個包的流量值的相似度。在實際應用中,可採用符合本領域計算邏輯的多種方式,按照相應維度計算上述未知流量與樣本流量的相似度。例如,計算上述未知流量與樣本流量的報文負載內容的相似度可包括:計算上述未知流量與樣本流量的報文負載內容的字符相似度;計算上述未知流量與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,計算得到的上述乘積為上述未知流量與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的一些實施例中,上述計算上述未知流量與樣本流量的報文長度的相似度,例如可以包括:將上述未知流量的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量與樣本流量的報文長度的相似度;或者,確定上述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出第一長度區域對應的相似度值,其中,第一長度區域對應的相似度值為上述未知流量與樣本流量的報文長度的相似度。其中,其它維度的相似度計算方式可類推,此處不再一一舉例。如圖2-a所示,其中,通過部署,DIP識別系統可獲取網絡中的多種設備的流量。例如DIP識別系統可以是板卡或軟模塊,可將DIP識別系統嵌入到基站控制器、數據網關等網元中。或者DIP識別系統可作為獨立設備,可採用外掛或串聯等方式接入網絡。例如圖2-a舉例所示,DIP識別系統可以以外掛或串聯等方式部署於網絡系統的多種位置(如基站、基站控制器、網關、伺服器等位置)以便對需要分析的設備流量進行分析。參見圖2-b、圖2-c和圖2-d,圖2-b、圖2-c和圖2-d舉例示出了DPI識別系統和近似匹配系統之間的部署位置關係。參見圖2-b和圖2-c,近似匹配系統和DPI識別系統可作為1個整體,當然近似匹配系統和DPI識別系統亦可是兩個獨立設備,其中,近似匹配系統和DPI識別系統可和稱之為流量分析系統。其中,圖2-b示出一種近似匹配系統可與DPI識別系統跨接(旁路)的場景,近似匹配系統可將流量識別報告反饋給DPI識別系統,由DPI識別系統統一向相關設備(例如計費伺服器等)上報流量識別報告,當然近似匹配系統和DPI識別系統亦可獨自向相關設備(例如計費伺服器等)上報各自的流量識別報告(圖2-c所示)。其中,圖2-d示出一種近似匹配系統可與DPI識別系統集成在一起的場景,圖2-d中舉例示出近似匹配系統可與DPI識別系統集成在流量分析伺服器之中。可以理解,近似匹配系統和DPI識別系統中的至少一個可以集成在通信網元之中,當然近似匹配系統和DPI識別系統亦可以是獨立於通信網元的設備。其中,流量識別報告可攜帶未知流量與樣本流量的匹配相似度,或者可攜帶未知流量與樣本流量是否匹配的指示信息(例如當匹配相似度大於某設定閾值時表示未知流量與樣本流量匹配,當匹配相似度小雨某設定閾值時表示未知流量與樣本流量不匹配),其中,接收到流量識別報告的相關設備(例如計費伺服器等)可基於流量識別報告來進行相應處理(例如流量計費處理等)。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和各樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明一個實施例的方案中,在獲取未知流量後按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於提供了一種可利用流量分析設備來進行近似流量分析的機制,有利於提高流量分析的效率;由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。為便於更好的理解和實施本發明實施例的上述方案,下面舉例一些應用場景進行說明。參見圖3,圖3是本發明的另一個實施例提供的另一種流量分析方法的流程示意圖,如圖3所示,本發明的另一個實施例提供的另一種流量分析方法可包括以下內容:301、對網絡流量A(即:未知流量)進行DPI識別。其中,DPI識別中以基於特徵字的識別技術最為基礎、應用最為廣泛。不同的應用通常會採用不同的協議,而各種協議都有其特殊的指紋,這些指紋可能是特定的埠、特定的字符串或者特定的比特(Bit)序列。其中,基於特徵字的識別技術,正是通過識別網絡流量A的數據報文中的指紋信息來確定業務流所承載的應用。根據具體檢測方式的不同,基於特徵字的識別技術又可細分為固定位置特徵字匹配、變動位置特徵字匹配和狀態特徵字匹配三種分支技術。DPI識別的相關機制此處不再贅述。其中,若DPI識別成功,則執行步驟306;若DPI識別失敗,則執行步驟302。假設,網絡流量A的特徵如下:源埠1433、目的埠2457、源IP位址為192.168.1.2、目的IP位址為IP192.168.1.1、負載內容為abefgabc785551……、負載長度為97位元組、發包速率為13ms、網絡流量A的協議為傳輸控制協議。302、獲取網絡流量A的埠號、報文長度和負載內容。303、分別按照埠號、報文長度和負載內容等三個維度計算出網絡流量A和樣本流量的相似度。假設,樣本流量的負載內容為aabcabce、偏移量為0、樣本流量由傳輸控制協議來承載,協議名為VoIPA。假設,樣本流量的埠號分布情況例如圖4-a所示,圖4-a中橫坐標表示埠號,縱坐標表示概率。樣本流量的報文長度分布情況例如圖4-b和圖4-c所示,其中,圖4-b中橫坐標表示流編號,縱坐標表示包長度,圖4-c中橫坐標表示上行包長分段(圖中分為三段),縱坐標左表示分段出現的頻率縱坐標右表示分段所佔百分比。樣本流量的發包速率分布情況例如圖4-d和圖4-e所示,其中,圖4-d中橫坐標表示流編號,縱坐標表示發包速率,圖4-e中橫坐標表示發包速率分段(圖中分為5段),縱坐標左表示分段出現的頻率縱坐標右表示分段所佔百分比。在本發明的一些實施例中,可基於餘弦定理計算網絡流量A和樣本流量的負載內容的相似度。假設,網絡流量A的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,網絡流量A和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,網絡流量A和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,也可基於最長公共子串來計算網絡流量A和樣本流量負載內容相似度。假設,網絡流量A的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若是匹配則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即,網絡流量A和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,網絡流量A和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,也還可以基於如下方式來計算網絡流量A和樣本流量的負載內容的相似度:計算網絡流量A與樣本流量的報文負載內容的字符相似度;計算網絡流量A與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,將計算得到的上述乘積作為網絡流量A和樣本流量的報文負載內容的相似度,其中,上述字符相似度等於網絡流量A與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去網絡流量A與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與網絡流量A不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。當然,計算網絡流量A和樣本流量負載內容相似度的方式並限於上述舉例的方式。在本發明一些實施例中,可基於如下舉例的分段函數來計算網絡流量A和樣本流量的報文長度的相似度:其中,基於上述分段函數可得到網絡流量A和樣本流量報文長度的相似度為0.881,因為網絡流量A的報文長度x落入了第一長度區域[0,100],而第一長度區域[0,100]對應的相似度值等於0.881。其中,上述分段函數中用到分段可參考wireshark軟體中所使用的分類方法。當然,計算網絡流量A和樣本流量的報文長度的相似度的方式並限於上述舉例的方式。在本發明一些實施例中,可基於正態分布機制來計算網絡流量A和樣本流量的埠的相似度。其中,正態分布公式如下:其中,正態分布公式具有兩個參數μ和σ2的連續型隨機變量的分布,第一參數μ是服從正態分布的隨機變量的均值,第二個參數σ2是此隨機變量的方差,所以正態分布記作N(μ,σ2)。服從正態分布的隨機變量的概率規律為取與μ鄰近的值的概率大,而取離μ越遠的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。假設,通過計算得出樣本流量的埠號的標準差為310.2418(σ),算術平均值為2500(μ),概率密度可如下表所示:公式下限上限概率密度μ±σ2189.7582810.24268.3%μ±2σ1879.5163120.48495.4%μ±3σ1569.2743430.72699.7%由於網絡流量A的埠號為2457,落在[2189.758,2810.242]之間,故可得到網絡流量A和樣本流量的埠相似度68.3%。當然,計算網絡流量A和樣本流量的埠相似度的方式並限於上述舉例的方式。304、對計算得到的各維度對應的相似度進行加權調和,以得到網絡流量A與樣本流量的匹配相似度。舉例來說,假設設定的負載內容相似度、報文長度相似度、埠相似度的權值分別為6、3和1,則加權調和計算出的匹配相似度如下:匹配相似度=(PayloadSR6*LengthSR^3*PortSR^1)0.1=(0.420466*0.881^3*0.683^1)0.1=0.550976當然,設定的負載內容相似度、報文長度相似度、埠相似度的權值亦可分別為3、3和1或其它值,加權調和計算出的匹配相似度的方式類似。305、判斷計算得到的匹配相似度是否大於相似度閾值。若是,則執行步驟306;若否,則執行步驟307。306、輸出成功識別的識別結果;假設,識別出網絡流量A屬於某套餐內的流量,則可通知相關設備不單獨計費。307、輸出識別失敗的識別結果。其中,上述場景中,主要以按照埠號、報文長度和負載內容等三個維度計算出網絡流量A和樣本流量的相似度。對於按照其它維度計算出網絡流量A和樣本流量的相似度的場景,可以此類推。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本實施例的方案中,先將未知流量進行DPI識別,若DPI識別失敗,則按照埠號、報文長度和負載內容等維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度。由於提供了一種可利用流量分析設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率。由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。為便於更好的實施本發明實施例的上述方案,下面還提供用於實施上述方案的相關裝置。參見圖5,本發明實施例還提供一種近似匹配伺服器500,可包括:獲取單元510和相似度計算單元520。其中,獲取單元510,用於獲取未知流量。相似度計算單元520,用於按照N個維度,分別計算樣本流量與上述獲取單元獲取的上述未知流量與的相似度;對計算得到的各維度對應的相似度進行加權調,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。在本發明的一些實施例中,相似度計算單元520可具體用於,當基於深層包檢測技術未能識別出上述未知流量時,按照N個維度分別計算上述未知流量與樣本流量的相似度,對計算得到的各維度對應的相似度進行加權調,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。其中,相似度計算單元520可根據實際需要來選著用於識別的維度,針對不同的應用場景不同的精度要求,選擇的維度可能不盡相同。舉例來說,相似度計算單元520可以從下面舉例的幾個維度中選擇至少兩個維度來計算上述未知流量與樣本流量的相似度:報文負載內容、報文長度、報文埠號、發包速率、上行包數量、下行包數量、上下行包數量比值、上行流量值、下行流量值、上下行流量值的比值、前M個包的流量值等。當然,本發明實施例並不限於上述舉例的相似度比較維度,其它維度亦可引入。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量與樣本流量的相似度的方面,相似度計算單元520可具體用於,執行如下相似度計算操作中的至少兩種:計算上述未知流量與樣本流量的報文長度的相似度、計算上述未知流量與樣本流量的報文負載內容的相似度、計算上述未知流量與樣本流量的報文埠號的相似度、計算上述未知流量與樣本流量的發包速率的相似度、計算上述未知流量與樣本流量的上行包數量的相似度、計算上述未知流量與樣本流量的下行包數量的相似度、計算上述未知流量與樣本流量的上下行包數量比值的相似度、計算上述未知流量與樣本流量的上行流量值的相似度、計算上述未知流量與樣本流量的下行流量值的相似度、計算上述未知流量與樣本流量的上下行流量值的比值的相似度、計算上述未知流量與樣本流量的前M個包的流量值的相似度,並對計算得到的至少兩種的相似度進行加權調,以得到上述未知流量與樣本流量的匹配相似度。在本發明的一些實施例中,在計算上述未知流量與樣本流量的報文負載內容的相似度的方面,相似度計算單元520可具體用於:計算上述未知流量與樣本流量的報文負載內容的字符相似度;計算上述未知流量與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,該乘積為上述未知流量與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在計算上述未知流量與樣本流量的報文負載內容的相似度的方面,相似度計算單元520也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在計算上述未知流量與樣本流量的報文負載內容的相似度的方面,相似度計算單元520也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量與樣本流量的報文長度的相似度的方面,相似度計算單元520可具體用於:將上述未知流量的報文長度除以上述樣本流量的報文長度以得到商,其中,該商為上述未知流量與樣本流量的報文長度的相似度;或者,確定上述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出第一長度區域對應的相似度值,其中,第一長度區域對應的相似度值為未知流量與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。可以理解的是,本實施例近似匹配裝置500可以用於實現上述方法實施例中的部分或全部技術方案,其各個功能模塊的功能可根據上述方法實施例中的方法具體實現,其具體實現過程可參照上述實施例中的相關描述,此處不再贅述。由上可見,本實施例的方案中,近似匹配裝置500在獲取未知流量後按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中N為大於或等於2的整數。由於提供了一種可利用近似匹配裝置500來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。圖6為本發明提供的近似匹配伺服器600的結構示意圖,如圖6所示,本實施例的近似匹配伺服器600包括至少一個總線601、與總線601相連的至少一個處理器602以及與總線601相連的至少一個存儲器603。其中,處理器602通過總線601,調用存儲器603中存儲的代碼以用於獲取未知流量;按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。其中,通過部署,處理器602可獲取網絡中的多種設備的流量。例如近似匹配伺服器600可為板卡或軟模塊,可將近似匹配伺服器600嵌入到基站控制器、數據網關等網元中。或者近似匹配伺服器600可作為獨立設備,可採用外掛或串聯等方式接入網絡。在本發明的一些實施例中,處理器602可以在當基於深層包檢測技術未能識別出上述未知流量時,按照N個維度分別計算上述未知流量與樣本流量的相似度,對計算得到的各維度對應的相似度進行加權調,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。在本發明的一些實施例中,若得到的樣本流量與上述未知流量的匹配相似度大於設定的相似度閾值,則處理器602可輸出未知流量與樣本流量的匹配成功的流量識別結果(其中,該流量識別結果例如可指示出上述未知流量與樣本流量的業務類型相同等,此時可按照樣本流量的業務類型所對應的套餐計費方式對上述未知流量進行計費。例如存在Fk1套餐業務,針對用戶所有訪問Fk1的流量免費,Fk1的外掛視頻流量和廣告流量單獨計費,其它業務場景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小於設定的相似度閾值,則處理器602可輸出未知流量與樣本流量的匹配失敗的流量識別結果。其中,處理器602可根據實際需要來選著用於識別的維度,針對不同的應用場景不同的精度要求,選擇的維度可能不盡相同。舉例來說,處理器602可以從下面舉例的幾個維度中選擇至少兩個維度來計算上述未知流量與樣本流量的相似度:報文負載內容、報文長度、報文埠號、發包速率、上行包數量、下行包數量、上下行包數量比值、上行流量值、下行流量值、上下行流量值的比值、前M個包的流量值等。當然,本發明實施例並不限於上述舉例的相似度比較維度,其它維度亦可引入。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量與樣本流量的相似度的方面,處理器602可具體用於:執行如下相似度計算操作中的至少兩種:計算上述未知流量與樣本流量的報文長度的相似度、計算上述未知流量與樣本流量的報文負載內容的相似度、計算上述未知流量與樣本流量的報文埠號的相似度、計算上述未知流量與樣本流量的發包速率的相似度、計算上述未知流量與樣本流量的上行包數量的相似度、計算上述未知流量與樣本流量的下行包數量的相似度、計算上述未知流量與樣本流量的上下行包數量比值的相似度、計算上述未知流量與樣本流量的上行流量值的相似度、計算上述未知流量與樣本流量的下行流量值的相似度、計算上述未知流量與樣本流量的上下行流量值的比值的相似度、計算上述未知流量與樣本流量的前M個包的流量值的相似度。在實際應用中,可採用符合本領域計算邏輯的多種方式,按照相應維度計算上述未知流量與樣本流量的相似度。例如,在計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器602可具體用於:計算上述未知流量與樣本流量的報文負載內容的字符相似度;計算上述未知流量與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,上述乘積為上述未知流量與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器602也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器602也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量與樣本流量的報文長度的相似度的方面。處理器602可具體用於:將上述未知流量的報文長度除以上述樣本流量的報文長度以得到商,該商為上述未知流量與樣本流量的報文長度的相似度;或者確定上述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出第一長度區域對應的相似度值,其中,第一長度區域對應的相似度值為未知流量與樣本流量的報文長度的相似度。其中,其它維度的相似度計算方式可類推,此處不再一一舉例。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。可以理解的是,本實施例近似匹配伺服器600可以用於實現上述方法實施例中的部分或全部技術方案,其各個功能模塊的功能可根據上述方法實施例中的方法具體實現,其具體實現過程可參照上述實施例中的相關描述,此處不再贅述。由上可見,本發明實施例的方案中,處理器602在獲取未知流量後按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於提供了利用近似匹配伺服器600來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖7,本發明實施例還提供一種通信系統,包括:通信網元710和與該通信網元連接的流量分析伺服器720。其中,通信網元710用於接收未知流量;其中,流量分析伺服器720,用於獲取通信網元710接收的未知流量或者獲取通信網元710接收的未知流量的鏡像;按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,上述N為大於或等於2的整數。流量分析伺服器720可嵌入到通信網元710(例如基站控制器、數據網關等網元)中。或者流量分析伺服器720可作為獨立設備,可採用外掛或串聯等方式接入網絡中,以與通信網元710連接。其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。可以理解,本實施例的通信網元例如可為基站、基站控制器、網關、各種數據伺服器等網絡中可用於傳輸業務流量的網元。在本發明一些實施例中,流量分析伺服器720可以具體用於,在當基於深層包檢測技術未能識別出上述未知流量或未知流量的鏡像時,按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度,對計算得到的各維度對應的相似度進行加權調,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。在本發明一些實施例中,若得到的樣本流量與上述未知流量或未知流量的鏡像的匹配相似度大於設定的相似度閾值,則流量分析伺服器720可向通信網元710或其它通信網元輸出未知流量或未知流量的鏡像與樣本流量的匹配成功的流量識別結果(其中,該流量識別結果例如可指示出上述未知流量或未知流量的鏡像與樣本流量的業務類型相同等,此時可按照樣本流量的業務類型所對應的套餐計費方式對上述未知流量或未知流量的鏡像進行計費。如存在Fk1套餐業務,針對用戶所有訪問Fk1的流量免費,Fk1的外掛視頻流量和廣告流量單獨計費,其它業務場景以此類推),此外,若得到的樣本流量與上述未知流量或未知流量的鏡像的匹配相似度小於設定的相似度閾值,則流量分析伺服器720可向通信網元710或其它通信網元輸出未知流量或未知流量的鏡像與樣本流量的匹配失敗的流量識別結果。其中,可根據實際需要來選著用於識別的維度,針對不同的應用場景不同的精度要求,選擇的維度可能不盡相同。舉例來說,可以從下面舉例的幾個維度中選擇至少兩個維度來計算上述未知流量或未知流量的鏡像與樣本流量的相似度:報文負載內容、報文長度、報文埠號、發包速率、上行包數量、下行包數量、上下行包數量比值、上行流量值、下行流量值、上下行流量值的比值、前M個包的流量值等。當然,本發明實施例並不限於上述舉例的相似度比較維度,其它維度亦可引入。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,流量分析伺服器720可具體用於執行如下相似度計算操作中的至少兩種:計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。在實際應用中,可採用符合本領域計算邏輯的多種方式,按照相應維度計算上述未知流量或未知流量的鏡像與樣本流量的相似度。例如,在計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,流量分析伺服器720可具體用於:計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,該乘積為上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量或未知流量的鏡像不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,流量分析伺服器720也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,流量分析伺服器720也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在上述計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,流量分析伺服器720可具體用於:將上述未知流量或未知流量的鏡像的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定上述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出第一長度區域對應的相似度值,其中,第一長度區域對應的相似度值為未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。其中,其它維度的相似度計算方式可類推,此處不再一一舉例。由上可見,本實施例方案中,流量分析伺服器720從通信網元710獲取未知流量後,按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於可利用流量分析伺服器來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖8,本發明實施例還提供一種流量分析伺服器800,可包括:深層包檢測識別系統810和近似匹配系統820。深層包檢測識別系統810,用於獲取未知流量,基於深層包檢測技術對所述未知流量進行識別;近似匹配系統820,用於當深層包檢測識別系統810基於深層包檢測技術未能識別出所述未知流量時,按照N個維度分別計算所述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大於或等於2的整數,其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,所述n1、n2、n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。在本發明的一些實施例中,近似匹配系統820按照N個維度分別計算所述未知流量與樣本流量的相似度可包括:執行如下相似度計算操作中的至少兩種:計算所述未知流量與樣本流量的報文長度的相似度、計算所述未知流量與樣本流量的報文負載內容的相似度、計算所述未知流量與樣本流量的報文埠號的相似度、計算所述未知流量與樣本流量的發包速率的相似度、計算所述未知流量與樣本流量的上行包數量的相似度、計算所述未知流量與樣本流量的下行包數量的相似度、計算所述未知流量與樣本流量的上下行包數量比值的相似度、計算所述未知流量與樣本流量的上行流量值的相似度、計算所述未知流量與樣本流量的下行流量值的相似度、計算所述未知流量與樣本流量的上下行流量值的比值的相似度、計算所述未知流量與樣本流量的前M個包的流量值的相似度。在本發明的一些實施例中,在計算所述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配系統820可具體用於:計算所述未知流量與樣本流量的報文負載內容的字符相似度;計算所述未知流量與樣本流量的報文負載內容的匹配度;計算所述匹配度的平方根與所述字符相似度的乘積,其中,計算得到的所述乘積為所述未知流量與樣本流量的報文負載內容的相似度,其中,所述字符相似度等於所述未知流量與樣本流量的報文負載內容的相同字符數,除以所述樣本流量的報文負載內容的總字符數;所述匹配度等於1減去所述未知流量與樣本流量的報文負載內容的區別度,其中,所述區別度等於所述樣本流量的報文負載內容中與所述未知流量不相同的字符數,除以所述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配系統820也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配系統820也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,計算所述未知流量與樣本流量的報文長度的相似度的方面,近似匹配系統820可具體用於:將所述未知流量的報文長度除以所述樣本流量的報文長度以得到商,其中,所述商為所述未知流量與樣本流量的報文長度的相似度;或,確定所述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出第一長度區域對應的相似度值,其中,第一長度區域對應的相似度值為所述未知流量與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明實施例方案中,深層包檢測識別系統810獲取未知流量後,基於深層包檢測技術對所述未知流量進行識別,當深層包檢測識別系統810基於深層包檢測技術未能識別出未知流量時,近似匹配系統820按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於提供了一種可利用設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖9,本發明實施例還提供一種通信系統,可包括:通信網元910和流量分析伺服器920。其中,通信網元910用於接收未知流量;流量分析伺服器920用於,獲取通信網元910接收的獲取未知流量或者獲取通信網元910接收的未知流量的鏡像,基於深層包檢測技術對上述未知流量或未知流量的鏡像進行識別;當上述深層包檢測識別系統基於深層包檢測技術未能識別出上述未知流量或未知流量的鏡像時,按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數,其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,上述n1、n2和n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。可以理解,本實施例的通信網元例如可為基站、基站控制器、網關、各種數據伺服器等網絡中可用於傳輸業務流量的網元。在本發明的一些實施例中,流量分析伺服器920按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度包括:執行如下相似度計算操作中的至少兩種:計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,流量分析伺服器920可具體用於:計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,計算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量或未知流量的鏡像不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,流量分析伺服器920也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,流量分析伺服器920也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,流量分析伺服器920可具體用於:將上述未知流量或未知流量的鏡像的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定上述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,上述第一長度區域對應的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。可以理解的是,上述未知流量和未知流量的鏡像的內容基本相同,上述未知流量與樣本流量的匹配相似度,等於上述未知流量的鏡像與樣本流量的匹配相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明實施例方案中,流量分析伺服器920從通信網元910獲取未知流量後,基於深層包檢測技術對上述未知流量進行識別,當基於深層包檢測技術未能識別出未知流量時,流量分析伺服器920按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於可利用設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖10、本發明實施例還提供一種通信系統,可包括:通信網元1010和近似匹配伺服器1020,其中,通信網元1010用於接收未知流量,基於深層包檢測技術對上述未知流量進行識別,若未能識別出上述未知流量,向近似匹配伺服器1020發送未能識別出的上述未知流量或者上述未能識別出的上述未知流量的鏡像;近似匹配伺服器1020用於,接收來自通信網元1010的未能識別出的上述未知流量或所述未知流量的鏡像,按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數,其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,上述n1、n2、n3為正整數。可以理解的是,上述未知流量和未知流量的鏡像的內容基本相同,上述未知流量與樣本流量的匹配相似度,等於上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。可以理解,本實施例的通信網元例如可為基站、基站控制器、網關、各種數據伺服器等網絡中可用於傳輸業務流量的網元。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,近似匹配伺服器1020可具體用於:執行如下相似度計算操作中的至少兩種:計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1020可具體用於:計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,計算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量或未知流量的鏡像不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1020也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1020也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,近似匹配伺服器1020可具體用於,將上述未知流量或未知流量的鏡像的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定上述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,上述第一長度區域對應的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明實施例的方案中,通信網元1010接到未知流量後,基於深層包檢測技術對上述未知流量進行識別,當基於深層包檢測技術未能識別出未知流量時,近似匹配伺服器1020按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於可利用設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖11,本發明實施例還提供一種通信系統,可包括:通信網元1110和深層包檢測識別伺服器1120,其中,通信網元1110用於接收未知流量;上述深層包檢測識別伺服器1120,用於獲取通信網元1110接收的未知流量或者獲取通信網元1110接收的未知流量的鏡像;基於深層包檢測技術對來自通信網元1110的上述未知流量進行識別,若未能識別出上述未知流量,向通信網元1110發送未能識別出的上述未知流量或未能識別出的上述未知流量的鏡像;通信網元1110還用於,接收來自深層包檢測識別伺服器1120的上述未能識別出的上述未知流量或未知流量的鏡像,按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數,其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,上述n1、n2、n3為正整數。可以理解的是,上述未知流量和未知流量的鏡像的內容基本相同,上述未知流量與樣本流量的匹配相似度,等於上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。可以理解,本實施例通信網元1110例如可為基站、基站控制器、網關或各種數據伺服器等網絡中可用於傳輸業務流量的網元。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,通信網元1110可具體用於:執行如下相似度計算操作中的至少兩種:計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,通信網元1110可具體用於,計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,計算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量或未知流量的鏡像不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,通信網元1110也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,通信網元1110也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,通信網元1110可具體用於:將上述未知流量或未知流量的鏡像的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定上述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,上述第一長度區域對應的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明實施例的方案中,深層包檢測識別伺服器1120,用於從通信網元1110獲取未知流量;基於深層包檢測技術對來自通信網元1110的上述未知流量進行識別,若未能識別出上述未知流量,向通信網元1110發送未能識別出的上述未知流量,通信網元1110接到未知流量後按N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於可利用設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖12,本發明實施例提供還一種通信系統,可包括:通信網元1210、深層包檢測識別伺服器1220和近似匹配伺服器1230,其中,通信網元1210,用於接收未知流量;深層包檢測識別伺服器1220,用於獲取通信網元1210接收的未知流量或者獲取通信網元1210接收的未知流量的鏡像;基於深層包檢測技術對通信網元1210的上述未知流量或未知流量的鏡像進行識別,若未能識別出上述未知流量或未知流量的鏡像,向近似匹配伺服器1230發送未能識別出的上述未知流量或未能識別出的上述未知流量的鏡像;近似匹配伺服器1230,用於接收來自深層包檢測識別伺服器1220的上述未能識別出的上述未知流量或未知流量的鏡像,按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,上述n1、n2、n3為正整數。可以理解的是,上述未知流量和未知流量的鏡像的內容基本相同,上述未知流量與樣本流量的匹配相似度,等於上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。可以理解,本實施例的通信網元例如可為基站、基站控制器、網關、各種數據伺服器等網絡中可用於傳輸業務流量的網元。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,近似匹配伺服器1230可具體用於:執行如下相似度計算操作中的至少兩種:計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的報文埠號的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的發包速率的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行包數量的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行包數量比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計算上述未知流量或未知流量的鏡像與樣本流量的前M個包的流量值的相似度。在本發明的一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1230可具體用於:計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的字符相似度;計算上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,計算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量或未知流量的鏡像與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量或未知流量的鏡像不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1230也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,近似匹配伺服器1230也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明一些實施例中,在計算上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度的方面,近似匹配伺服器1230可具體用於:將上述未知流量或未知流量的鏡像的報文長度除以上述樣本流量的報文長度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度;或者,確定上述未知流量或未知流量的鏡像的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,上述第一長度區域對應的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報文長度的相似度。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發明實施例的方案中,深層包檢測識別伺服器1220,用於從通信網元1210獲取未知流量;基於深層包檢測技術對來自通信網元1010的上述未知流量進行識別,若未能識別出上述未知流量,向近似匹配伺服器1230發送未能識別出的上述未知流量,近似匹配伺服器1230接到未知流量後按N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於可利用設備來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。圖13描述了本發明實施例提供的一種近似匹配伺服器1300的結構,近似匹配伺服器1300包括:至少1個處理器1301,例如CPU,至少一個網絡接口1304或者其他用戶接口1303,存儲器1305,至少一個通信總線1302。通信總線1302用於實現這些組件之間的連接通信。該近似匹配伺服器1300可選的包含用戶接口1303,包括顯示器,鍵盤或者點擊設備(例如,滑鼠,軌跡球(trackball),觸感板或者觸感顯示屏)。存儲器1305可能包含高速RAM存儲器,也可能還包括非不穩定的存儲器(non-volatilememory),例如至少一個磁碟存儲器。存儲器1305可選的可以包含至少一個位於遠離前述處理器1301的存儲裝置。在一些實施方式中,存儲器1305存儲了如下的元素,可執行模塊或者數據結構,或者他們的子集,或者他們的擴展集:作業系統13051,包含各種系統程序,用於實現各種基礎業務以及處理基於硬體的任務;應用程式模塊13052,包含各種應用程式,用於實現各種應用業務。應用程式模塊13052中包括但不限於獲取單元510和相似度計算單元520。應用程式模塊13052中各模塊的具體實現參見圖5所示實施例中的相應模塊,在此不贅述。在本發明一些實施例中,通過調用存儲器1305存儲的程序或指令,處理器1301可用於獲取未知流量;按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。在本發明的一些實施例中,處理器1301可以在當基於深層包檢測技術未能識別出上述未知流量時,按照N個維度分別計算上述未知流量與樣本流量的相似度,對計算得到的各維度對應的相似度進行加權調,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大於或等於2的整數。其中,上述N個維度可包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度、與流量自身相關的n3個維度,其中,上述n1、n2、n3為正整數。其中,與流量的報文相關的n1個維度是將流量中報文(例如報文頭和/或報文負載)作為分析角度的n1個維度,與流量的報文相關的n1個維度例如可包括:以流量中報文的長度為維度、以流量中報文的負載內容為維度、以流量中報文的埠號為維度等。其中,與流量所對應的會話相關的n2個維度是將流量所對應的會話作為分析角度的n2個維度,與流量所對應的會話相關的n2個維度例如可包括:以流量所對應會話的上行包數量為維度、以流量所對應會話的下行包數量為維度、以流量所對應會話的上下行包數量比值為維度、以流量所對應會話的上行流量值為維度、以流量所對應會話的下行流量值為維度、以流量所對應會話的上下行流量值比值為維度等。與流量自身相關的n3個維度是將流量本身作為分析角度的n3個維度,這n3個維度與流量中各報文的負載無關、也與流量所對應的會話無關,與流量自身相關的n3個維度例如可包括以流量前M個包的流量值為維度、以流量的發包速率為維度等,以此類推。在本發明的一些實施例中,若得到的樣本流量與上述未知流量的匹配相似度大於設定的相似度閾值,則處理器1301可輸出未知流量與樣本流量的匹配成功的流量識別結果(其中,該流量識別結果例如可指示出上述未知流量與樣本流量的業務類型相同等,此時可按照樣本流量的業務類型所對應的套餐計費方式對上述未知流量進行計費。例如存在Fk1套餐業務,針對用戶所有訪問Fk1的流量免費,Fk1的外掛視頻流量和廣告流量單獨計費,其它業務場景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小於設定的相似度閾值,則處理器1301可輸出未知流量與樣本流量的匹配失敗的流量識別結果。其中,處理器1301可根據實際需要來選著用於識別的維度,針對不同的應用場景不同的精度要求,選擇的維度可能不盡相同。舉例來說,處理器1301可以從下面舉例的幾個維度中選擇至少兩個維度來計算上述未知流量與樣本流量的相似度:報文負載內容、報文長度、報文埠號、發包速率、上行包數量、下行包數量、上下行包數量比值、上行流量值、下行流量值、上下行流量值的比值、前M個包的流量值等。當然,本發明實施例並不限於上述舉例的相似度比較維度,其它維度亦可引入。在本發明的一些實施例中,在按照N個維度分別計算上述未知流量與樣本流量的相似度的方面,處理器1301可具體用於:執行如下相似度計算操作中的至少兩種:計算上述未知流量與樣本流量的報文長度的相似度、計算上述未知流量與樣本流量的報文負載內容的相似度、計算上述未知流量與樣本流量的報文埠號的相似度、計算上述未知流量與樣本流量的發包速率的相似度、計算上述未知流量與樣本流量的上行包數量的相似度、計算上述未知流量與樣本流量的下行包數量的相似度、計算上述未知流量與樣本流量的上下行包數量比值的相似度、計算上述未知流量與樣本流量的上行流量值的相似度、計算上述未知流量與樣本流量的下行流量值的相似度、計算上述未知流量與樣本流量的上下行流量值的比值的相似度、計算上述未知流量與樣本流量的前M個包的流量值的相似度。在實際應用中,可採用符合本領域計算邏輯的多種方式,按照相應維度計算上述未知流量與樣本流量的相似度。例如,在計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器1301可具體用於:計算上述未知流量與樣本流量的報文負載內容的字符相似度;計算上述未知流量與樣本流量的報文負載內容的匹配度;計算上述匹配度的平方根與上述字符相似度的乘積,其中,上述乘積為上述未知流量與樣本流量的報文負載內容的相似度,其中,上述字符相似度等於上述未知流量與樣本流量的報文負載內容的相同字符數,除以上述樣本流量的報文負載內容的總字符數;上述匹配度等於1減去上述未知流量與樣本流量的報文負載內容的區別度,其中,上述區別度等於上述樣本流量的報文負載內容中與上述未知流量不相同的字符數,除以上述樣本流量的報文負載內容的總字符數。在本發明的另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器1301也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,比較兩個字符串的相似度sim(s1,s2),假設字符串s1和字符串s2中含有n個不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉換為對兩個字符串對應的向量v1和v2之間夾角大小的判斷,餘弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負載內容相似度越大;相反,餘弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明另一些實施例中,在上述計算上述未知流量與樣本流量的報文負載內容的相似度的方面,處理器1301也可具體用於:假設未知流量的負載內容為字符串s1,樣本流量的負載內容為字符串s2,可用一個矩陣來記錄兩個字符串中所有位置的兩個字符之間的匹配情況,若匹配(相同)則為1,否則為0,然後,求出矩陣中對角線最長的1個序列,其對應的位置就是最長匹配子串的位置,例如最長公共子串越長,則表示兩個字符串的相似度越大,即未知流量和樣本流量的負載內容的相似度越大,相反,最長公共子串越短,則可認為兩個字符串的相似度越小,即,未知流量和樣本流量的負載內容的相似度越小。在本發明的一些實施例中,在計算上述未知流量與樣本流量的報文長度的相似度的方面,處理器1301可具體用於:將上述未知流量的報文長度除以上述樣本流量的報文長度以得到商,該商為上述未知流量與樣本流量的報文長度的相似度;或者確定上述未知流量的報文長度所落入的第一長度區域,根據長度區域與相似度值的對應關係,確定出所述第一長度區域對應的相似度值,其中,與第一長度區域對應的相似度值,為上述未知流量與樣本流量的報文長度的相似度。其中,其它維度的相似度計算方式可類推,此處不再一一舉例。可以理解的是,本實施例近似匹配伺服器1300可以用於實現上述方法實施例中的部分或全部技術方案,其各個功能模塊的功能可根據上述方法實施例中的方法具體實現,其具體實現過程可參照上述實施例中的相關描述,此處不再贅述。可以理解的是,上述舉例主要是針對某條未知流量和樣本流量來進行匹配相似度計算的,對於存著多個樣本流量的場景,可按類似方式,分別計算未知流量和各個樣本流量的匹配相似度。同理,對應存著多條未知流量的場景,亦可按類似方式,分別計算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。可見,採用上述方案後,處理器1301在獲取未知流量後按照N個維度分別計算上述未知流量與樣本流量的相似度;對計算得到的各維度對應的相似度進行加權調和,以得到未知流量與樣本流量的匹配相似度,其中,N為大於或等於2的整數。由於提供了利用近似匹配伺服器1300來進行近似流量分析的機制,可提供在線分析能力,有利於提升自動化率,減少分析時間,有利於提高流量分析的效率,由於是按照N個維度分別計算上述未知流量與樣本流量的相似度,並對N個維度得到的相似度進行綜合,N個維度包括如下維度中的N個維度:與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度,相對於常規單維度匹配機制,本發明實施例提出的技術方案從與流量的報文相關的n1個維度、與流量所對應的會話相關的n2個維度和與流量自身相關的n3個維度等極具代表性的維度中選擇N個維度來進行組合分析,這樣就有利於極大的提高流量分析的準確性,進而有利於為相關業務計費提供有效支撐。參見圖14-a,本發明實施例還提供一種通信網元1400,包括收發信機1401和與收發信機耦合的用於進行網絡通信的處理器1403,通信網元1400還可包括:與收發信機1401耦合的近似識別引擎1402,其中,近似識別引擎1402例如可為近似匹配裝置500。在本發明的一些實施例中,如圖14-b所示,通信網元1400還可包括與收發信機1401耦合的DPI識別引擎1404,其中,DPI識別引擎1404可用於獲取未知流量,基於深層包檢測技術對該未知流量進行識別。參見圖15-a,本發明實施例還提供一種流量分析伺服器1500,流量分析伺服器1500可包括:用於接收未知流量或未知流量的鏡像的接收器1501,與接收器1501耦合的近似識別引擎1502,以及用於發送所述未知流量或未知流量的鏡像或所述近似識別引擎1502輸出的未知流量或未知流量的鏡像與樣本流量的匹配相似度的發送器1503,其中,近似識別引擎1502例如可為近似匹配裝置500。在本發明的一些實施例中,如圖15-b所示,流量分析伺服器1500還可包括與接收器1501耦合的DPI識別引擎1504,其中,DPI識別引擎1504可用於獲取未知流量或未知流量的鏡像,基於深層包檢測技術對該未知流量或未知流量的鏡像進行識別。本發明實施例還提供一種計算機存儲介質,其中,該計算機存儲介質可存儲有程序,該程序執行時包括上述方法實施例中記載的近似匹配方法或流量分析方法的部分或全部步驟。需要說明的是,對於前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發明並不受所描述的動作順序的限制,因為依據本發明,某些步驟可以採用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作和模塊並不一定是本發明所必須的。在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用軟體功能單元的形式實現。所述集成的單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟體產品的形式體現出來,該計算機軟體產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可為個人計算機、伺服器或者網絡設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、移動硬碟、磁碟或者光碟等各種可以存儲程序代碼的介質。以上所述,以上實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀