運營商網絡實際用戶數的統計方法和裝置製造方法
2023-05-10 04:47:11 1
運營商網絡實際用戶數的統計方法和裝置製造方法
【專利摘要】本發明涉及網際網路【技術領域】,公開了一種運營商網絡實際用戶數的統計方法和裝置,使用User?Agent欄位中的信息並結合客戶端所訪問的URL來判斷終端的數量,繼承了User?Agent方法容易實現的優點,並解決只用User?Agent時誤判軟體為瀏覽器的問題。所述方法包括:多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user?agent欄位和URL;當某個user?agent訪問了指定的url時,認為該user?agent代表了一個終端;獲取所有不重複的user?agent數量為該帳號或IP位址下終端的數量。
【專利說明】運營商網絡實際用戶數的統計方法和裝置
【技術領域】
[0001]本發明涉及網際網路【技術領域】,具體而言,涉及一種網絡共享接入檢測方法和裝置【背景技術】
[0002]目前,單個寬帶帳號常常由多人/多終端共享接入網際網路,對運營商統計實際用戶數並開展其他業務造成不便。由於ip協議本身設計目標等原因,無法直接給出同一帳號下區域網內共享有多少臺計算機。業界普遍使用的檢測方法有如下幾種:
[0003]a) 二層方法:MAC地址方法,在客戶端根據不同mac地址區分不同終端。
[0004]b)三層方法:IPID/時間戳方法,IP報文中有遞增的IPID標識或者時間戳,此方法根據遞增序列還原出區域網內有幾臺終端。
[0005]c)應用層特定軟體方法:如p2p軟體方法,此方法根據一些軟體通信協議中含有的特殊終端相關信息,判斷區域網內有幾臺終端。
[0006]d)Http協議方法:CookieId方法,此方法通過重定向用戶訪問,在用戶瀏覽器中設置cookie id標識,以此標識不同終端。
[0007]e) Http協議方法:User Agent方法,根據不同瀏覽器有不同的User Agent欄位的特徵,區分不同的終端,如專利申請CN201210406055中所記載的。
[0008]然而上述現有技術都有其缺陷,具體的:
[0009]a) 二層方法:只能在客戶端實現,對於NAT/Proxy上網無效,在主機多網卡時會誤判。
[0010]b)三層方法:只能統計同時上網終端數,無法統計帳號下所有活動和非活動終端數。
[0011]c)應用層特定軟體方法:受軟體普及率影響,尤其當前移動終端與PC軟體差別較大,無法找到最佳的軟體,軟體升級變更時此方法也有可能失效。
[0012]d)Http協議方法Cookie:目前隱私保護越來越受到重視,一些瀏覽器已默認不支持cookie,或者當用戶瀏覽器禁用cookie時,此方法都會無效。
[0013]e) Http協議方法User Agent:當前很多軟體會模擬瀏覽器User Agent發送http報文,只使用User Agent進行判斷,會誤認為這些軟體也是一個獨立的終端。
【發明內容】
[0014]針對現有技術的上述缺陷,一方面,本發明提供了一種運營商網絡實際用戶數的統計方法,包括:
[0015]多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL ;
[0016]當某個user agent訪問了指定的url時,認為該user agent代表了一個終端;
[0017]獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。
[0018]優選的,上述採集是在VPN伺服器處或NAT路由器的上行埠處設置抓取工具來抓取各個終端的http上行訪問數據包。
[0019]優選的,指定的url可以是預先統計好存儲於資料庫中的url,所述url是模擬軟體不訪問或極少訪問的ur I。
[0020]優選的,維護一個指定url的資料庫,其中的url為多數用戶訪問的主流url,如果發現有模擬軟體訪問其中的url,則將該url從資料庫中刪除,始終保持資料庫中的url沒有或極少有模擬軟體訪問。
[0021]優選的,通過user agent字符串的6個不同部分來區分不同的user agent的數量。
[0022]另一方面,本發明還同時提供了一種運營商網絡實際用戶數的統計裝置,包括:
[0023]採集提取模塊,多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL ;
[0024]判定模塊,當某個user agent訪問了指定的url時,認為該user agent代表了一個終端;
[0025]統計模塊,獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。
[0026]優選的,上述採集是在VPN伺服器處或NAT路由器的上行埠處設置抓取工具來抓取各個終端的http上行訪問數據包。
[0027]優選的,指定的url可以是預先統計好存儲於資料庫中的url,所述url是模擬軟體不訪問或極少訪問的ur I。
[0028]優選的,維護一個指定url的資料庫,其中的url為多數用戶訪問的主流url,如果發現有模擬軟體訪問其中的url,則將該url從資料庫中刪除,始終保持資料庫中的url沒有或極少有模擬軟體訪問。
[0029]優選的,通過user agent字符串的6個不同部分來區分不同的user agent的數量。
【專利附圖】
【附圖說明】
[0030]圖1是本發明實施例中一種運營商網絡實際用戶數的統計方法的流程圖。
[0031]圖2是本發明實施例中一種運營商網絡實際用戶數的統計裝置的結構圖。
【具體實施方式】
[0032]下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述。顯然,所描述的實施例為實施本發明的較佳實施方式,所述描述是以說明本發明的一般原則為目的,並非用以限定本發明的範圍。本發明的保護範圍應當以權利要求所界定者為準,基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
[0033]參照圖1,示出了本發明實施例中一種運營商網絡實際用戶數的統計方法。
[0034]多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL。多個終端通常可以通過共享帳號如VPN或共享IP如NAT接入網際網路,在VPN伺服器處或NAT路由器的上行埠處設置抓取工具來抓取各個終端的http上行訪問數據包,http數據包中包括了頭域,頭域中包含user agent欄位,User-Agent也簡稱UA。它是一個特殊字符串頭,包括數字和字母,是一種向訪問網站提供所使用的瀏覽器類型及版本、作業系統及版本、瀏覽器內核等信息的標識。
[0035]當某個user agent訪問了指定的url時,認為該user agent代表了一個終端。指定的url可以是預先統計好存儲於資料庫/文件/內存中的url,所述url是模擬軟體不訪問或極少訪問的url。可以維護一個指定url的資料庫/文件/內存,其中的url為多數用戶訪問的主流url,如果發現有模擬軟體訪問其中的urI,則將該url從資料庫中刪除,始終保持資料庫中的url沒有或極少有模擬軟體訪問,這樣可以最大限度的排除模擬軟體發送http報文而被識別為終端的情況。
[0036]獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。各種不同的網絡瀏覽器(Internet Explorer,Firefox,Opera,遨遊、搜狗)會用不同的用戶代理字符串(user agent strings)來作為自身的標誌。通過逐對對比用戶代理字符串可以區分出所有不重複的user agent,通過user agent的數量來確定終端的數量。
[0037]參照圖2,示出了本發明實施例中一種運營商網絡實際用戶數的統計裝置。
[0038]採集提取模塊,多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL。
[0039]判定模塊,當某個user agent訪問了指定的url時,認為該user agent代表了一個終端。
[0040]統計模塊,獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。
[0041]利用本發明的技術解決方案,使用User Agent欄位中的信息並結合客戶端所訪問的URL來判斷終端的數量,繼承了 User Agent方法容易實現的優點,並解決只用UserAgent時誤判軟體為瀏覽器的問題。
[0042]以上實施例的說明只是用於幫助理解發明的方法及其核心思想;同時,對於本領域的一般技術人員,依據本發明的思想,在【具體實施方式】以及應用範圍上均會有改變之處,綜上所述,本說明書的內容不應理解為對本發明的限制。
【權利要求】
1.一種運營商網絡實際用戶數的統計方法,包括: 多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL ; 當某個user agent訪問了指定的url時,認為該user agent代表了一個終端; 獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。
2.根據權利要求1中所述的方法,其特徵在於,包括: 上述採集是在VPN伺服器處或NAT路由器的上行埠處設置抓取工具來抓取各個終端的http上行訪問數據包。
3.根據權利要求1中所述的方法,其特徵在於,包括: 指定的url可以是預先統計好存儲於資料庫/文件/內存中的url,所述url是模擬軟體不訪問或極少訪問的urI。
4.根據權利要求1中所述的方法,其特徵在於,包括: 維護一個指定url的資料庫/文件/內存,其中的url為多數用戶訪問的主流url,如果發現有模擬軟體訪問其中的url,則將該url從資料庫中刪除,始終保持資料庫中的url沒有或極少有模擬軟體訪問。
5.根據權利要求1中所述的方法,其特徵在於,包括: 通過逐對對比用戶代理字符串區分出所有不重複的user agent,通過useragent的數量來確定終端的數量。
6.一種運營商網絡實際用戶數的統計裝置,包括: 採集提取模塊,多個終端用單個帳號/共享接入網際網路,採集一個帳號或一個IP位址下每個http的上行訪問數據包,提取user agent欄位和URL ; 判定模塊,當某個user agent訪問了指定的url時,認為該user agent代表了一個終端; 統計模塊,獲取所有不重複的user agent數量為該帳號或IP位址下終端的數量。
7.根據權利要求6中所述的裝置,其特徵在於,包括: 上述採集是在VPN伺服器處或NAT路由器的上行埠處設置抓取工具來抓取各個終端的http上行訪問數據包。
8.根據權利要求6中所述的裝置,其特徵在於,包括: 指定的url可以是預先統計好存儲於資料庫/文件/內存中的url,所述url是模擬軟體不訪問或極少訪問的ur I。
9.根據權利要求6中所述的裝置,其特徵在於,包括: 維護一個指定url的資料庫/文件/內存,其中的url為多數用戶訪問的主流url,如果發現有模擬軟體訪問其中的url,則將該url從資料庫中刪除,始終保持資料庫中的url沒有或極少有模擬軟體訪問。
10.根據權利要求6中所述的裝置,其特徵在於,包括: 通過逐對對比用戶代理字符串區分出所有不重複的user agent,通過user agent的數量來確定終端的數量。
【文檔編號】H04L12/24GK103763125SQ201310741124
【公開日】2014年4月30日 申請日期:2013年12月27日 優先權日:2013年12月27日
【發明者】崔晶晶, 林佳婕, 李春華, 楊斌, 劉立娜 申請人:北京集奧聚合科技有限公司