新四季網

通過混合的基於統計和用戶測量方法測量多屏幕網際網路用戶概況、交易行為和用戶群體結構與流程

2024-03-25 04:57:05


本發明總體上涉及數字設備、包括有線或移動通信的通信以及相關應用程式和服務。具體地,但不完全地,本發明涉及採集(collection)多點網際網路硬體和使用數據、將該數據融合到一起並且頻繁地發布圍繞與數字設備有關的市場級和用戶級行為的有代表性的度量以及有關的市場結構信息。



背景技術:

各種現代的媒體測量和分析解決方案集中在僅基於一個源收集數據。一般地,源是所謂的小組研究,其中通過專用設備或可下載的軟體計量器(meter)來計量用戶行為,或者通過採集關於特定的應用程式的數據的嵌入式標籤(在(網絡)站點或應用程式(應用))或SDK(應用程式)來計量用戶行為。替代地,可以通過傳統的用戶調查研究或訪談來獲取所需的數據,這會遇到回答者主觀性和不準確性的問題。

在前述研究中,明顯的目標是掌握用戶的潛在趨勢、習慣、問題和需求。然而,現有方法的每個都具有其本身潛在的問題。例如,極少例外地,招募、維持和使合法化一個在行為上且人口統計方面有代表性的小組的花費是過高的。SDK(軟體開發工具包)和標籤僅提供關於參與屬性但不是所有的參與屬性的數據。調查和訪談比實際行為更好地表明品牌實力,並且,目前沒有能夠提供關於網際網路生態系統的所有關鍵領域在如下「硬體的」、對象的、觀察驅動的數據方面的概念性信息的方法,所述數據諸如:硬體安裝的基礎和銷售、內容和應用程式分布以及如由用戶完成的使用/交易。

當今媒體和網際網路服務(諸如網站或網絡可訪問的服務)的發展比以往任何時候都快,並且新的設備不斷出現在市場中。而且,通常一個用戶具有多個(不只一個)能夠連接網際網路的設備。不僅需要對使用的整體理解,而且需要對設備和內容分布的整體理解,以向參與網際網路生態系統的關鍵客戶解釋市場動態並提供一體化的研究產品。

如一個實例,某個類型設備的普及影響著某個服務的分布,這或者是因為該服務被預嵌入到設備中,或者是因為應用程式商店(或其他內容分布機制)推動用該特定設備下載該服務。如另一個實例,了解多少人從應用程式商店下載某些應用程式是不夠的,而越來越重要的是了解從下載到實際使用的轉換,並且進一步到用戶在使用服務中花錢的轉換。進一步地,由於更好的感知功能、用戶體驗或通過社交圈,在某個設備上可獲得的服務的普及性和多樣性可以影響著該設備的銷售。因此在這個系統中有顯著的反饋迴路。

另一個普遍的趨勢是,人們不僅有多個設備,而且他們還使用由所謂的主設備完全或部分支持著工作的多個用戶界面、可穿戴技術產品或附接設備。真實的實例包括智能手錶或數字眼鏡類型的設備,所述設備進一步附接至智慧型手機設備。通過這些附接的設備和可穿戴設備的活動測量當然未來也具有關鍵重要性。

由此,需要更好地適應現代媒體環境的能夠進行觀察性網際網路測量的可擴展的媒體測量解決方案,在現代媒體環境中,設備、應用程式和服務的複雜性和碎片化已變得普遍。因此,這樣的媒體測量解決方案將提供動態的、高解析度的方法,用於全面的網際網路計量和分析,將圍繞硬體安裝的基礎、內容分布以及用戶行為的度量整合到單個框架中,以及利用一流的方法來捕獲在線生態系統的每個方面。結果產生了能夠提供遠超過系統的各部分的總和且遠超過先前孤立的解決方案的一種整合的且迅速響應的系統。



技術實現要素:

因此,根據本發明的一個方面,一種用於獲取和分析數據的至少基本上電子的系統,所述數據關於與可連接網際網路的用戶設備有關的在線用戶行為和其他活動,所述用戶設備可選地為行動裝置,所述系統被配置成:

從多個數據源採集數據,其中所述採集的數據至少包括從用戶設備獲取的個人用戶級數據以及表明整個用戶群體、活動設備或測量的服務上的行為和人口統計特徵的統計級數據,其中所述用戶級數據是優選地使用具有受控的構成(constitution)的至少一個用戶研究小組採集的,進一步優選地是從用戶小組中的每個參與者的多個設備採集的,所述採集的數據表明網際網路、內容、媒體、應用程式和/或設備使用;

利用本體(ontological)元數據方案將獲取的用戶級數據和統計級數據組織到分類數據集中,所述分類數據集優選是多義的(multivalent);

基於用戶級數據和統計級數據的結合確定電子交付物(deliverable),其中統計級數據用於校準用戶級數據;

在關於使用的設備或在線行為的若干感興趣因素方面,交付物具有動態可選擇的範圍,所述範圍優選是用戶可選擇的範圍,所述感興趣因素優選地包括應用程式使用、應用程式分布、內容使用、內容分布、應用程式貨幣化、用戶人口統計、設備分布、設備特徵、設備使用和/或時間因素。

可選地,該系統可以進一步包括採集從樣本得到的統計分層(stratification)數據,該統計分層數據估計用戶群體上的特徵的分布,其中該系統被配置成還將分層數據組織到數據集中並且利用該數據確定交付物,包括校準用戶級數據。

在一個實施方案中,從第二、潛在更大的用戶小組採集用戶級數據。但是,優選地,兩個小組自然地均包括多個用戶。優選地,小組沒有重疊(沒有共享的用戶)。相比於第一小組,可以減少對第二用戶小組構成的控制。第二小組可以對至少非常大數量(如果不是幾乎所有)的參與者開放,所述參與者可能需要簡單地滿足若干基本要求例如法律上成年。

在另一個補充的或替代的實施方案中,利用用戶設備的數據採集包括將相關的測量軟體嵌入到功能性分離的其他軟體片段中,其他軟體優選地包括被主要設計用於不同的目的,而不是數據測量/記錄和/或在例如娛樂、通信或消息發送相關的功能、數據處理工具等方面提供不同的、有區別的用戶益處。在對於用戶的單個電子軟體交付物中,可以包括測量軟體組件作為額外的模塊。

在再一個補充的或替代的實施方案中,通過用戶的一個或多個主設備採集用戶級數據,可以有一個或多個其他附接設備,諸如外部UI(用戶界面)設備(智能眼鏡等),至少功能性地連接至所述主設備,通過利用主設備作為到網絡數據採集伺服器的連接點,並且在記錄附接設備的活動中直接地(例如,通過附接設備的直接的API呼叫來觀察附接設備的狀態和活動)或間接地(例如,通過用作所謂的網關設備的設備來觀察附接設備與網際網路之間的通訊跟蹤)利用主設備來測量所述附接設備的使用。

可選地,在多設備測量的情況下,至少一個附接設備連接至的主設備被配置成執行選自由以下組成的組的至少一個動作:

a.跟蹤在附接設備與主設備之間發生的通訊、信號、或其他事件;

b.被動地或主動地輪詢附接設備的應用程式編程接口,以採集測量數據;

c.暫時地或在預定的持續時間內將採集的測量數據存儲到主設備中;以及

d.將數據發送到基於網絡的數據採集伺服器以用於分析目的。

在再一個補充的或替代的實施方案中,採集的統計級數據包括描述整個目標群體或目標群體的完整的嚴格限定的子集中的特徵分布的數據,諸如若干數據點,所述數據是從若干以網際網路網絡中心數據源獲得的,並且潛在地包括但不限於載體數據、廣告網絡數據、廣告交換數據、網站/應用程式分析平臺提供的數據、網絡網關或代理數據和/或基於需求供應或其他內容交付物平臺的數據。

應用大體上以與在此提供的描述一致的方式處理且建模的基於網際網路(網絡)的數據的集合,可以構成例如在給定市場中目標用戶(網際網路)設備的靜態當前用戶基礎的估計。可以動態地建模不同的特徵,諸如這樣的群體的增長率或下降率。換句話說,潛在地甚至作為省略在此大體上闡明且優選的用戶數據校準方面的單獨的解決方案,可以利用統計級數據諸如網絡(中心的)數據以估計網際網路設備的結構和例如安裝基礎的增長。

此外,在再一個補充的或者替代的實施方案中,採集的統計級數據包括描述目標群體的集合行為的數據,諸如多個數據點,該數據可以從例如若干內容分發平臺獲得,諸如從用戶通過數字(用戶)設備和例如網際網路能夠訪問的公共應用程式商店或數字市場獲得。

可選地,在利用統計級數據的情況下,其中獲得的統計級數據的數據是不完整的,可以使用適應於可應用的最佳理論和方法實踐的若干統計上有效的建模方法(諸如歸屬、校準和融合)來補充或調整不完整的數據。

在再一個補充的或者替代的實施方案中,通過疊加元數據平臺來結合用戶級數據源和統計級數據源,該疊加元數據平臺將在校準和處理之前和之後在不同數據源中觀察的概念、主題與實體之間的相互關係建模。

在再一個補充的或者替代的實施方案中,若干個用戶設備被配置成提供與設備外部的行為或情景事件有關的數據,例如自動捕獲的攝像機照片或音頻記錄的環境聲音或圖像識別交付物,由測量軟體將該數據與其他採集的測量數據一起發送到系統的外部數據採集伺服器以用於分析目的。

在另一個方面,一種用於獲取和分析數據的方法,所述數據關於與可連接網際網路的用戶設備有關的在線用戶行為和其他活動,所述用戶設備可選地為行動裝置,該方法包括:

從多個數據源採集數據,其中所述採集的數據至少包括從用戶設備獲取的個人用戶級數據以及表明整個用戶群體、活動設備或測量的服務上的行為和人口統計特徵的統計級數據,其中所述用戶級數據是優選地使用具有受控的構成的至少一個用戶小組,進一步優選地從用戶小組中的每個參與者的多個設備採集的,所述採集的數據表明網際網路、內容、媒體、應用程式和/或設備的使用;

利用本體元數據方案將獲取的用戶級數據和統計級數據組織到多義的分類數據集中;以及

基於用戶級數據和統計級數據的結合確定電子交付物,其中統計級數據用於校準用戶級數據;

其中,在關於用戶設備或在線行為的若干感興趣因素方面,交付物具有動態可選擇的範圍,所述範圍優選地是用戶可選擇的範圍,所述感興趣因素優選地包括應用程式使用、應用程式分布、內容使用、內容分布、應用程式貨幣化、用戶人口統計、設備分布、設備特徵、設備使用和/或時間因素。

在再一個方面,包含在非臨時性計算機可讀介質上的電腦程式產品,包括用於獲取和分析數據的代碼,所述數據關於與可連接網際網路的用戶設備(可選地為行動裝置)有關的在線用戶行為和其他活動,所述獲取和分析數據包括:

從多個數據源採集數據,其中所述採集的數據至少包括從用戶設備獲取的個人用戶級數據以及表明整個用戶群體、活動設備或測量的服務上的行為和人口統計特徵的統計級數據,其中所述用戶級數據是優選地使用具有受控的構成的至少一個用戶小組採集的,進一步優選地從用戶小組中的每個參與者的多個設備採集的,所述採集的數據表明網際網路、內容、媒體、應用程式和/或設備的使用;

利用本體元數據方案將獲取的用戶級數據和統計級數據組織到優選的多義的分類數據集中;以及

基於用戶級數據和統計級數據的結合確定電子交付物,其中統計級數據用於校準用戶級數據;

其中,就關於用戶設備或在線行為的若干感興趣因素而言,交付物具有動態可選擇的範圍,所述範圍優選是用戶可選擇的範圍,所述感興趣因素優選地包括應用程式使用、應用程式分布、內容使用、內容分布、應用程式貨幣化、用戶人口統計、設備分布、設備特徵、設備使用和/或時間因素。

根據所討論的具體實施方案,本發明的效用體現在多種方面。本發明提供了一種用於將某些類型的以用戶為中心的數據和以網絡為中心的數據組合到一起的可行的解決方案,其中,通過整合的方法可以便利地獲得所需的電子報告和其他信息交付物,在交付物中可用信息的代表性和範圍優於單獨使用不同數據源能夠獲得的可用信息的代表性和範圍,並且在硬體和用戶行為方面的度量的可用性比先前看到的更廣泛。本發明的效用還在於業內人士可以詢問這樣的數據的方式以通知他們的戰術和戰略決策,包括圍繞產品營銷、營銷活動設計、產品特徵或定價的決策、或者與數字生態系統中的個人參與者相關的投資決策。

進一步地,本發明的不同實施方案使得能夠構造交付物以在數字市場中識別市場趨勢、獲得有競爭力的見解並且了解新出現的機會。所述發明提供了多屏幕框架以及時地了解數字市場的各種特徵、有效地確定能夠在當今的多屏幕世界(包括行動裝置)中獲得統計級數據的系統、並且將該系統與從這樣的設備採集交易、行為和情景數據、通過結合的元數據框架處理產生的數據、並且通過統一的受眾測量投影運算提供聚集市場度量的創新方法關聯。

此外,本發明的各種實施方案比現有技術產生了在經濟上和技術上更可擴展的解決方案,並且相信該解決方案提供了關於更廣泛的典型數字市場的更廣泛的度量陣列的更精確的估計。由於其設計且依賴於使用多樣的用戶級數據、多樣的統計級數據和多樣的從樣本得到的分層數據的多數據源,所述實施方案通常能夠更好地適應在數字市場中的變化,尤其是在圍繞數字內容開發、分布和使用以及設備製造、分布和使用的盛行的市場趨勢中那些可觀察的變化。

表述「若干(a number of)」在此指代從一(1)開始的任何正整數,例如一、二或三。

表述「多個(a plurality of)」在此指代從二(2)開始的任何正整數,例如二、三或四。

根據在數據傳輸動作相關的分析下特定實體的角色(即發送者的角色、接收者的角色或二者),表述「數據傳輸」可以指代發送數據、接收數據或二者。

術語「一個(a)」和「一個(an)」不表示數量的限制,而表示存在至少一個所引用的項目。

術語「第一」和「第二」不表示任何順序、數量或重要性,而是用於將一個元件與另一個元件區分。

術語「統計(census)」在此指代反映給定的且精確限定的測量對象(例如用戶、服務、設備等)的組的優選地全部成員的行為、特徵或性能的系統或數據集。該數據明確地基於限定的和測量的群體的全部對象/成員,不過該限定的和測量的群體可以本身自然地是更大群體的子集。

術語「校準(calibration)」在此指代統計建模過程,通過該統計建模過程數據被加權以調整例如無反應以及其他偏見的樣本以更好地反映用戶群體、服務或設備的測量。該統計建模過程可能涉及在文獻中良好地確立的各種統計技術,包括但不限於樣本平衡、特徵屬性、特徵投影以及數據結合。

術語設備的「安裝基礎(installed base)」指的是溝通和反映例如在給定市場中在某個目標群體中分布或使用的網際網路設備(優選地包括主設備和附接設備)的數目、結構和/或交叉所有權的信息和度量。

術語「數據集(data set)」在此指的是例如藉助於本體方案的彼此相關聯的數據元素的集合。所述數據元素可以被物理地放置為分布在若干設備和/或數據結構(諸如資料庫或數據表)中。

在從屬權利要求中公開了本發明的不同實施方案。根據以下詳細描述,本領域技術人員將明了本發明的各種其他的實施方案和進一步的益處。

附圖說明

參考所附附圖更詳細地說明本發明的各種方面和實施方案,附圖中:

圖1從硬體的角度例示了根據本發明的系統的一個實施方案。

圖2例示了相比於圖1具有更多概念的和功能的方法的系統的實施方案。

圖3例示了包括若干主設備和附接用戶設備的多設備使用的一個實施方案。

圖4用功能/邏輯和硬體視圖提供了對根據本發明的系統的一個實施方案的內部的更詳細觀察。

圖5例示了可以由本發明的不同實施方案測量的不同的、潛在地以及可能地重疊的群體。

圖6例示了能夠和本發明結合地利用的網站、或特別是應用程式商店、爬行(crawling)技術的一個實施方案。

圖7描述了關於基於以例如應用程式排名的形式的可用信息對下載統計數據(例如應用程式下載的數目)估計的一個實施方案的不同方面。

圖8例示了用戶設備計量和相關記錄文件管理的一個實施方案。

圖9例示了用於與本發明結合地使用的情景分類/歸類和相關關聯的一個可行的應用。

圖10例示了為了校準變量和類別選擇(縮減)的目的的樣本審核程序的一個實施方案,用以使得能夠控制用戶級數據的數值確定和校準。

圖11是根據本發明的一種方法的高級流程圖。

具體實施方式

現代社會,設備碎片化是改變個人社交、溝通、消費媒體以及執行個人和專業任務的方式的因素之一。近來消費者與數字媒體以及資源的交互已經變為移動的:他們使用智慧型手機、平板電腦、筆記本電腦、臺式機等來執行這樣的任務,並且許多人甚至在日常基礎上(每天)利用多個設備用於這些目的。

此處描述的框架可以體現為用於或者至少能夠用於測量關於或者圍繞在各種數字設備上表示的消費者行為的大量特徵的系統。

可以確定的特徵包括但不限於消費者、或大體上用戶、各種設備的使用、這樣的設備的安裝基礎、用戶動作,即用戶用他們的設備做什麼,由此找出例如用戶如何經由這些設備使用應用程式(應用)和網站的方式,用戶下載的應用程式、網站或媒體是什麼和/或用戶與什麼應用程式、網站或媒體交互,以及如何將這些應用程式、服務和內容首先分配到設備。可以建立下載應用程式和實際使用應用程式之間的聯繫。可以分析與數字設備有關的或使用數字設備的經濟交互。可以調查在多個數字設備的使用中的區別和聯繫。

可以如由根據本發明的系統和方法的實施方案提供的,以不同層次的細節(即在全部應用程式上,對於各種類型的應用程式或對於特定的應用程式),為各種受眾(即用戶/消費者組)和/或在不同的時間周期內(例如在每日/每周/每月基礎上)檢查以上特徵。

通用使用縱向被動計量,此處描述的框架被用於使用大規模持續樣本(例如Verto Partner PanelsTM)來觀察性地、有利地測量數字行為以捕獲碎片化活動的長尾(long-tail)。可以在若干基本上獨立的數據源的基礎上校準所獲得的數據並且對所獲得的數據進行質量控制,所述數據源包括例如用於人口分布校準的從樣本得到的分層數據、用於行為概況分析的具有被動計量的仔細-分層的縱向小組、以及用於行為校準和衡量的統計-數據。

本文描述的系統的交付物下面的一個概念在於將例如以下三個不同類別的信息橋接在一起的能力:

1:硬體分布數據,該數據表示不同(移動的)平臺和設備的普及和分布,反映(移動的)硬體市場中的持續變化;

2:應用程式(應用)分布和貨幣化數據,該數據表示不同(移動)應用的普及和分布、量化通過這些應用程式的銷售和由用戶所做的應用程式中的購買產生的收入的數據;以及

3:應用程式/內容使用和參與數據——該數據示出消費者如何與(移動的)內容(例如應用程式、微件、網站)交互和接合。

除了或替代移動平臺/設備/應用程式相關的分析,假設有足夠的源數據可用,則可以進行涉及基本上不移動的或不可攜帶的設備的相應的分析。

圖1在100處從概念的和以設備為中心的角度例示了根據本發明的系統的一個實施方案。

提供了一個包括若干至少功能性連接的伺服器108的電子系統110用於如下活動,像關於用戶102(典型為人)的與可連接的網絡(優選的可連接的網際網路107)、用戶設備104諸如桌上型電腦、筆記本電腦、平板電腦、蜂窩電話並且特別是智慧型電話、附接設備諸如各種輔助設備104a、104b(例如,眼鏡類型的用戶界面、智能電視或其他用戶界面設備)相關的在線行為或其他活動的數據獲取和分析。根據該實施方案和所採用的角度,系統110可被認為包括若干用戶設備104——可選地為輔助設備104a、104b——以及另外的元件(諸如數據源)。

除了利用用戶設備104、104a、104b,優選地經由用戶設備中提供的可被稱為研究計量器的計量/數據採集應用邏輯105(軟體)捕獲的用戶級數據之外,還可以從若干用戶獨立的數據源107a(諸如在線服務)獲得表示整個目標群體或例如整個目標群體的完整的且嚴格限定的子集中的特徵分布的統計級數據,所述用戶獨立的數據源可以包括至少一個網絡載體、廣告網絡、廣告交換、網站或應用程式分析平臺、網絡網關、網絡代理和/或內容交付/分發平臺例如內容管理平臺或應用程式商店。可以由關聯的數字、連接網絡的設備(諸如伺服器)通過由系統110經由例如可用的應用程式編程接口(API)發起的輪詢或提取程序,和/或通過由數據源/伺服器107a本身根據預定的邏輯例如響應於滿足觸發條件發起的推送機制來提供來自這些數據源107a的數據,所述觸發條件可以包括基於定時器的條件(除了其他選項之外,每日、每周或每月進行數據傳輸)。

系統110被配置成藉助於本體元數據方案和若干不同處理技術將在所獲得的數據中觀察的實體採集、分類併集合到多級分類本體中以恰當地服務目標實體102a,所述目標實體可能包括一個或多個公司、人或基本上任何訂購分析結果和/或對分析結果感興趣的目標群組或客戶。即,這些群組可以被提供有所需類型的交付物,所述交付物潛在地包括但不限於經由適當的客戶端裝置(諸如計算裝置和在計算裝置上運行的瀏覽器)可訪問和/或可觀察的以數字文件或其他表示(有利地包括視覺表示)形式的電子報告。

實際上,用於訪問系統110和/或檢查交付物的用戶界面112可以包括優選地經由一般網絡瀏覽應用程式可訪問的、可選地補充有定製的附加模塊以增強使用體驗的基於網絡的用戶界面。基於網絡的界面可以被配置成允許用戶便利地監測最新的或歷史數據(分析結果)、識別數據中的變化(趨勢等)和/或可選地如果需要的話使用歷史或當前的數據通過基於網絡的報告界面的交互和反應的部件來執行點對點(ad-hoc)的分析。另外或替代地,可以經由若干其他輸出通道,例如經由通過目標應用程式和/或服務可訪問的若干應用程式編程接口,或者經由電子郵件來提供交付物。

由於群組的興趣可能變化,系統110被配置成根據經由UI 112向系統提供的客戶端的需求優選地動態地確定分析的範圍和/或交付物的範圍。除了其他選項外,可以由用戶群體、使用的設備、使用的應用程式、應用程式貨幣化和/或時間因素來限制範圍。例如,系統110可以被配置成提供如下一個用戶界面112,該用戶界面實現用於調節數據分析和/或數據表示的範圍的至少一個用戶可改變的特徵,所述數據分析和/或數據表示的範圍選自由以下組成的組:在例如一個或多個目標組/受眾方面的過濾器、用以探索的一個或多個度量的選擇、範圍(例如設備類別、設備品牌、應用程式類別、特定應用程式、網站等)的選擇以及所需時間周期(例如「2014年1月」)和/或時間解析度(例如每日、每周、每月等)。

圖2在200處從更多概念和功能的角度表示了系統的一個實施方案。總體的數據(處理)流程在圖中由數據採集活動與產生/輸出活動之間的水平箭頭表明。

在202處,結構研究208被表示為例如在系統中被用作數據校準的基礎的一個信息源。

優選地,結構研究208是獨立調查或者包括獨立調查,以提供用於諸如確定用於(第一)研究小組216招募的所需小組分層(即配額(quotas))的若干動作以及在數據採集過程202期間採集的以及在數據產生過程204期間採集或收集的結果數據的校準的獨立基礎(潛在地連同統計級數據211一起)。結構研究208可以被實現為離線研究以最大化例如其覆蓋範圍/代表性。

結構研究208被設計成概述基礎統計假設,所述基礎統計假設描述研究的群體。結構研究208可用於回答(概念性地)例如以下問題:

●期望市場(例如,某個國家、州、地區或其他地理區域)的(成人)群體的設備所有權特徵是什麼?

●測量的設備所有者的社會人口統計特徵是什麼?

可以通過也將實現本發明描述的系統的群組或替代地以方法的某些實現方式來實現結構研究208,所述研究208可以由有信譽的且可信的市場研究供應者或可用的其他社會研究者授權或委託。存在能夠提供足夠滿足以上所列需求的數據、並且能夠容易地從第三方研究供應者授權或委託的多種研究方法。

統計數據211可以包括網絡統計數據210,該網絡統計數據可以例如通過網絡通訊或網絡活動監測獲得,以及具體地例如應用程式商店數據212。優選地,統計級數據描述了各種對象,在一些實施方案中所述對象可以包括設備、用戶、服務、應用程式或網站。由此包括在統計級數據中的每個數據集應當提供關於特定數據集應用到的整個群體的聚集的或者實例級(case-level)的特徵和信息。統計數據211可與結構數據208一起使用以校準在數據採集過程202中採集的數據以及在數據生成過程204中採集或收集的數據。

元數據214是、包括或者限定了用於限定實體分類法(taxonomy)的本體數據集,所述實體分類法服務用於將在數據採集過程202和數據生成過程204期間發現或觀察的實體(例如行動裝置、作業系統、訪問的網站、應用程式等)分類。該數據可用於:

●將相關數據項分組到如在數據生產過程204期間所需的類別中,和/或

●在交付物206中獲得分類組織的數據。

研究計量器217可以實現為軟體,該軟體被獲得、可選地下載到並且安裝在數字設備(例如,計算機、智慧型手機、平板電腦等)上以監測和記錄數字設備上的活動。研究計量器可以基本上作用為用於本發明描述的系統和框架的數據的主要源,並且其數據被用於採集:

●關於在第一研究小組(參見以下)216中監測的設備的行為/活動的觀察數據,和/或

●關於在第二研究小組218(例如前述的Verto Partner PanelTM)中監測的設備的行為/活動的觀察數據。

現在,最後更詳細地考慮小組216、218,第一研究小組216優選地是數字設備用戶的被動計量小組,應當優選地使用一種選定的且限定的方法來聘用該小組。在一些實施方案中,該方法可以涉及諸如通過彈出窗口攔截、在線訪問小組邀請、機會登記攔截促進的CAWI(計算機輔助網絡訪談)、CATI(計算機輔助電話訪談)、CAPI(計算機輔助個人訪談)的技術或其他常用的且很好地建立的研究方法。

應當有利地基於從結構研究中得到的目標配額確定小組組成。小組成員將具有安裝在他們數字設備上的研究計量器217,並且研究計量器217將隨後被動地監測他們的行為。被動計量通常指的是這樣的技術,其中軟體跟蹤用戶活動或情景參數,至少在很大程度上運行在所述設備的後臺,用戶不需要與該軟體單獨交互。在將這些軟體計量器安裝到數字設備時,用戶可能需要完成安裝相關的步驟。在一些實施方案中,運行在這樣的設備的一個軟體計量可能還產生關於若干其他數字設備上的測量數據,所述其他數字設備例如功能性附接到主設備並且由此可選地無線地與主設備通信的數字設備。

第一研究小組216的一個目的是為消費者行為提供高質量(即,高度受控、良好校準的)數據源。研究樣本的大小將提供有限的數據深度(即,長尾數據的有限可用性),然而該小組將專門為那些對象(例如,應用程式、網站、設備製造商、人口統計組等)提供高質量數據,如果仔細實現的話,所述對象的受眾/用戶足夠多。

詳細地並且根據研究計量器217的實施方案,並且在數據生成過程204完成時,小組216可以被設計成提供回答例如以下問題的高質量數據:

●在某個市場的消費者中數字設備的使用率和普及率是多少?

●消費者在他們的數字設備上與什麼資源(例如,應用程式、網站、媒體)交互?

●消費者如何經由他們的數字設備與上層資源(例如,應用程式、網站、媒體)交互?

●消費者為什麼、何時、如何以及以多少數量在數字設備上花錢?

●當考慮具有多個數字設備的消費者時,以上問題在設備之間如何變化?

●應用程式/內容分布、使用、替換和/或增量使用中的趨勢是什麼?

來自小組216的數據可以形成或被用於形成一個主要的交付物206,並且將體現基於第二研究小組218(例如,Verto Partner PanelTM)得到的輸出數據的形式。

如在此提到的,可以基於一組分層的配額來招募小組216,並且可以基於結構研究208的結果確定小組分層。

在被邀請參加第一研究小組216之前(即,在進入抽樣框架之前),回答者應當滿足若干基本的標準,所述標準可以包括關於例如回答者的年齡以及住所、設備/網絡所有權以及可訪問性、調查參與歷史等的不同要求。

可以用所期望的形式補償參加小組216的小組成員。應當與產生這樣的小組成員的樣本供應者一起合作來為每個特定的小組成員確定滿意機制和激勵處理。激勵可以是數字的並且數字地分派,諸如對數字內容、服務、應用程式等的訪問或提升的訪問/用戶權限。

第二研究小組(例如,Verto Parnter PanelTM)18優選地是最有利地經由任意抽樣招募的數字設備用戶的被動計量小組。在一些情況下,招募可能是間接的,考慮到例如以下情景,在所述場景中研究計量器217由於嵌入在用戶最初不是為了參與研究學習的目的而下載的某個面向終端用戶的應用程式中而被包括。小組將由如下的用戶組成或包括如下的用戶,即用戶已經:

●安裝捆綁有一個或多個行動應用程式的研究計量器217;

●向系統提供他們的人口統計概況數據;和/或

●同意向系統提供匿名數據。

由於默認情況下小組的組成基本上是不受控制的(即,「基本上都是受歡迎的」)或幾乎不受控制的,小組218的作用在於開發能夠提供深層次的長尾數據的非常大的樣本。小組218可以被具體地配置成為大量的對象(例如,應用程式、網站、設備等)提供補充數據。

並且鑑於前述內容,由於樣本的人口統計和行為代表性是不受控制的,樣本的數據將不用於校準其他數據。替代地,在數據產生過程204期間用更有代表性和受自然控制的數據(諸如來自第一研究小組216的數據和在數據採集過程202中採集的其他數據)來校準來自小組218的數據本身。

更詳細地涉及小組218的哲學和相關技術特徵,由於在此描述的框架旨在對於其進行報告的對象非常碎片化,在實際情況下,不可能在沒有非常大的樣本規模的情況下提供關於數字行為的完整的/深度的數據。使用為第一研究小組216(參見以上)設計的嚴格的程序招募非常多的樣本在每個小組成員的基礎上將是非常昂貴的。因此,將通過開發優選地在方便的(不受控制的,或「利用任何可能方法的(catch-as-catch-can)」)基礎上發展的第二小組218來補充第一小組216。

小組218優選地不限制規模。然而,在一些實施方案中,當通過應用的質量控制和確認過程選擇的小組成員的數量超過預定數量例如20,000(兩萬)時,僅可以在交付物206中包括來自小組218的數據。

在優選的實施方案中,第二小組218的組成不是先驗地受控的,但是確認狀態被有利地設計以另選擇相關回答者包括為事後確認(標籤內)的小組成員。

可以從行動裝置用戶(即,例如iOS、黑莓、安卓和/或Windows行動裝置的用戶)群體中招募第二小組218的小組成員。例如,小組成員的特定的源可以是那些已經安裝了集成有研究計量器217的一個或多個行動應用程式或例如研究SDK(軟體開發工具包)的用戶。

原則上,已經安裝了集成的應用程式的每個用戶可以被邀請參加第二小組218。可以經由應用程式本身,使用例如可視消息提供邀請。該參與是基於用戶的自願選擇參加的。但是,為了監管和道德要求,可能必要的是在選擇參加的同時,用戶表明他們的出生年份作為預選的特徵(例如,低於18歲的用戶將被自動地退出)。

可以執行招募調查以採集關於回答者的基本的/最小的數據,以適當地對他們的數據加權。在小組218的招募調查中採集的基本的人口統計信息可以包括例如設備類型、移動載體、性別、教育、地理位置、家庭規模等。

從若干源技術性地得到用以給巨大的小組成員數據加權的該信息,可選地自動利用例如基於軟體的觀察、或者集成選擇的第三方以描述小組成員、或者使用一些彈出窗口或問卷形式為小組成員實現這一目的。

交付數據206是在此描述的系統的最終輸出,但是顯然地如果需求出現,接收交付數據的客戶102a可以進一步例如用專有工具等確立數據。交付物206包括例如關於設備使用、應用程式/服務使用和用戶行為的校準的、處理的和歸類的信息,可選地經由基於網絡的用戶界面使得交付物對客戶完全地或部分地可用。替代地,例如可以利用本地應用程式來消耗該信息。

交付物206可以例如在後端體現為單一的、統一的資料庫。然而,每個客戶可以被指定特定的用戶權限以通過可用的用戶界面諸如基於網絡的界面訪問交付物的有限部分。

例如,交付物可以包括選自由以下組成的組的至少一個元素:硬體分布、內容分布、應用程式/內容使用和參與以及應用程式分析。

圖11示出了根據本發明的方法的一個實施方案的總體流程圖1100,涉及以上解釋的主題和特徵。

在開始1102處,該系統被增加,這可能指的是獲取和配置相關硬體和軟體。系統可以包括可選地布置在例如雲計算環境中的若干伺服器設備。此外,可能已經在這個階段發起至少第二用戶小組的小組成員的「沉默的」招募,例如經由方便的採樣以及傳遞到多個用戶設備(諸如移動終端或其他終端,優選地如捆綁有其他軟體)的相關的測量、記錄和報告軟體。而且,例如可以選擇統計級數據的供應者並且可以建立必要的數據通信通道。

在1104處,執行結構研究以確定第一研究小組的分層(配額)、測量領域的屬性(人口統計等),這些應當被用於小組數據的校準等。然後可以相應地執行小組成員的招募,特別是為第一小組216。

在1106處,優選地從多個源諸如應用程式商店、網絡數據供應者等獲得統計級數據。

在1108處,從小組成員接收用戶級數據。

在1110處,發生數據處理,包括將數據進行組織。校準用戶級數據例如用從樣本得到的分層數據(從結構研究208)和/或統計級數據如以下將進一步詳細描述的那樣執行。

在1112處,構建基於採集的統計級數據和用戶級數據的交付物。項目1116指的是形成交付物的內容和/或形式的消費者輸入(儘管直到項目1112才在圖中表明,但是這樣的輸入可以在各種處理階段被系統接收並考慮)。

在1114處,方法執行結束。

如在圖中由各種虛線迴路箭頭表明的,如對於本領域技術人員在該公開文本的基礎上清楚的,項目的執行可以是並且通常是重複的和/或迭代的。執行順序還可以根據例如新數據的可用性改變,並且考慮到例如潛在的用戶級數據的迭代校準,並行或替代的項目處理可能並且通常將在現實生活的實現中發生。

參考圖3,在300處描述了與本發明結合使用的可行的多設備方法的一個實施方案。總體上,在用戶102與他/她的設備104、104a之間的通信用實線例示,並且在設備之間的通信用虛線表明。實際上,在本發明的優選實施方案中,即使由於實際原因這些設備中一個或多個不能或將不被配置成執行基於至少全面的軟體或硬體的數據採集技術,依然可以跟蹤單個用戶的多個設備。特別地,系統被優選地配置,使得即使用戶102與可附接或可穿戴設備或者外部用戶界面(例如是智能手錶設備或數字眼鏡類型的數字屏幕)交互,也可以採集相關的測量數據。在這些情況中,系統利用所述附接設備或用戶界面104a連接到的在中間的所謂主設備104來執行如下功能中的一個或多個:

1.跟蹤在附接設備104a和主設備104之間發生的通訊、信號或其他事件。

2.被動地(基於例如一些情景事件觸發器)或主動地(例如基於預限定的間隔)輪詢附接設備104a的應用程式編程接口(API),以便採集測量數據。

3.在主設備中暫時地或在預定持續時間內存儲採集的測量數據。

4.將數據發送到系統的基於網絡的數據採集伺服器108,以用於分析的目的。

優選地,主設備被配置成跟蹤、存儲和發送數據,使得最初涉及特定設備(或者主設備本身或者任何附接設備)的數據可以隨後被跟蹤返回到同一設備。在一種可行的實現方式中,雖然用戶可具有指定給他/她的某個用戶識別編碼或號碼(身份標識),設備中的每個(不管他們是否是主設備104或附接(從)設備104a)也具有它們自己唯一的設備標識號,儘管它們中的一些可能相互連接。

除了在分析階段期間的潛在利益外,這種實現將使得能夠將獲得的使用數據分解到不同設備和用戶界面中。此外,在某些實現方式中,除了指定例如用戶身份標識號碼和/或設備身份標識號碼(對應於主設備)以外,可能存在於主設備中或遠程伺服器中的處理跟蹤/測量的引擎可以被配置成為連接到主設備104的用戶界面/附接設備指定或註冊用戶界面身份標識。

實際上,在很大程度上由主設備104執行並領導測量(例如該設備被用作數據存儲和朝向網絡的網關,並且處理使用的不同用戶界面的身份識別/註冊),但可能例如通過附接的、約束的從設備104a發生接合和用戶動作的實現方式中,例如可以執行如下技術步驟:

1.在連接到主設備時由主設備或者通過對新連接的動態監聽、或者替代地例如通過定期地輪詢關於成對的或連接的設備的信息註冊新的或現有的用戶界面;

2.對於每個設備,跟蹤狀態信息,優選地包括心跳(設備處於打開狀態,即使沒有發生與內容、服務、應用程式的活動接合))。

在此處描述的跟蹤多設備或多用戶界面行為的系統中,主設備104應當有利地記錄事件和其他測量數據(潛在地主要包括屏幕快照),而不用這些活動為附接設備104a增加負擔。主設備104可以被配置成使用可用的廣泛使用的應用程式編程接口或者其他功能呼叫來採集該數據,或者替代地/額外地在一些實現中,主設備可以跟蹤更多基礎信令通訊通道、HTTP數據(超文本傳輸協議數據)(由於主設備被用作一種網絡網關)或者其他棧或較低層次的應用程式編程接口。

參考圖4,在該圖中從功能/邏輯401A和硬體角度401B示出了根據本發明的系統400的一個實施方案的內部。

項目412指的是主控制邏輯,其負責從各種源獲取數據、在不同實體之間的數據傳輸、配置管理等。

項目410指的是若干數據存儲庫,諸如用於存儲採集和處理的數據的資料庫。

項目414指的是用於將數據組織和分類到多義數據集中的本體元數據方案。

項目416指的是用於輸出包含結合的、歸類的多級數據的交付物的用戶界面,該多級數據是通過處理和分析採集的用戶級數據和統計級數據獲得的。

項目408指的是在系統或伺服器端的用戶級數據採集邏輯,而項目402指的是研究計量器217或(研究軟體開發工具包),即在用戶設備上並且例如與在線/移動服務結合負責數據計量、記錄、潛在地處理並且轉發的邏輯。優選地,準備該邏輯,使得可以將該邏輯容易地插入到任何在線或移動服務或者應用程式中,並且當人們使用這些特定的服務或應用程式時,則該邏輯在後臺被激活,運行測量並且能夠向建議的系統的伺服器發送測量數據。所有這些可以發生,而不必須向「主應用程式」提供任何界面或配置可能性影響邏輯如何工作。然而,在一些實現中,可以有在邏輯模塊中建立的若干選擇的「反饋迴路」,使得它可以提供信號、數據或其他某些東西返回主應用程式。

為了監督/管理的目的,將優選地隨時保持與邏輯402集成的應用程式的列表。可以給予安裝集成的應用程式的每個(移動)用戶機會以參加(選擇參加)第二研究小組218。由此,該已經安裝集成的應用程式的用戶群體可以為第二小組218建立樣本框架。

項目404相應地指的是統計級數據採集邏輯。儘管在圖中沒有明確表明,在該情況下在遠程實體處(例如在運行和/或管理在線服務的伺服器處)安裝的研究軟體開發工具包或相應的數據採集實體也可以被用於數據採集的目的。

項目406指的是數據分析邏輯,其被配置成利用例如方案414驗證、結合、校準、處理和組織採集的數據,以獲得所期望類型的交付物用於經由用戶界面416輸出。

硬體方面401B,應用設備諸如伺服器和用戶設備(主設備和附接設備二者)中的每個可以包括若干處理設備420,諸如用於處理指令和數據的微處理器、微控制器、信號處理器等。進一步地,它們可以包括用於存儲程序指令和其他數據(諸如採集的用戶級和/或統計級數據、經處理的數據、本體方案、交付物等)的存儲器(晶片)422。

數據接口426可能指的是例如可以為有線或無線的對等接口或網絡接口。伺服器型設備通常包括具有例如乙太網或其他區域網型連接手段的(有線)網絡適配器,而移動用戶設備通常可以包括用於訪問網際網路和/或與附近的其他設備通信的若干無線收發器,例如蜂窩收發器(例如3G)和/或WLAN(無線區域網)或藍牙收發器。還可以包括標籤閱讀器(例如,RFID(射頻識別)或NFC(近場通信))。用戶界面可以包括顯示器424和數據輸入設備430(諸如鍵區、鍵盤、觸摸界面(例如觸控螢幕)等)。此外,設備通常包括各種其他元件428,諸如一個或多個傳感器、電源部件、外殼等。

用於通過若干計算機設備執行本文所述的方法步驟和總體的程序的程序代碼(軟體)可以大體上設置在載體介質(諸如存儲卡或光碟)上或者通過有線或無線通信介質被傳輸。

參考圖5,在500處示出了經由統計數據211測量的不同潛在群體之間的聯繫。即,在統計數據211中包括的數據可以被劃分為獨立的且不相關的數據集,數據集中的每個報告關於整個用戶群體(或者「計算機用戶」510、「行動網路用戶」512或者「移動非網絡用戶」508)的特定子集的數據。

前述三個群體有可能重疊:個人可以同時是計算機用戶、行動裝置用戶以及行動裝置應用程式用戶。然而,不同統計數據提供者通常將具有在這三個子群體中的每個中的不同範圍。

為了為統計數據211提供可靠的數據以用於在校準中使用,優先選擇統計數據供應者,使得同時最大化(優選地接近100%)這三個群體中的每個中的範圍,並且最小化(優選地接近0%)在統計數據供應者之間特定用戶被兩次計數的可能性。

實際上,在全部三個測量子群體之間可靠地接近100%範圍的一種方法是結合多個統計數據源。然而,由於必須最小化特定唯一用戶已經被兩次計數的可能性,在這些統計數據源之間重疊的受眾必須先驗地被最小化。推薦的是實施本發明的系統的人員仔細選擇統計數據供應者,以精確地確定他們在測量的每個子群體中和每個子群體之間的範圍和重疊。

為了校準的目的,優選地相對其他數據源在及時的基礎上(例如每月)處理和比較統計數據,並且調整校正運算使得例如關於使用中的設備數目或激活的新設備的公布估計值儘可能地接近真實數目。

統計數據可以以原始級形式獲得,包括例如對於關於用戶或設備類型相關的每個領域,公開在某個時間期間所看到的唯一用戶的名義或相對數量和/或例如對於某個國家在某個時間期間觀察到的動作的名義或相對數量的表。

在一些實施方案中,系統可以被配置成利用在提供的原始級信息中的原始級字符串來自動地或半自動地(例如,用人力管理)識別用戶類型、設備類型以及使用的應用程式。原始級字符串可以包括,例如用作標識符的數據的字母數字片段。類似地,基於例如任何設備相關的身份標識(諸如序列號),設備的暫時的或永久的唯一的號碼可以算是統計數據的任何設備和/或應用程式專用部分。

在本發明的一些實施方案中,可以招募小組216、218,而不需要控制在小組相應的樣本分層中的行為偏差的技術手段。

雖然結構研究208提供了人口統計控制和校準的一些測量,其聲明基礎使得其行為價值對於校準小組216、218的行為代表性沒有多大意義。

在一些情況下,統計數據可以包括反映用戶、設備或服務的整個限定的子群體的行為的特定數據點。可以使用這樣的統計數據,以校準由前述無能引起的任何不經意的行為偏差,從而將行為特徵納入相應小組216、218的樣本分層。可以提供在校準中使用的統計級行為數據的統計數據的一個實施例是關於在行動應用程式商店(應用程式商店)中可獲得的應用程式的統計級信息,其被表示為應用程式商店數據212。

切換到圖6,應用程式商店數據或類似的數據可以被機器人/爬行器巧妙地採集,所述機器人/爬行器被編程以例如定期掃描公開可用的或專有的接口,在圖中600處例示了其實施方案。

例如每天(每24小時一次),本發明的系統可以被配置成可選地經由適當的應用程式編程接口連接到監測的應用程式商店或其他或多或少對應的內容交付/發布平臺,並且通過在應用程式商店列出的每個應用程式迭代。關於每個應用程式,系統可被配置成記錄例如一個或多個數據點,諸如討論中的應用程式商店、時間戳、討論中的應用程式名稱等。

關於每個應用程式,系統可以被配置成記錄例如以下數據項目的一個或多個:

●應用程式商店。表明從其中採集數據的應用程式商店的唯一標識符。

●時間戳。表明何時從應用程式商店採集數據的世界標準時間(UTC)時間戳。

●應用程式標識。討論中的應用程式的身份標識編碼或名稱(或其他唯一標識符)。

●關於排名列表中應用程式位置的信息。

●應用程式目錄。描述如何分類應用程式的數據。

應用程式商店爬行器可以具有主伺服器單元608,該主伺服器單元能夠將數據存儲到原始資料庫612中並且訪問元數據存儲610,該元數據存儲包括關於已經掃描的且分類的應用程式的信息以及例如應用程式商店爬行器的狀態。

然後,應用程式商店爬行器可以被配置成利用多個不同用戶帳戶和/或其他面向仿真器的特徵以「假扮」或仿真例如特定無線設備或特定用戶,和/或通過使用代理/VPN(虛擬專用網絡)隧道606或者通過直接訪問應用程式商店的應用程式編程接口(有時公開的,有時私人的),部分地(in patches)或者一個接一個地從例如不同國家中的不同應用程式商店實例602、604請求信息,並且因此將相關數據抓取到平臺。由此系統可以被設計成使用面向仿真器的特徵和/或其他技術,如選擇的隧道和動態IP位址方案,以高效地爬行不同供應者、國家和本地化的應用程式商店的應用程式編程接口。

因為通常沒有或者至少不是全部可用的應用程式商店公布(公開地)每個應用程式的實際下載數量,可以基於為每個應用程式採集的各種數據點(諸如但不限於特定國家的應用程式排名、用戶評級得分等)來估計下載數量。

圖7在700處描述了如下一個實施方案的不同方面,該實施方案關於基於以例如排名和/或評級(涉及估計的目標實體)形式的可用信息的下載統計(例如,下載數量)的創新估計技術。通過該解決方案,除了其他用途之外,其能夠為各種各樣的應用程式集合產生估計。

許多應用程式商店(諸如iTunesTM和Google PlayTM)的確會公布智慧型手機應用程式的一些類型的排行榜和例如評級,但是它們不會至少綜合地公布不同應用程式的實際下載數量。然而,對於行動應用程式市場中從應用程式開發者到市場研究人員的許多人員對下載信息具有很大的興趣。優選地,在若干源(諸如前述應用程式商店)中仍然有關於應用程式的公開地可用的排名信息。為了使用關於每個應用程式公開地可用的信息並且除了其他因素之外依賴由討論中的應用程式商店為每個應用程式公布的排名位置來估計列在應用程式商店中列出的應用程式的例如每日下載數量,接著在下文描述許多種方法。

在介紹進一步的細節之前,首先假設在給定應用程式商店中的排名位置與由給定應用程式實際經歷的(每日)下載數量之間的良好限定的數學關係的確存在,並且該排名位置數據可用。此外,在確定若干模型參數時需要一組地面真實(ground truth)數據。

由此,通過例如從應用程式商店為給定的一組應用程式獲得的(每日)排名位置數據以及例如從地面真實數據的獨立源得到的若干恰當確定的模型參數,使得能夠使用數學模型來估計每個所期望的時間參考的下載量,諸如在此取作實例的前述每日下載量。

關於模型本身,先前已經建議了一個簡單的冪律模型,但是當相對地面真實數據監測時,存在提供不同精確度的若干其他選項。特別地,闡明以下模型:

指數的:

d(r)=a*exp(b*r)

對數-正態的:

d(r)=a/rb*exp(c*log2(r))

具有指數截斷的冪律:

d(r)=a/rb*exp(c*r)

洛馬克斯(Lomax):

d(r)=a(1+b*r)c

其中,d(r)指的是(每日)下載量,以及r指的是排名。雖然建議的指數模型僅具有兩個參數,但其餘的模型具有允許建模更複雜的關係的三個參數。例如,對數正態模型包括如下參數:比例參數a,以及確定模型的坡度和曲度的形狀參數b和c。

建議的方法涉及以下步驟:

1.假設模型702。在建議的方法的第一步中,假設應當使用的數學模型。例如,可以(並且優選地)考慮前述的指數的、對數正態的、具有指數截斷的冪律以及洛馬克斯模型。

2.擬合參數704。給定假設的模型,使用外部數據712、714(諸如已知的排名位置和下載數據)來將參數擬合到模型,以獲得重申的模型706。可以通過將模型轉換到它們的對數形式來便於該處理。

冪律:

log(d(r))=log(a)+b*log(r)

指數的:log(d(r))=log(a)+b*r

對數正態的:

log(d(r))=log(a)-b*log(r)+c*log2(r)

具有指數截斷的冪律:

log(d(r))=log(a)-b*log(r)+c*r

洛馬克斯:

log(d(r))=log(a)+c*log(1+b*r)

3.對於每個目標應用程式,利用708重申的模型構建下載估計710。已經將參數擬合到模型後,根據可用的外部數據716,應用例如以下描述的兩個算法中的一個為特定的應用程式估計下載數量。

算法1指的是其中當前(每日)數據可用的情況。當外部(地面真實)數據對應用程式的樣本是本質上每日的且當前可用的時,能夠使用以上描述的參數化/擬合的模型中的任何一個為該樣本外的具有給定排名r的應用程式估計下載數量。實現該算法的過程可以採取以下步驟:

1.對於選擇的模型,通過假設如從外部(地面真實)數據獲得的r的值並且使用算法形式的應用程式模型來估計除了r的所有參數的值,以估計其餘的參數。

2.重申選擇的初始模型,應用來自(1)的估計的參數值代替模型中表明的參數。

3.在給定的一天中假定應用程式排名r,則可以通過計算在(2)中確定的公式來估計在該給定的一天中該應用程式的下載數量。

算法2指的是其中外部(地面真實)數據具有不連續可用性的情況,使得最初有可用的每日數據並且隨後僅有可用的每月數據。然後仍然能夠使用以上所述的參數化/擬合的模型中的任何一個為具有給定排名r的應用程式估計下載數量。

實現算法2的過程包括:

1.通過在每日數據可用時計算基於時間周期內的該每日數據準備的每日模型上的適當的參數的平均值,估計可適用的形狀參數。

2.通過以下估計比例參數a:

(a)取如在先前兩個月內的外部數據中看到的最高下載值;

(b)將從(a)得到的每個值除以30以確定先前兩個月的每天內每日下載數量的線性估計,以及;

(c)使用從(b)得到的值,線性推斷當前日期(或討論的日期)內的下載數量d。基於d並且如果需要基於從(1)得到的形狀參數,估計參數a。

3.重申選擇的初始模型公式,將從(1)和(2)得到的參數值應用代替模型中的參數。

4.在給定的一天中假定應用程式排名r,然後可以通過計算(3)中確定的公式估計在該給定的一天中該應用程式的下載數量。

參考圖8以及在800處描述的情景,在用戶設備處運行的研究計量應用程式邏輯217被配置成提供數字設備的觀察/記錄小組成員使用的被動方式。具體地意味著被動地觀察、記錄並且上傳814小組成員活動的日誌812到系統的伺服器以用於存儲和分析816、818。

計量邏輯217存在於被計量設備的存儲器中。當在設備上發生特定事件808時,計量器217被觸發804並且關於事件的信息被記錄806、810。

日誌文件管理和傳輸遵循以下規則和程序中的一個或多個:

●對於特定的小組成員和具體的計量設備,鑑別每個日誌文件,

●在被計量設備上本地存儲日誌文件,

●在被計量設備上使用相關的壓縮算法將日誌文件本地壓縮,

●基於網際網路連接的可用性將日誌文件異步傳輸到「等待的」(802)遠程伺服器,

●為最小化對設備性能的影響,僅當網際網路連接可用時發起日誌傳輸,和/或

●在延長時間段內沒有網際網路連接可用的情況下,將在被計量設備上本地存儲最高達預定數量(例如約10MB)的日誌文件。

由計量軟體217採集的數據將被分成多個(例如,三個)概念類別:

●事件元數據:這是描述事件情景(context)的信息,並且優選地在由研究計量器登記的每個類型事件之間相同;

●事件數據:這是專用於記錄事件的信息,並且事件數據的內容可以根據已經記錄的事件類型可以改變;和/或

●心跳數據:這是通知系統小組成員/設備保持「活動的」並且連接到網際網路的信息。

由計量器217記錄的事件數據將優選地主要地由系統的伺服器處理,這是為了:

a)清除數據,

b)在需要的地方,將事件元數據連接到底層事件,

c)將標識符映射到相關實體,和/或

d)從記錄的數據計算度量。

由研究計量器217記錄的每個事件將優選地記錄以下元數據中的至少一些,例如:

●小組成員/設備ID。這是識別特定小組成員和具體計量的設備的唯一標識符(小組成員/設備的鑑別性特徵)。

●時間戳。這是表明事件何時發生的UTC(世界標準時間)時間戳。

●地理位置。這是關於當事件發生時客戶端用戶的地理位置的技術信息。如果可以在地理位置坐標的水平上捕獲該信息(通過機載全球定位系統或者無線定位軟體),則其將是理想的。該數據點可以接受「未知」值。

計量器217可被配置成利用外部伺服器來採集若干選擇的數據點,該數據點優選地還經常與在設備本身中運行的設備上的計量器相關。這樣的實施方式的一個示例性設置將是VPN(虛擬專用網絡)或代理伺服器,通過它們可以引導且單獨地記錄所有或一些超文本傳輸協議數據。

設備上的計量器217可以發起該類型的概況設置,通過該概況設置外部伺服器可以用於這樣的數據記錄目的,並且設備上的計量器217將主動地完成以下兩項中的至少一個:

1.通過使用定製的概況設置或通訊中隱藏的鑑別性特徵,鑑定和識別用戶以促進識別小組成員或設備,並且使得其與設備上的計量器本身正直接採集的數據相當/有關係。

2.通過使用一些同步或隱藏的跟蹤或者積極的超文本傳輸協議數據包傳輸來匹配時間戳,以產生一個過程,通過該過程可以完美地匹配設備上的計量數據的時間戳和在外部伺服器處採集的數據的時間戳(這涉及創建在設備上與外部伺服器的記錄之間的所謂偏移值)。

計量器217的一個另外的特徵是所謂的情景數據處理器,該處理器被配置成將情景信息增加到任何記錄的活動,不管記錄的活動發生在研究計量器本身中還是在單獨的伺服器中。該情景處理器可以被配置成將位置信息、設備性能信息和/或屏幕狀態信息增加到任何測量。該特徵的一個實用目的是將關於用戶活動和屏幕狀態的信息增加到從外部(許多是虛擬的)伺服器(像虛擬專用網絡或代理伺服器)採集的數據。因此,在任何設備中,積極的使用通訊可以與背景通訊活動分離,積極的使用意味著屏幕打開並且用戶正在積極用設備做事情。

為不同事件記錄的信息量取決於被記錄的事件的性質。採集的事件可以與應用程式使用、網際網路頁面請求、發出的語音呼叫等相關。

在其原始形式中,由計量器217採集的數據將是非常細粒度的並且可以包含成千上萬的網站、行動應用程式、作業系統、用戶代理和行動裝置。在數據產生過程和數據交付過程中該數據的顆粒性產生了兩個獨立的問題:

●數據粒度配準。對數據產生過程重要的數據(即,結構研究數據、應用程式商店數據、超文本傳輸協議數據)是在與計量器217採集的數據的不同的粒度水平下採集的。為了計算和應用從這些部件得到的比例/比率因素,必須對高度顆粒化的數據分類,以使其與較小粒度的數據源配準。

●客戶體驗。為了客戶交付物可導航且可讀,客戶提供有瀏覽和搜索他們感興趣的特定實體(即,網站、行動應用程式、作業系統、用戶代理、行動裝置)的能力是很重要的。雖然搜索體驗可以支持高度顆粒化的數據,但是對交付物等的瀏覽經驗不能經由系統用戶界面支持高度顆粒化的數據:將不可能在顆粒水平下包含的成千上萬的實體中發現特定的實體。

高效地解決全部這些問題的一種可行方法是開發用於管理元數據214的系統。存在於元數據管理系統內的元數據將在數據生成過程期間被使用並且將對生成最終交付的數據集至關重要。

前述元數據214被用於分類/組織如下實體,所述實體在例如研究計量日誌文件、應用程式商店數據212、大體上的統計數據211和/或結構研究數據208內可觀察到。因為在此描述的框架包含各種概念實體,該框架應當同時支持多義本體方案。通常,這些方案可以被分成兩個不同的類別:

●單義方案。包含在單義方案下的實體具有一個規範(canonical)分類方法。它們的層次由例如管理和更新系統和相關邏輯的系統工作人員規範地限定。

●多義方案。指定到多義方案的實體將具有多個規範組織方法。根據他們特定的商業需求,不同受眾的客戶端將可能具有不同的實體分類方法。根據由工作人員限定的編輯規則,每個多義方案應該是它們自己的組織方法並且應當被視為規範的。

因為由在此描述的框架測量的許多實體本質上是多義的,這意味著將有多個不同的規範方案,本發明描述的系統根據所述規範方案公布其數據。

參考圖9,這些方案中的每個可以從如圖中表明的一個或多個源得到。分類編輯器902可以包括例如實現整個方法的實體。可以將由系統工作人員使用例如客戶建立的元數據管理系統開發和維護的一個或多個方案假設為「默認」規範方案。此外,考慮到例如在應用程式商店可用的應用程式通常已經被它們的開發者/應用程式商店本身分類的事實,例如應用程式商店914和技術供應者920可以提供分類方案。可以建立系統分類906。然而,例如所提供的報告工具的終端用戶可以限定他們自己的分類和類別912,然後通過應用所述分類和類別將數據呈現給他們。

通常,在本發明的情況下,提供期望主題的可靠的、客觀的交付物進一步需要驗證小組數據並且利用可用的手段校準該數據。

因此,優選地自動地在接收到小組數據時,系統被配置成預處理該數據。特別地,可以採取以下步驟:

●驗證小組成員:使用可用於涉及的小組216、218的驗證規則來驗證小組成員。驗證之後,已經被標記為有效的這些小組成員(即,來自小組成員的數據)可以經歷進一步的預處理步驟。

●計算度量和/或數據重組。為了加速計算交付物,來自驗證的小組成員的原始日誌被處理,以確定預定的度量和/或將數據組織到有助於進一步分析的結構中。

●關聯元數據。在計算原始數據的必要的度量/重組的同時,記錄與相應的元數據條目關聯。

預處理小組數據之後,可以使用數據諸如統計級數據211和/或從樣本得到的分層數據(可選地結構研究208)來執行校準動作。

校準過程可能是並且通常是半手動或半自動化的過程,潛在地需要例如分析員來計算各種值、將所述值輸入到分析系統中、運行計算過程、分析結果並且在需要的時候重複該過程。

概念性地,校準過程可以包括以下階段:數據複查(review)、控制值計算以及應用一個或多個處理算法諸如搜索算法,以基於建立的控制值為用戶級數據確定恰當的校準加權值。

圖10僅通過總體實施例的方式例示了樣本複查程序的一個實施方案,該樣本複查程序用於校準變量和類別選擇以使得能夠控制值確定。本領域技術人員應理解的是他/她可以調整例如例示的程序,或利用替代的程序,以更好地實現由本發明的每個真實生活使用場景所設置的設計目的。

實際上,可以分析可獲得的樣本數據1002,並且可以確定例如以下標示:

●類別頻率1004,用於校準變量的在驗證的小組成員之中的個人類別頻率(例如,作為總的未加權的樣本中性別為男的百分比)。

●名義總數/方法1006,名義的校準變量的總數值(即,總的行動應用程式下載)和名義的校準變量的平均值。

●類別情況計數1008,用於全部校準變量的在驗證的小組成員之中的每個類別中的未加權的實例數(例如,具有性別:男的實例數目)。

基於以上計算,選擇的類別可能被縮減(在預定閾值下的頻率/計數)以增強例如校準的穩定性。校準變量和類別的優化的集合將被形成1010。

最後,系統被配置成基於這些校準變量和類別通過利用可獲得的統計級數據211和例如由結構研究208提供的數據來計算控制值1012。

校對之後,交付物可以進一步經歷一系列選擇的質量控制檢查。在更新結構研究校準數據之後,可以例如按月仔細地實施該質量控制過程。在質量控制程序期間,可以使用如由技術人員理解的任何適合的方法檢查數據穩定性和精確度二者。

最終,可以將交付物存儲在至少一個數據存儲庫諸如在系統後端上的資料庫,並且可以授權客戶經由系統用戶界面訪問特定的數據項目。

特別地,可以經由基於網絡的界面將數據發送到訂閱客戶。該基於網絡的界面可以符合以下特徵中的一個或多個:

●與主流瀏覽器(即,MSIE、火狐(Firefox)、Chrome、Safari)兼容。

●通過加密套接字協議層(SSL)發送。

●所有客戶之間相似的功能/外觀和感覺(即,客戶組之間的可用的數據/內容可能不同,但工具保持相同)。

以上,詳細地討論了本發明的各種實施方案。這些實施方案總體上涉及行動裝置和網際網路設備以及連接到無線或有線通信網絡的其他類似的設備,並且示出了通常可以如何利用可用的移動和網際網路設備以自動地和被動地收集關於終端背景的數據(諸如網絡或設備參數或性能)或者關於與該特定設備或其他環境設備或網絡的使用相關的用戶行為的數據,以及最終如何基於採集的數據將所有該數據注入到創建緩存的或實時分析和不同類型的派生信息的系統中,並且可以將該數據與從其他設備得到的數據或與其他人相關的數據組合,並且最終通過各種應用程式將確立的數據呈現回用戶或其他接收者。

然而,本領域技術人員將認識到範圍不限制於明確公開的實施方案,而是還覆蓋落在權利要求措辭下的其他實現方式。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀