新四季網

信息相關性分析方法和裝置的製作方法

2023-07-20 05:15:31 3

專利名稱:信息相關性分析方法和裝置的製作方法
技術領域:
本發明涉及通信技術領域,特別涉及一種信息相關性分析方法和裝置。
背景技術:
隨著網際網路技術的發展,網絡作為ー種新興媒體成為廣告發布的新平臺。與傳統媒體發布廣告相比,網絡廣告具有高針對性,傳播速度快等優點。在搜尋引擎廣告的投放過程中,可以根據來訪者的檢索意圖,具有針對性的進行廣告投放,在一定程度上保證了廣告的到達率。為了使網絡廣告能夠按照來訪者的檢索意圖更加準確的投放,各網際網路公司會對自有的搜尋引擎廣告投放系統進行廣告相關性分析。
現有技術中各網際網路公司對自有搜尋引擎廣告投放系統的廣告相關性分析,一般採用的是從檢索日誌中隨機抽取一部分用戶曾經進行檢索的檢索串,然後到自有的搜尋引擎中檢索抽取的檢索串,查看所展示的廣告與用戶的檢索意圖是否相一致。最後根據這些抽樣的廣告相關性作為自有搜尋引擎廣告投放系統的廣告相關性。現有技術中在廣告相關性分析費用有限制的情況下,採用隨機抽取用於檢驗廣告相關性的樣本,這種方法抽取的樣本與總體分布有可能不一致,使得抽樣的誤差較大,因此増大了誤差的方差,最終得到的廣告相關性分析指標也不一定能代表總體的相關性。若使隨機抽取的樣本儘可能的與總體分布一致,達到減少誤差的目的,則要增大樣本容量,因此會增加廣告相關性的分析費用。

發明內容
為了解決現有技術中用於分析的抽樣樣本誤差大,無法代表總體分布情況的問題,本發明實施例提供了一種信息相關性分析方法和裝置。所述技術方案如下本發明實施例提出了一種信息相關性分析方法,包括根據預設條件對檢索串進行分層;根據分層後的檢索串獲取用於分析的抽樣檢索串;獲取所述用於分析的抽樣檢索串對應的數據;根據所述獲取的數據對信息相關性進行分析。作為上述技術方案的優選,所述根據預設條件對所有的檢索串進行分層,具體包括
將檢索串的詞頻、串長作為預設條件對檢索串進行分層。作為上述技術方案的優選,所述根據分層後的檢索串獲取用於分析的抽樣檢索串,具體包括根據歷史數據計算用於分析的抽樣檢索串總容量;按照所述抽樣檢索串總容量,採用奈曼分配分別計算每個分層的抽樣檢索串容量;按照所述每個分層的抽樣容量,隨機抽取抽樣檢索串。
作為上述技術方案的優選,所述根據歷史數據計算用於分析的抽樣檢索串總容量,具體包括根據分層後每層中包含傳統的隨機抽樣分析方式獲得的檢索串度量指標來計算每層的方差;根據每層的方差計算用於分析的抽樣檢索串總容量。本發明實施例還提出了一種信息相關性分析裝置,包括分層模塊,用於根據預設條件對所有的檢索串進行分層;第一獲取模塊,用於根據分層後的檢索串獲取用於分析的抽樣檢索串;第二獲取模塊,用於獲取所述用於分析的抽樣檢索串對應的數據;分析模塊,用於根據所述獲取的數據對信息相關性進行分析。作為上述技術方案的優選,所述分層模塊具體包括按照檢索串的詞頻、串長作為預設條件進行分層。作為上述技術方案的優選,所述第一獲取模塊包括第一計算單元,用於根據歷史數據計算用於分析的抽樣檢索串總容量;第二計算單元,用於按照所述抽樣檢索串總容量,採用奈曼分配分別計算每個分層的抽樣檢索串容量;抽取單元,用於按照所述每個分層的抽樣容量,隨機抽取抽樣檢索串。作為上述技術方案的優選,所述第一計算單元包括第一計算子単元,用於根據分層後每層中包含傳統的隨機抽樣分析方式獲得的檢索串度量指標來計算每層的方差;第二計算子単元,用於根據每層的方差計算用於分析的抽樣檢索串總容量。本發明實施例提供的技術方案的有益效果是通過根據預設條件對所有的檢索串進行分層,根據分層後的檢索串獲取用於分析的抽樣檢索串,獲取所述用於分析的抽樣檢索串對應的數據,根據所述獲取的數據對信息相關性進行分析。實現了通過分層抽樣増大層間方差,降低增內方差的方式,降低了抽樣檢索串的誤差,使得抽取的檢索串可以與總體分布大致一致,最終得到的分析指標也可以代表總體的相關性,達到了從抽樣看總體的目的。


為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖I是為本發明實施例I提供的信息相關性分析方法流程示意圖;圖2是為本發明實施例2提供的信息相關性分析方法流程示意圖;圖3是為本發明實施例3提供的信息相關性分析裝置結構示意圖;
圖4是為本發明實施例4提供的信息相關性分析裝置結構示意圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明實施方式作進ー步地詳細描述。實施例I本發明第一實施例提出了一種信息相關性分析方法,其流程如圖I所示,包括步驟101 :根據預設條件對檢索串進行分層;步驟102 :根據分層後的檢索串獲取用於分析的抽樣檢索串;步驟103 :獲取所述用於分析的抽樣檢索串對應的數據;步驟104 :根據所述獲取的數據對信息相關性進行分析。
本發明實施例提供的技術方案的有益效果是通過根據預設條件對所有的檢索串進行分層,根據分層後的檢索串獲取用於分析的抽樣檢索串,獲取所述用於分析的抽樣檢索串對應的數據,根據所述獲取的數據對信息相關性進行分析。實現了通過分層抽樣増大層間方差,降低增內方差的方式,降低了抽樣檢索串的誤差,使得抽取的檢索串可以與總體分布大致一致,最終得到的分析指標也可以代表總體的相關性,達到了從抽樣看總體的目的。實施例2本發明第二實施例是在第一實施例的基礎上改進而來,其流程如圖2所示,包括步驟201 :預先制定對抽樣的信息進行相關性分析的評分標準。具體的,按照抽樣檢索串與對應檢索到的數據的一致性和信息滿足用戶需求的程度預先制定相關性分析的評分標準,評分的梯度分別為很好(4分)、好(3分)、可接受(2分)、一般(I分)、不好(0分)。對每條數據的評分作為信息相關性的水準。在對信息相關性進行評分的時候,若遇到模稜兩可的情況,統ー採用就低原則進行評分。步驟202 :預先制定用於信息相關度分析的度量指標。具體的,根據評價信息相關性的目的,制定不同的信息相關性分析的度量指標。在進行信息相關性分析吋,可根據每次分析的目的,使用相應的度量指標作為本次分析使用何種標誌值的依據。一般有如下兩種分析目的a.用於分析衡量信息的相關性程度的目的,制定整體指標為信息相關性的平均得分AVG,這個分數是對每一條檢索串,和與其對應的數據進行評分後所計算到的ー個平均值,這個平均值就是進行信息相關性程度分析的標誌值。算法為AVG =所有信息相關性評分之和/分析的信息個數b.用於分析衡量相關性不好的信息數量和佔比統計的目的。「相關性不好」下文中統稱為「Badcase」 (缺陷)。這個衡量Badcase的指標如表I :
統計指標指標含乂
Badcase信息數人工評分為0的信息數
權利要求
1.一種信息相關性分析方法,其特徵在於,所述方法包括 根據預設條件對檢索串進行分層; 根據分層後的檢索串獲取用於分析的抽樣檢索串; 獲取所述用於分析的抽樣檢索串對應的數據; 根據所述獲取的數據對信息相關性進行分析。
2.根據權利要求I所述的ー種信息相關性分析方法,其特徵在於,所述根據預設條件對所有的檢索串進行分層,具體包括 將檢索串的詞頻、串長作為預設條件對檢索串進行分層。
3.根據權利要求I所述的ー種信息相關性分析方法,其特徵在於,所述根據分層後的檢索串獲取用於分析的抽樣檢索串,具體包括 根據歷史數據計算用於分析的抽樣檢索串總容量; 按照所述抽樣檢索串總容量,採用奈曼分配分別計算每個分層的抽樣檢索串容量; 按照所述每個分層的抽樣容量,隨機抽取抽樣檢索串。
4.根據權利要求3所述的ー種信息相關性分析方法,其特徵在於,所述根據歷史數據計算用於分析的抽樣檢索串總容量,具體包括 根據分層後每層中包含傳統的隨機抽樣分析方式獲得的檢索串度量指標來計算每層的方差; 根據每層的方差計算用於分析的抽樣檢索串總容量。
5.一種信息相關性分析裝置,其特徵在於,所述裝置包括 分層模塊,用於根據預設條件對檢索串進行分層; 第一獲取模塊,用於根據分層後的檢索串獲取用於分析的抽樣檢索串; 第二獲取模塊,用於獲取所述用於分析的抽樣檢索串對應的數據; 分析模塊,用於根據所述獲取的數據對信息相關性進行分析。
6.根據權利要求5所述的ー種信息相關性分析裝置,其特徵在幹,所述分層模塊具體包括 將檢索串的詞頻、串長作為預設條件對檢索串進行分層。
7.根據權利要求5所述的ー種信息相關性分析裝置,其特徵在幹,所述第一獲取模塊包括 第一計算單元,用於根據歷史數據計算用於分析的抽樣檢索串總容量; 第二計算單元,用於按照所述抽樣檢索串總容量,採用奈曼分配分別計算每個分層的抽樣檢索串容量; 抽取單元,用於按照所述每個分層的抽樣容量,隨機抽取抽樣檢索串。
8.根據權利要求7所述的ー種信息相關性分析裝置,其特徵在幹,所述第一計算單元包括 第一計算子単元,用於根據分層後每層中包含傳統的隨機抽樣分析方式獲得的檢索串度量指標來計算每層的方差; 第二計算子単元,用於根據每層的方差計算用於分析的抽樣檢索串總容量。
全文摘要
本發明提出了一種信息相關性分析方法和裝置,屬於通信技術領域。本發明的方法包括根據預設條件對所有的檢索串進行分層;根據分層後的檢索串獲取用於分析的抽樣檢索串;獲取所述用於分析的抽樣檢索串對應的數據;根據所述獲取的數據對信息相關性進行分析。本發明的裝置包括分層模塊、第一獲取模塊、第二獲取模塊、分析模塊。本發明實施例通過上述方案實現了通過分層抽樣增大層間方差,降低增內方差的方式,降低了抽樣檢索串的誤差,使得抽取的檢索串可以與總體分布大致一致,最終得到的分析指標也可以代表總體的相關性,達到了從抽樣看總體的目的。
文檔編號G06F17/30GK102654862SQ201110049339
公開日2012年9月5日 申請日期2011年3月1日 優先權日2011年3月1日
發明者朱建朋, 李佳 申請人:騰訊科技(深圳)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀